牛客题解官
牛客题解官
全部文章
分类
题解(475)
归档
标签
去牛客网
登录
/
注册
牛客题解官的博客
TA的专栏
74篇文章
15人订阅
牛客代码笔记-牛栋
74篇文章
384人学习
全部文章
(共788篇)
题解|k近邻算法
k近邻算法是分类算法,通过计算测试样本与训练数据之间的距离,选择距离最小的k个样本作为测试样本的邻居,并根据这些邻居的类别进行投票,最终确定测试样本的类别。 步骤: 计算测试样本与训练数据之间的距离 选择距离最小的k个样本作为测试样本的邻居 根据这些邻居的类别进行投票,最终确定测试样本的类别(采用...
2025-02-05
0
89
题解|主成分分析
主成分分析是一种将高维数据降维的方法,它通过将高维数据投影到低维空间,来保留数据的主要特征。 在本题中,PCA的实现方式是基于特征值分解的,其具体步骤如下: 1. 标准化数据 将输入数据标准化,使得每个特征的均值为0,方差为1。 数学表达式为: 2. 计算协方差矩阵 计算标准化后的数据协方差...
2025-02-05
2
76
题解|交叉验证数据拆分
交叉验证是一种评估机器学习模型性能的方法,它通过将数据集分为训练集和测试集,来评估模型的性能。 其目的在于评估模型在不同数据集上的表现,以确保模型的泛化能力;并且在数据量较少时,可以有效地评估模型的性能。 本题中要求了将数据集分为k折,并且要求了随机种子,但是只需要在采样之前进行一次随机打乱即可。 ...
2025-02-05
0
63
题解|实现 k-Means 聚类算法
k-Means 聚类算法(k-Means Clustering)是一种常用的聚类算法,用于将数据集分为个簇。具体步骤如下: 随机选择个点作为初始聚类中心。 将每个点分配到最近的聚类中心 本题使用欧几里得距离作为距离度量,即 更新聚类中心为每个簇的平均值。 重复步骤2和步骤3,直到聚类中心不再变...
2025-02-05
0
101
题解|检测过拟合或欠拟合
过拟合是指模型在训练数据上表现很好,但在测试数据上表现较差的现象。欠拟合是指模型在训练数据上表现较差,但在测试数据上表现较好的现象。 本题中直接给出了训练数据上的准确率和测试数据上的准确率,所以只需要按照题意进行判断即可。 标准代码如下 def model_fit_quality(training_...
2025-02-05
0
78
题解|生成二元分类的混淆矩阵
混淆矩阵是一种描述分类模型性能的矩阵,其计算公式为: 其中,TP是真阳性,TN是真阴性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 TN = True Negatives (真阴性): 正确预测为负类的样本数量 FP = False...
2025-02-05
0
89
题解|计算分类的DICE得分
DICE得分是一种衡量分类模型性能的指标,具有良好的鲁棒性,其计算公式为: 其中,TP是真阳性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 FP = False Positives (假阳性): 错误预测为正类的负类样本数量 FN ...
2025-02-05
0
157
题解|计算二元分类的Jaccard指数
Jaccard指数是一种衡量分类模型性能的指标,其计算公式为: 其中,TP是真阳性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 FP = False Positives (假阳性): 错误预测为正类的负类样本数量 FN = Fals...
2025-02-05
0
125
题解|计算均方根误差(RMSE)
均方根误差(RMSE)是一种衡量回归模型性能的指标,其计算公式为: 其中, 是真实值, 是预测值。 标准代码如下 def rmse(y_true, y_pred): return round(np.sqrt(np.mean((y_true - y_pred) ** 2)), 3)
2025-02-05
0
118
题解|计算回归分析的R-squared
R-squared是一种衡量回归模型性能的指标,其计算公式为: 其中,SSR是残差平方和,SST是总平方和。 标准代码如下 def r_squared(y_true, y_pred): if np.array_equal(y_true, y_pred): return 1....
2025-02-05
0
75
首页
上一页
20
21
22
23
24
25
26
27
28
29
下一页
末页