牛客题解官
牛客题解官
全部文章
题解
归档
标签
去牛客网
登录
/
注册
牛客题解官的博客
全部文章
/ 题解
(共587篇)
题解|主成分分析
主成分分析是一种将高维数据降维的方法,它通过将高维数据投影到低维空间,来保留数据的主要特征。 在本题中,PCA的实现方式是基于特征值分解的,其具体步骤如下: 1. 标准化数据 将输入数据标准化,使得每个特征的均值为0,方差为1。 数学表达式为: 2. 计算协方差矩阵 计算标准化后的数据协方差...
2025-02-05
0
50
题解|交叉验证数据拆分
交叉验证是一种评估机器学习模型性能的方法,它通过将数据集分为训练集和测试集,来评估模型的性能。 其目的在于评估模型在不同数据集上的表现,以确保模型的泛化能力;并且在数据量较少时,可以有效地评估模型的性能。 本题中要求了将数据集分为k折,并且要求了随机种子,但是只需要在采样之前进行一次随机打乱即可。 ...
2025-02-05
0
39
题解|实现 k-Means 聚类算法
k-Means 聚类算法(k-Means Clustering)是一种常用的聚类算法,用于将数据集分为个簇。具体步骤如下: 随机选择个点作为初始聚类中心。 将每个点分配到最近的聚类中心 本题使用欧几里得距离作为距离度量,即 更新聚类中心为每个簇的平均值。 重复步骤2和步骤3,直到聚类中心不再变...
2025-02-05
0
62
题解|检测过拟合或欠拟合
过拟合是指模型在训练数据上表现很好,但在测试数据上表现较差的现象。欠拟合是指模型在训练数据上表现较差,但在测试数据上表现较好的现象。 本题中直接给出了训练数据上的准确率和测试数据上的准确率,所以只需要按照题意进行判断即可。 标准代码如下 def model_fit_quality(training_...
2025-02-05
0
58
题解|生成二元分类的混淆矩阵
混淆矩阵是一种描述分类模型性能的矩阵,其计算公式为: 其中,TP是真阳性,TN是真阴性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 TN = True Negatives (真阴性): 正确预测为负类的样本数量 FP = False...
2025-02-05
0
56
题解|计算分类的DICE得分
DICE得分是一种衡量分类模型性能的指标,具有良好的鲁棒性,其计算公式为: 其中,TP是真阳性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 FP = False Positives (假阳性): 错误预测为正类的负类样本数量 FN ...
2025-02-05
0
71
题解|计算二元分类的Jaccard指数
Jaccard指数是一种衡量分类模型性能的指标,其计算公式为: 其中,TP是真阳性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 FP = False Positives (假阳性): 错误预测为正类的负类样本数量 FN = Fals...
2025-02-05
0
65
题解|计算均方根误差(RMSE)
均方根误差(RMSE)是一种衡量回归模型性能的指标,其计算公式为: 其中, 是真实值, 是预测值。 标准代码如下 def rmse(y_true, y_pred): return round(np.sqrt(np.mean((y_true - y_pred) ** 2)), 3)
2025-02-05
0
74
题解|计算回归分析的R-squared
R-squared是一种衡量回归模型性能的指标,其计算公式为: 其中,SSR是残差平方和,SST是总平方和。 标准代码如下 def r_squared(y_true, y_pred): if np.array_equal(y_true, y_pred): return 1....
2025-02-05
0
52
题解|实现一组类别的基尼不纯度计算
基尼不纯度是一种衡量分类模型性能的指标,常用于决策树的剪枝。其计算公式为: 其中, 是每个类别的概率。 标准代码如下 def gini_impurity(y: list[int]) -> float: classes = set(y) n = len(y) gini_...
2025-02-05
0
55
首页
上一页
1
2
3
4
5
6
7
8
9
10
下一页
末页