牛客题解官

分类

题解(475)

/ 注册

TA的专栏 74篇文章 13人订阅

牛客代码笔记-牛栋

74篇文章 358人学习

全部文章（共788篇）

题解|实现一组类别的基尼不纯度计算

基尼不纯度是一种衡量分类模型性能的指标，常用于决策树的剪枝。其计算公式为：其中，是每个类别的概率。标准代码如下 def gini_impurity(y: list[int]) -> float: classes = set(y) n = len(y) gini_...

2025-02-05

0 67

题解|实现二分类的F-Score

F-Score是一种衡量分类模型性能的指标，常用于二分类问题。其计算公式为：其中，Precision是精确率，Recall是召回率，是权重因子。 Precision是预测为正的样本中实际为正的比例，Recall是实际为正的样本中预测为正的比例。标准代码如下 def f_score(y_true...

2025-02-05

0 125

题解|实现二元分类中的召回率指标

召回率（Recall）是衡量二元分类模型在正样本上的表现指标，其计算公式为：其中，是真正例，是假反例。本题的一个小难点是对0的判断，不进行特判会导致除0错误。标准代码如下 def recall(y_true, y_pred): tp = np.sum((y_true == 1) &a...

2025-02-05

0 44

题解|计算精确率

精确率（Precision）是衡量二元分类模型在正样本上的表现指标，其计算公式为：其中，是真正例，是假正例。标准代码如下 def precision(y_true, y_pred): true_positives = np.sum((y_true == 1) & (y_pred...

2025-02-05

0 39

题解|线性核函数

线性核函数（Linear Kernel）是一种常用的核函数，其计算公式为：其中，和是两个向量。该算法的本质是计算两个向量的内积。标准代码如下 def kernel_function(x1, x2): return np.inner(x1, x2)

2025-02-05

0 52

题解|实现岭回归损失函数

岭回归损失函数（Ridge Regression Loss）是一种常用的损失函数，其计算公式为：其中，是模型参数，是输入特征，是输出标签，是正则化参数。该回归函数又称为L2正则化损失函数。标准代码如下 def ridge_loss(X, w, y_true, alpha): loss...

2025-02-05

0 63

题解|计算准确度分数

准确度分数（Accuracy Score）是一种常用的评估指标，常见于分类问题中，用于衡量分类器的准确性，其计算公式为：其中，是真正例，是真反例，是假正例，是假反例。标准代码如下 def accuracy_score(y_true, y_pred): accuracy = np.sum...

2025-02-05

0 54

题解|实现One-Hot编码

One-Hot编码（One-Hot Encoding）是一种常用的编码方法，用于将分类变量转换为数值变量。通俗点说，若变量总共分为类，则One-Hot编码会将变量转换为维的向量，其中只有一维为1，其余维度为0。标准代码如下 def to_categorical(x, n_col=None): ...

2025-02-05

1 74

题解|数据集的批量迭代器

数据集的批量迭代器（Batch Iterator）是一种常用的数据处理方法，用于将数据集分为多个批次，每个批次包含固定数量的数据。本题也是mini-batch梯度下降法的关键步骤，关键思想可以参考梯度下降部分。标准代码如下 def batch_iterator(X, y=None, batch_...

2025-02-05

0 53

题解|数据集随机洗牌

数据集随机洗牌（Shuffle Dataset）是一种常用的数据处理方法，用于将数据集随机打乱。标准代码如下 def shuffle_data(X, y, seed=None): if seed: np.random.seed(seed) idx = np.aran...

2025-02-05

0 50