Jaccard指数是一种衡量分类模型性能的指标,其计算公式为:
其中,TP是真阳性,FP是假阳性,FN是假阴性。 TP = True Positives (真正例): 正确预测为正类的样本数量 FP = False Positives (假阳性): 错误预测为正类的负类样本数量 FN = False Negatives (假阴性): 错误预测为负类的正类样本数量
标准代码如下
def jaccard_index(y_true, y_pred):
intersection = np.sum((y_true == 1) & (y_pred == 1))
union = np.sum((y_true == 1) | (y_pred == 1))
result = intersection / union
if np.isnan(result):
return 0.0
return round(result, 3)
在sklearn库中也有对应的计算方法,可以使用metrics模块中的jaccard_score函数:
def jaccard_index(y_true, y_pred):
from sklearn.metrics import jaccard_score
jaccard = jaccard_score(y_true, y_pred)
return round(float(jaccard), 3)