小小
小小
全部文章
分类
未归档(9)
题解(15)
归档
标签
去牛客网
登录
/
注册
标题1
介绍2
全部文章
(共10篇)
题解 | #信用评分模型优化#
核心概念 特征选择:识别对目标变量预测最有价值的特征 决策树算法: 通过递归划分数据构建树形结构 使用基尼不纯度或信息增益选择最佳划分特征 特征重要性 = 该特征减少的不纯度 × 覆盖样本比例 标签编码:将分类变量(如"Yes/No")转换为数值 解题思路 数据预处理...
2025-06-16
0
10
题解 | #多元高斯分布的概率密度函数计算#
核心概念 多元高斯分布: 维随机向量的概率分布,由均值向量 和协方差矩阵 定义,概率密度函数为: 其中: : 维数据点向量 : 维均值向量 : 协方差矩阵 :协方差矩阵的行列式 解题思路 参数提取:从输入字典获取数据点、均值向量和协方差矩阵 概率计算:使用 scipy.stats.mul...
2025-06-16
0
14
题解 | #基于卡方检验的特征选择实现#
核心概念 卡方检验:衡量特征(词汇)与类别(情感)独立性的统计方法,计算公式: 其中: :包含该词且正面的文档数 :包含该词且负面的文档数 :不包含该词且正面的文档数 :不包含该词且负面的文档数 :总文档数() 统计意义: 值越大,特征与类别相关性越强 表示特征与类别独立 解题思路 ...
2025-06-16
0
10
题解 | #高斯混合模型(GMM)在聚类分析中的应用#
核心概念 高斯混合模型: :混合系数(第 k 个高斯成分的权重) :均值向量 :协方差矩阵 EM 算法: E 步骤:计算后验概率(责任度) M 步骤:更新模型参数 解题思路 数据读取:获取数据点数量 和二维坐标 参数初始化: 混合系数 均等初始化 均值 随机选择...
2025-06-16
0
13
题解 | #基于相关性分析的特征选择实现#
解题思路 数据读取:获取样本数量 和特征数量 构建数据集:分离特征矩阵和目标值向量 相关系数计算:对每个特征计算与目标值的皮尔逊相关系数 结果排序:按相关系数绝对值降序排序(绝对值相同按索引升序) 格式化输出:输出所有特征索引和相关系数(保留4位小数) 代码解析 import sys imp...
2025-06-16
0
9
题解 | #电商活动排序#
解题思路 计算整个数据集的信息熵 对每个特征: 计算条件熵(按特征取值划分子集) 计算特征固有值(属性熵) 计算信息增益比 选择信息增益比最大的特征 代码解析 import sys from math import log def calcInfoEnt(data): "...
2025-06-16
0
12
题解 | #信用评分模型优化#
解题思路 计算数据集的信息熵:统计信用评分结果中"良好"和"不良"的比例,计算整个数据集的不确定性。 计算每个特征的信息增益比: 对每个特征,统计其不同取值 计算按该特征划分后各子集的信息熵 计算信息增益和分裂信息 得到信息增益比 选择最佳特征:比较所...
2025-06-16
0
11
题解 | #图像处理中的卷积操作实现#
题解:图像卷积操作 题目概述 本题要求实现灰度图像的卷积操作。给定一个 m×n 的灰度图像矩阵和一个 k×k 的卷积核(k 为奇数),程序需要对图像进行卷积操作,边缘使用零填充(Zero Padding),并输出卷积结果(保留两位小数)。 核心概念 卷积操作:将卷积核在图像上滑动,计算每个位置覆盖...
2025-06-16
0
10
66.前端-业务场景4
5. 关于样式规范统一化的实现 参考答案: css 指层叠样式表 (Cascading Style Sheets),定义如何显示 html 元素,但由于 css 天生全局性,随着项目复杂度增加,极易出现样式覆盖以及其它的问题。 通用规范 文件编码 为了避免内容乱码,统一使用 UTF-8 编码保...
2021-03-01
0
609
牛客出题文档须知
题目内容 题目不得违反国家政策与法律法规,不得出现敏感信息,不得出现强特征的个人、团体、机构等名称。 关于原题 原题大致可分为完全一致、几乎一致和做法一致三种。 完全一致:使用一题的AC代码可以AC另一题 几乎一致:由一题的 AC 代码改动至另一题的 AC 代码可以由一个不会该题的人完成。 做法一...
2020-07-13
1
3834