牛客894147927号
牛客894147927号
全部文章
分类
SQL(4)
学习日记(3)
机器学习(7)
归档
标签
去牛客网
登录
/
注册
Five O.One
全部文章
(共16篇)
SQL42 分析客户逾期情况
题目描述 请根据以上数据分析各还款能力级别的客户逾期情况,按照还款能力级别统计有逾期行为客户占比。要求输出还款能力级别、逾期客户占比。 注:逾期客户占比要求按照百分数形式输出并四舍五入保留 1 位小数,最终结果按照占比降序排序。 数据表结构 有贷款信息表:loan_tb (agreement_i...
Mysql
2026-02-12
0
42
SQL41 最长连续登录天数
问题描述 你正在搭建一个用户活跃度的画像,其中一个与活跃度相关的特征是“最长连续登录天数”, 请用SQL实现“2023年1月1日-2023年1月31日用户最长的连续登录天数” 数据表结构 登陆表 tb_dau: fdate user_id 2023-01-01 10000 备...
Mysql
2026-02-12
0
59
SQL40 每个月Top3的周杰伦歌曲
题目描述 从听歌流水中找到18-25岁用户在2022年每个月播放次数top 3的周杰伦的歌曲。 排名先后由两者的song_id先后顺序决定 数据表结构 流水表 play_log: 日期 (fdate) 用户 ID (user_id) 歌曲 ID (song_id) 2022-01-...
Mysql
2026-02-12
0
51
SQL40 电话号码格式校验
题目描述 在一张contacts表中,存储了用户的联系信息。请查询出所有符合以下条件的电话号码,并按id升序输出所有字段: 电话号码必须是 10 位数字。 电话号码的第一位不能以 0 开头。 * 电话号码的格式可以是连续的 10 位数字,或以-分隔的格式(如123-456-7890) 解题思路 ...
Mysql
2026-02-11
0
39
机器学习--随机森林
一、集成算法 1.概述 集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影,在现实中集成学习也有相当大的作用,它可以用来做市场营销模拟的...
2022-03-25
0
597
机器学习-模型评估与选择(4)
4.4 Friedman检验与Nemenyi后续检验 交叉验证t检验和McNemar检验都是在一个数据集上比较两个算法的性能,而很多时候,会在一组数据集上对多个算法进行比较。当有多个算法参与比较时,一种做法是在每个数据集上分别列出两两比较的结果,而在两两比较时可使用前述方法;另一种使用基于算法排序...
2022-03-24
0
616
机器学习--决策树(Decision Tree)
决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种集成算法,在各个行业和领域都有广泛的应用...
2022-03-21
0
858
机器学习-模型评估与选择(3)
3.4 代价敏感错误率与代价曲线 为权衡不同类型错误所造成的不同损失,可为错误赋予"非均等代价" 以二分类任务为例,可根据任务的领域知识设定一个"代价矩阵"(cost matrix).如下表所示,其中,costijcost_{ij}costij表示将第iii类样本预测为第jjj类样本的代价。...
2022-03-20
0
617
机器学习-模型评估与选择(2)
三、性能度量(performance measure) 衡量模型泛化能力的评价标准 反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果;这意味着模型的"好坏"是相对的,什么样的模型是好的,不仅取决于算法和数据,还取决于任务需求 在预测任务中,给定样例集D=...
2022-03-20
0
382
机器学习-模型评估与选择(1)
一、经验误差与过拟合 错误率与精度 错误率(error rate):分类错误的样本数占样本总数的比例,即如果在mmm个样本中有aaa个样本分类错误,则错误率为E=amE = \frac {a}{m}E=ma 精度(accuracy):1−am1-\frac {a}{m}1−ma,即精度=...
2022-03-17
0
513
首页
上一页
1
2
下一页
末页