牛客894147927号

分类

SQL(4) 学习日记(3) 机器学习(7)

/ 注册

全部文章（共16篇）

SQL42 分析客户逾期情况

题目描述请根据以上数据分析各还款能力级别的客户逾期情况，按照还款能力级别统计有逾期行为客户占比。要求输出还款能力级别、逾期客户占比。注：逾期客户占比要求按照百分数形式输出并四舍五入保留 1 位小数，最终结果按照占比降序排序。数据表结构有贷款信息表：loan_tb （agreement_i...

Mysql

2026-02-12

0 70

SQL41 最长连续登录天数

问题描述你正在搭建一个用户活跃度的画像，其中一个与活跃度相关的特征是“最长连续登录天数”，请用SQL实现“2023年1月1日-2023年1月31日用户最长的连续登录天数” 数据表结构登陆表 tb_dau： fdate user_id 2023-01-01 10000 备...

Mysql

2026-02-12

0 87

SQL40 每个月Top3的周杰伦歌曲

题目描述从听歌流水中找到18-25岁用户在2022年每个月播放次数top 3的周杰伦的歌曲。排名先后由两者的song_id先后顺序决定数据表结构流水表 play_log: 日期 (fdate) 用户 ID (user_id) 歌曲 ID (song_id) 2022-01-...

Mysql

2026-02-12

0 67

SQL40 电话号码格式校验

题目描述在一张contacts表中，存储了用户的联系信息。请查询出所有符合以下条件的电话号码，并按id升序输出所有字段：电话号码必须是 10 位数字。电话号码的第一位不能以 0 开头。 * 电话号码的格式可以是连续的 10 位数字，或以-分隔的格式（如123-456-7890）解题思路 ...

Mysql

2026-02-11

0 50

机器学习--随机森林

一、集成算法 1.概述集成学习（ensemble learning）是时下非常流行的机器学习算法，它本身不是一个单独的机器学习算法，而是通过在数据上构建多个模型，集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影，在现实中集成学习也有相当大的作用，它可以用来做市场营销模拟的...

2022-03-25

0 608

机器学习-模型评估与选择(4)

4.4 Friedman检验与Nemenyi后续检验交叉验证t检验和McNemar检验都是在一个数据集上比较两个算法的性能，而很多时候，会在一组数据集上对多个算法进行比较。当有多个算法参与比较时，一种做法是在每个数据集上分别列出两两比较的结果，而在两两比较时可使用前述方法；另一种使用基于算法排序...

2022-03-24

0 626

机器学习--决策树(Decision Tree)

决策树（Decision Tree）是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题。决策树算法容易理解，适用各种数据，在解决各种问题时都有良好表现，尤其是以树模型为核心的各种集成算法，在各个行业和领域都有广泛的应用...

2022-03-21

0 868

机器学习-模型评估与选择(3)

3.4 代价敏感错误率与代价曲线为权衡不同类型错误所造成的不同损失，可为错误赋予"非均等代价" 以二分类任务为例，可根据任务的领域知识设定一个"代价矩阵"(cost matrix).如下表所示，其中，costijcost_{ij}costij表示将第iii类样本预测为第jjj类样本的代价。...

2022-03-20

0 629

机器学习-模型评估与选择(2)

三、性能度量(performance measure) 衡量模型泛化能力的评价标准反映了任务需求，在对比不同模型的能力时，使用不同的性能度量往往会导致不同的评判结果；这意味着模型的"好坏"是相对的，什么样的模型是好的，不仅取决于算法和数据，还取决于任务需求在预测任务中，给定样例集D=...

2022-03-20

0 390

机器学习-模型评估与选择(1)

一、经验误差与过拟合错误率与精度错误率(error rate)：分类错误的样本数占样本总数的比例，即如果在mmm个样本中有aaa个样本分类错误，则错误率为E=amE = \frac {a}{m}E=ma 精度(accuracy)：1−am1-\frac {a}{m}1−ma，即精度=...

2022-03-17

0 518