过好每一秒
过好每一秒
全部文章
机器学习
Django系列(4)
java那点事(1)
LeetCode一天一题(12)
Linux(5)
PyQt小实例(2)
python-opencv3学习教程(9)
python3爬虫系列(1)
Python那点事(18)
未归档(1)
机器学习算法原理(1)
深度学习(12)
深度学习笔记(1)
自然语言处理(5)
设计模式(10)
归档
标签
去牛客网
登录
/
注册
过好每一秒的博客
希望自己的年龄和熵值成反比....
全部文章
/ 机器学习
(共8篇)
sklearn实现多种机器学习中的集成算法。 包括Adaboost,随机森林,梯度提升回归等算法
求各位进来的老铁帮个忙。。帮我把最后自己写的那个提升算法完善一下。。测试集该怎么测试准确率??? 求大佬补充 from sklearn.datasets import load_iris # 用决策树作为基础模型 from sklearn.tree import DecisionTreeClas...
2020-06-12
0
514
【问题1】:银行卡欺诈问题-----用逻辑回归预测分析
下面就是相关数据,这是一个脱敏数据,经过了一定的处理,我们不需要分析情况处理相关特征。 如果需要做实验,评论留邮箱,发数据。下面是代码部分,具体每一步的作用,代码中已经进行了详细的阐述。 import pandas as pd import numpy as np from sklear...
2020-06-12
0
703
【问题3】:Kaggle练习题《房价预测》----分别采用的岭回归,随机森林,bagging模型,AdaBoost,XgBoost等。
第一步:导入基本的模块, 并且加载数据。 import pandas as pd import numpy as np import matplotlib.pyplot as plt # index_col=0 将第0列作为行索引 train_df = pd.read_csv('data/h...
2020-06-12
0
1441
【问题4】:kaggle练习题《自行车租赁业务预测》--带数据分析,用了随机森林,支持向量机,岭回归等
数据来源:https://www.kaggle.com/c/bike-sharing-demand 第一步:读取数据 并对数据进行分析 import numpy as np import pandas as pd df_train = pd.read_csv('data/kaggle_...
2020-06-12
0
989
【问题5】:《估算收入阶层》采用美国人口普查的数据--用了贝叶斯和随机森林,难点在数据读取
背景介绍: 本节将根据14个属性建立分类器评估一个收入阶层,高于‘50k’的为一个阶层,低于‘50k’的为一个阶层。主要是数据的读取有点难,数据放在txt文件中,并且标签是字符串。。我最后的准确率并不是很高,大家可以调调参,或者对数据在进行处理。。数据下载地址:https://a...
2020-06-12
0
587
机器学习中当样本不均衡时(数据出现严重倾斜),我们怎么处理呢? 给出两种方法
主要讲以下两种方法: 方法一:当数据出现严重倾斜的时候,我们可以采取降采样的方式 方法二:在训练模型中添加参数class_weight='balanced' 下面给个实际的例子: 第一步:读数据 (我们把数据放在了txt中) def read_data(path): ...
2020-06-12
0
905
【问题6】:《汽车数据分析》--采用随机森林算法并画出最终的验证曲线和学习曲线
背景介绍: 我们采用的数据是:根据汽车的多种细节,如:车门数量,后备箱大小,维修成本等,来确定汽车质量。 最后的分类目的是把车辆的质量分为4中类型,不达标,达标,良好,优秀。点击:数据集下载 第一步:读取数据 我们的数据存放在一个txt文件中。 def...
2020-06-12
0
820
【问题7】:《人脸识别实战》--采用的是SVM,数据集小,直接用sklearn做的
本次我们实战人脸识别。。采用的数据集下载:点我下载数据集 第一步:先导入我们本次实验所需要的全部模型 import time import logging from sklearn.datasets import fetch_olivetti_faces import numpy as np ...
2020-06-12
0
1468