不是江小白
不是江小白
全部文章
机器学习
CSS3(1)
Docker(2)
Git使用(2)
Leetcode题解(7)
MySQL(16)
Python(19)
Python图片识别(2)
小程序(2)
工具安装(11)
数据分析(8)
数据分析思维与实战23讲思维导图(1)
数据分析面试题汇总(4)
重整《数据分析实战45讲》(4)
题解(36)
归档
标签
去牛客网
登录
/
注册
不是江小白的博客
非典型 程序员
全部文章
/ 机器学习
(共10篇)
在Win10上通过Anaconda来安装Tensorflow并在Pycharm中进行开发
之所以会开始想用Tensorflow,是因为之前用常规的验证码破解方法觉得有些繁琐,要把字符都切割成单个再一一识别。于是想有没有方法可以直接一整张图片来识别的,上谷歌一搜就发现还真有!于是打算再尝试用机器学习的方法来破解验证码。废话不多说,首先我们来安装Tensorflow这个框架。 系统:Win...
2020-12-04
1
627
如何解决报错ValueError: Input contains NaN, infinity or a value too large for dtype('float64')的问题
这两天在做信用卡的数据分析项目,出现了除标题错误以外 + ( ValueError: Found input variables with inconsistent numbers of samples: [56411, 27785] ) 这两个报错,因为标题字数有限,所以只写了一个。现在我们先解决...
2020-12-04
0
4924
调用sklearn模型遇到Unknown label type: continuous 的解决办法
调用sklearn模型的时候 报错“Unknown label type: ‘continuous’ “的解决办法 刚刚掌柜在进行模型预测的时候遇到这样的报错: 为什么会这样呢?掌柜搜过类似问题的解法,发现在StackOverflow上面有个解释的很清楚: 原来是因为目标列是真实地数字,不能...
2020-12-04
0
1137
Attribute Error :XGBRegressor object has no attribute XGBReressor的解决办法
刚刚掌柜在进行调参的时候遇到这样的报错: 这就奇怪了,明明刚刚Xgboost还能运行,怎么调参就不行了??? 于是掌柜去搜解决办法,十个有九个都是说因为存在有 xgboost.py命名的文件才导致的。但是掌柜明明才开始用这个,也没建过这样名字的Python文件。但是秉着严谨的精神还是去搜了电脑里面...
2020-12-04
0
1228
如何用sklearn工具包里面的feature_selection模块来进行特征选择/降维(一)
最近在进行一个比赛的时候遇到特征处理的问题,于是就在sklearn官网查了一下,发现有专门的一节来讲关于特征选择的,因此翻译一下主要供自己学习使用,当然如果对你也有帮助,那更好。 sklearn.feature_selection PS:翻译如果觉得有问题,请大佬帮忙纠正!谢谢。 -...
2020-12-04
0
646
双峰偏态数据如何转变为正态分布数据
最近掌柜遇到这样一组数据,它呈现出双峰偏态形状: 大家都知道,在构建模型的时候都尽量要让偏态数据转换为正态分布数据。 所以问题又来了?为什么偏态数据要尽量转换为正态分布数据呢? 因为很多模型假设数据服从正态分布后,它的样本均值和方差就相互独立,这样就能更好的进行统计推断和假设验证。比如熟悉的线性...
2020-12-04
0
2613
如何用sklearn工具包里面的feature_selection模块来进行特征选择/降维(二)
(接上篇) <mark>1.13.3. 递归特征消除</mark> 给定一个对特征进行权重分配的外部评估器(比如线性模型里面的系数),递归特征消除(RFE)***通过递归考虑越来越少的特征集来进行特征选择。首先,在初始化的特征集上面已经训练好的评估器要么通过coef_...
2020-12-04
0
884
使用OneHotEncoder进行类别变量转换的时候出现 Could not convert string to float: ‘b‘ 的解决办法
今天在用OneHotEncoder进行数据预处理阶段的类别变量转换时,突然报错: 咦?怎么回事。。。明明掌柜看官方文档说的是可以对类别(字符串)变量进行转换的: 而且示例也是可以的: 怎么到掌柜这里就不行了???掌柜再三确认自己没有写错代码啊,这是怎么回事? 于是掌柜就左翻右翻各种资料,发现...
2020-12-04
0
1298
记录一次关于 No module named“ xgboost“的排错过程以及另类解决办法
还记得之前掌柜不是刚刚安装了Jupyter notebook来远程访问,解决了本地容易出现Jupyter安装包环境冲突的问题。然后今天运行一个预测模型的时候用到了Xgboost这个,就华丽丽地报错 “没有Xgboost模块包? 于是一查发现,拉取的Datascience-notebook镜像确实没...
2020-12-04
0
2604
TypeError: fit_transform() takes 2 positional arguments but 3 were given的解决办法
今天在用ColumnTransformer方法对数值变量和非数值变量进行合成转换的时候,掌柜选择对其中的类别特征用LabelEncoder()方法,结果出现报错如上👆。但是换成OneHotEncoder(独热编码)就成功运行。 于是疑惑 为什么会出现这样的情况? 一搜发现Stackoverflo...
2020-12-04
0
1389