芒果来了
芒果来了
全部文章
数据挖掘/机器学习
Crawler(1)
CSS和JavaScript(5)
Java(3)
Linux(6)
paper(2)
Python(10)
XML(1)
其他(1)
十分钟系列(2)
导图(1)
阿里云服务器(3)
归档
标签
去牛客网
登录
/
注册
芒果来了的博客
全部文章
/ 数据挖掘/机器学习
(共11篇)
mac 下sklearn grid_search无法启动多线程
如指定n_Jobs为-1(最大),或>1时,无法执行且无任何输出。 gsearch = GridSearchCV(gbm,param_grid=parameters,scoring='accuracy',cv=5,verbose=1,n_jobs=-1) gsearch.fit(x_train...
2018-11-10
0
597
自然语言处理简单应用---预测文章获得的赞同数量
Hacker News(http://news.ycombinator.com/) 是一个国外新闻社区,用户创造的内容质量远远超出其他创业者主题的网站。 数据下载地址:https://github.com/arnauddri/hn 数据集中存储了从HackerNews上爬取的内容,我们的目的是通...
2017-05-16
0
514
机器学习:如何构造一个简单的决策树
数据集下载地址:http://archive.ics.uci.edu/ml/datasets/Adult 在写该算法时遇到一个问题: 构造决策树时,这两段代码虽然都可以成功运行,但是构造的结果却有些不同。 如果用第一种方式遍历每个分支,会导致每次从右侧分支开始遍历,即使把branc_dict调整为...
2017-05-10
0
659
构造多分类器的常用方法
现实中常常遇到多分类的任务,我们可以利用二分类器来解决这种多分类为题,常用的方法由: 一对一 one vs one,ovoSvms, 将n个类别两两配对,产生n(n-1)/2个二分类任务 一对多 ovr 每次将一个类别作为正例,其余作为负例,产生n个二分类任务 多对多 ovo 部分类...
2017-05-09
0
462
机器学习:使用BP网络对数字0至9进行分类
题目为今天算法课程留下的作业,要求使用MATLAB实现,现给出python版本,实验要求如下: 分析一下题目,既然使用BP网络,我们可以在BPNNet的基础上增加多分类器效果,最后通过预...
2017-05-08
0
1027
有趣的机器学习:如何实现一个简单的神经网络
对于一些非线性可分问题,我们需要采取神经网络来解决(本质上还是一个逻辑回归),如下: 我们的目标时找到一个函数,成功分别X、O 激活函数主要由两种: 阶跃函数 sigmoid函数 下面为sigmoid函数 ...
2017-05-05
0
464
机器学习实战之梯度下降算法
一、基本概念 众所周知,在求最优解时常用到两个方法,两者均可用于线性/非线性拟合: 最小二乘法 该方法直接对代价函数求导,目的找出全剧最小,非迭代法 梯度下降法 先给定一个theta,然后向梯度反方向不断调整,若干次迭代后找到cost function的局部最小值。 假设回归函数...
2017-05-05
0
431
聚类算法---如何对NBA控球后卫进行聚类分析?
KMeans-Cluster Cluster the dataset of NBA Player using KMeans method 数据下载地址:https://github.com/huangtaosdt/KMeans-Cluster/tree/master/data 该项目为KMea...
2017-05-04
0
718
有监督学习之交叉验证
在有监督的机器学习算法中,为考察model的generalization ability,我们需要对model进行评估。为防止过拟合,不可以使用训练集数据进行模型评估,此时可以采取cross validation方法:将原始数据分为训练集、测试机 常见cross validation: H...
2017-05-02
0
416
使用决策树ID3算法,预测收入是否大于50k
数据集是在UCI上下载的:http://archive.ics.uci.edu/ml/datasets/Adult 算法比较简单,没有涉及剪枝和限制树深,懒得写.. 实现完算法在数据集上跑了一遍,发现数据集太大导致栈溢出,所以只能预测部分数据了,谁知道比较好的优化办法欢迎交流~ 数据: ...
2017-04-04
0
510
首页
上一页
1
2
下一页
末页