大数据的奇妙冒险
大数据的奇妙冒险
全部文章
分类
Java(2)
JVM(1)
大数据(7)
未归档(20)
算法与数据结构(2)
网络(1)
面试(2)
归档
标签
去牛客网
登录
/
注册
大数据的奇妙冒险
更多内容可关注公众号 “大数据的奇妙冒险”
TA的专栏
19篇文章
14人订阅
大数据从入门到放弃
18篇文章
10705人学习
Kafka的奇妙冒险
1篇文章
1617人学习
全部文章
(共35篇)
python探索微信朋友信息
一、itchat itchat是一个开源的微信个人号接口,这一次就用它来来玩玩。 在使用之前,先下载,老规矩通过 pip install itchat 即可安装。 想要获取朋友圈信息,只需要几行代码就可以获取。为减少登录次数,将获取到的信息保存到 json 文件中即可。 ...
python 3
2019-06-14
0
398
Kaggle之泰坦尼克号幸存预测估计
上次已经讲了怎么下载数据,这次就不说废话了,直接开始。首先导入相应的模块,然后检视一下数据情况。对数据有一个大致的了解之后,开始进行下一步操作。 一、分析数据 1、Survived 的情况 train_data['Survived'].value_counts() ...
数据挖掘
Kaggle
python
2019-05-31
0
500
通过房价预测入门Kaggle
今天看了个新闻,说是中国社会科学院城市发展与环境研究所及社会科学文献出版社共同发布《房地产蓝皮书:中国房地产发展报告No.16(2019)》指出房价上涨7.6%,看得我都坐不住了,这房价上涨什么时候是个头啊。为了让自己以后租得起房,我还是好好努力吧。于是我打开了Kaggle,准备上手第一道...
数据挖掘
Kaggle
2019-05-25
0
430
k-means 算法介绍
概述 聚类属于机器学习的无监督学习,在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。它跟分类的最主要区别就在于有没有“标签”。比如说我们有一组数据,数据对应着每个“标签”,我们通过这些数据与标签之间的相关性,预测出某些数据属于哪些“...
2019-05-22
0
383
数据游戏:预测3天后招商银行的股价
前阵子报名参加了一个数据比赛,题目是预测5月15号(星期三)招商银行的股价,截止时间是在5月12号(星期天)。在本次预测中,我用到的是岭回归。 一、岭回归 线性回归 先回顾一下普通线性回归。一般来说,线性回归方程:y=w1x1+w2x2...+wnxn。我们把这组变量 xn...
python 3
数据挖掘
2019-05-14
1
611
预测python数据分析师的工资
前两篇博客分别对拉勾中关于 python 数据分析有关的信息进行获取(https://www.cnblogs.com/lyuzt/p/10636501.html)和对获取的数据进行可视化分析(https://www.cnblogs.com/lyuzt/p/10643941.html),这次...
数据挖掘
2019-04-20
0
645
python3 对拉勾数据进行可视化分析
上回说到我们如何如何把拉勾的数据抓取下来的,既然获取了数据,就别放着不动,把它拿出来分析一下,看看这些数据里面都包含了什么信息。(本次博客源码地址:https://github.com/MaxLyu/Lagou_Analyze) 一、前期准备 由于上次抓的数据里面包含有 ID 这样的信息...
python 3
数据分析
2019-04-02
0
437
Python3获取拉勾网招聘信息
为了了解跟python数据分析有关行业的信息,大概地了解一下对这个行业的要求以及薪资状况,我决定从网上获取信息并进行分析。既然想要分析就必须要有数据,于是我选择了拉勾,冒着危险深入内部,从他们那里得到了信息。不得不说,拉勾的反爬技术还挺厉害的,稍后再说明。话不多说,直接开始。 一、明确目...
python 3
爬虫
2019-04-01
0
346
线性回归——梯度下降
一、概述 线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在机器学习中属于监督学习。在数据分析等领域应用十分广泛。 很多情况下我们都用它进行预测,比如预测房屋价格。在这里用一个简单的例子来说明,假设有一组房屋数据,为了理解方便,假设决定...
数据挖掘
2019-03-23
0
339
Python 实现 KNN(K-近邻)算法
一、概述 KNN(K-最近邻)算法是相对比较简单的机器学习算法之一,它主要用于对事物进行分类。用比较官方的话来说就是:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例, 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。为了更好地理解,通过一个简单的...
python 3
数据挖掘
2019-03-04
0
336
首页
上一页
1
2
3
4
下一页
末页