大数据的奇妙冒险
大数据的奇妙冒险
全部文章
分类
Java(2)
JVM(1)
大数据(7)
未归档(20)
算法与数据结构(2)
网络(1)
面试(2)
归档
标签
去牛客网
登录
/
注册
大数据的奇妙冒险
更多内容可关注公众号 “大数据的奇妙冒险”
TA的专栏
19篇文章
14人订阅
大数据从入门到放弃
18篇文章
10710人学习
Kafka的奇妙冒险
1篇文章
1621人学习
全部文章
(共8篇)
python3爬虫——下载unsplash美图到本地
最近发现一个网站www.unsplash.com ( 没有广告费哈,纯粹觉得不错 ),网页做得很美观,上面也都是一些免费的摄影照片,觉得很好看,就决定利用蹩脚的技能写个爬虫下载图片。 先随意感受一下这个网站: 接下来开始对网页进行解析: 在该网页检查元素,选择其中一张图片查看它的代码...
python 3
爬虫
2018-08-14
0
349
阿里云CentOS安装配置Python3.7及pip3
一、安装Python3.7 安装依赖包 yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel 上官网下载安装包 wget https://...
python 3
2019-02-19
0
423
Python 增加博客园阅读量
最近偶然到博客园看了一下,距离上次的博客已经过去很多天了,阅读量却少得可怜,对于博客园小白来说感觉不是很友好(主要是心理不平衡),而且有些博客被其他网站不带出处的转载了,它的阅读量却很多。于是灵光一闪,决定写个程序增加一下阅读量。(仅用于学术交流,实际上我就试了一下,没有真正...
python 3
2019-03-02
0
428
Python 实现 KNN(K-近邻)算法
一、概述 KNN(K-最近邻)算法是相对比较简单的机器学习算法之一,它主要用于对事物进行分类。用比较官方的话来说就是:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例, 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。为了更好地理解,通过一个简单的...
python 3
数据挖掘
2019-03-04
0
336
Python3获取拉勾网招聘信息
为了了解跟python数据分析有关行业的信息,大概地了解一下对这个行业的要求以及薪资状况,我决定从网上获取信息并进行分析。既然想要分析就必须要有数据,于是我选择了拉勾,冒着危险深入内部,从他们那里得到了信息。不得不说,拉勾的反爬技术还挺厉害的,稍后再说明。话不多说,直接开始。 一、明确目...
python 3
爬虫
2019-04-01
0
349
python3 对拉勾数据进行可视化分析
上回说到我们如何如何把拉勾的数据抓取下来的,既然获取了数据,就别放着不动,把它拿出来分析一下,看看这些数据里面都包含了什么信息。(本次博客源码地址:https://github.com/MaxLyu/Lagou_Analyze) 一、前期准备 由于上次抓的数据里面包含有 ID 这样的信息...
python 3
数据分析
2019-04-02
0
440
数据游戏:预测3天后招商银行的股价
前阵子报名参加了一个数据比赛,题目是预测5月15号(星期三)招商银行的股价,截止时间是在5月12号(星期天)。在本次预测中,我用到的是岭回归。 一、岭回归 线性回归 先回顾一下普通线性回归。一般来说,线性回归方程:y=w1x1+w2x2...+wnxn。我们把这组变量 xn...
python 3
数据挖掘
2019-05-14
1
613
python探索微信朋友信息
一、itchat itchat是一个开源的微信个人号接口,这一次就用它来来玩玩。 在使用之前,先下载,老规矩通过 pip install itchat 即可安装。 想要获取朋友圈信息,只需要几行代码就可以获取。为减少登录次数,将获取到的信息保存到 json 文件中即可。 ...
python 3
2019-06-14
0
398