HelloWorld2048
HelloWorld2048
全部文章
未归档
题解(17)
归档
标签
去牛客网
登录
/
注册
韭菜用来写题的博客
一只时常纠结的算法小白
全部文章
/ 未归档
(共1篇)
练习-爬取豆瓣电影TOP250信息
数新的同学提问,刚好回忆一下大一小学期学习的爬虫(水一篇博客)。 与网上众多豆瓣250不同的是,此次需要爬取更多的内容(更麻烦一些)。 首先豆瓣是有反爬虫措施的(形同没有),之后用requests库和xpath轻轻松松爬到所有的信息,之后就是数据清洗。注意由于内容涉及到中文字符,全文需以ut...
2020-06-05
1
609