七七七w
七七七w
全部文章
python
sql(4)
stata(4)
统计学(1)
读书笔记(5)
软件分享(1)
面经(2)
题解(2)
归档
标签
去牛客网
登录
/
注册
七七七w的博客
数据分析相关记录和分享
全部文章
/ python
(共16篇)
Python爬虫利器-XPath的初步介绍
@[TOC]Python爬虫利器-XPath Python爬虫利器-XPath 在新手使用正则表达式提取源代码中指定信息的时候,如果正则表达式编写不适宜,往往会匹配到网页中我们不需要的内容,这实际大大增加了信息筛选、清洗的成本。尺有所短,寸有所长,小编今天要介绍的是一个能和正则表达式媲美的页面文...
2021-08-01
0
515
BeautifulSoup的用法案例简介
BeautifulSoup的用法案例简介 在《Python爬虫利器-XPath》文中,我们介绍了XPath,使用它来进行页面文本信息提取方便快捷。在本文中,小编将介绍另外一个好用的工具–BeautifulSoup,使用它同样可以实现快速提取页面文本信息。 1.什么是BeautifulSou...
2021-08-01
0
463
map和reduce函数简介
map和reduce函数简介 Python有许多强大好用的内置函数,今天小编将带领大家继续了解两个关于遍历和迭代的函数。 一、map map函数会根据提供的函数对指定序列做映射。其语法为:map(function, iterable)。也就是对iterable中的每一个元素进行function...
2021-08-01
0
802
Requests get爬虫之设置headers
Requests get爬虫之设置headers 前段时间,小编在抓取网页数据时,使用requests中的get方法,标注了url,却始终得不到数据。后来,经过一番尝试之后才发现,加上headers之后,想要的数据就出来了。小编不禁心生疑问:为什么要加headers呢?今天,我们就来聊一聊requ...
2021-08-01
0
1455
2020年上半年过去了,来给日记画个词云图呀~
目录 一、准备工作 二、代码实操 简介 导入相应模块 结巴分词 设置停用词 注:停用词文档stopwords.txt我已经上传到资源里面了。 画图 作为一个常年写日记的人,从笔记本、手机、电脑各处都要写呀写。 今天一看,7月份了,今年的上半年结束了,突发奇想对我上半...
2021-08-01
0
482
来搞一个小爬虫~基金经理人信息!
'''爬取天天基金网站,所有基金经理人以及所管的基金的信息。 网址:http://fund.eastmoney.com/Data/FundDataPortfolio_Interface.aspx?dt=14&mc=returnjson&ft=all&pn=50&pi=...
2021-08-01
0
577
python删除列表中空字符
一、目的 近期,处理数据中遇到了删除列表中空字符的需求。 # -*- coding:utf-8 -*- ''' 目的:删除None和'' ''' 二、数据 table1=[['地区', None, None, '公司名称', '', '注册资本', '', '成立时间', '银监会批复时间'...
2021-08-01
0
367
python爬取公众号历史文章
文章来源 学习网上以及自己修改。 参考链接: https://blog.csdn.net/d1240673769/article/details/75907152 目的 ''' 爬取公众号的历史文章信息:标题、链接、发布时间 步骤:登录某一公众平台(随意一个),在新建图文的超链接里搜索公众...
2021-08-01
0
2407
python中时间戳和日期的转换
#时间戳和日期的转换 import time,datetime print(datetime.datetime.today()) print(time.time()) print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(...
2021-08-01
0
293
python返回上一个交易日
一、周一到周五微交易日,其他不处理 #返回上一个交易日lastworkday,根据周一到周五为工作日(不考虑他,采用下一个方法) import time,datetime #时间 date=datetime.datetime.today() #今天 #print(date.today()) w=d...
2021-08-01
0
940
首页
上一页
1
2
下一页
末页