七七七w

python

sql(4) stata(4) 统计学(1) 读书笔记(5) 软件分享(1) 面经(2) 题解(2)

/ 注册

全部文章 / python （共16篇）

Python爬虫利器-XPath的初步介绍

@[TOC]Python爬虫利器-XPath Python爬虫利器-XPath 在新手使用正则表达式提取源代码中指定信息的时候，如果正则表达式编写不适宜，往往会匹配到网页中我们不需要的内容，这实际大大增加了信息筛选、清洗的成本。尺有所短，寸有所长，小编今天要介绍的是一个能和正则表达式媲美的页面文...

2021-08-01

0 722

BeautifulSoup的用法案例简介

BeautifulSoup的用法案例简介在《Python爬虫利器-XPath》文中，我们介绍了XPath，使用它来进行页面文本信息提取方便快捷。在本文中，小编将介绍另外一个好用的工具–BeautifulSoup，使用它同样可以实现快速提取页面文本信息。 1.什么是BeautifulSou...

2021-08-01

0 582

map和reduce函数简介

map和reduce函数简介 Python有许多强大好用的内置函数，今天小编将带领大家继续了解两个关于遍历和迭代的函数。一、map map函数会根据提供的函数对指定序列做映射。其语法为：map(function, iterable)。也就是对iterable中的每一个元素进行function...

2021-08-01

0 975

Requests get爬虫之设置headers

Requests get爬虫之设置headers 前段时间，小编在抓取网页数据时，使用requests中的get方法，标注了url，却始终得不到数据。后来，经过一番尝试之后才发现，加上headers之后，想要的数据就出来了。小编不禁心生疑问：为什么要加headers呢？今天，我们就来聊一聊requ...

2021-08-01

0 1711

2020年上半年过去了，来给日记画个词云图呀~

目录一、准备工作二、代码实操简介导入相应模块结巴分词设置停用词注：停用词文档stopwords.txt我已经上传到资源里面了。画图作为一个常年写日记的人，从笔记本、手机、电脑各处都要写呀写。今天一看，7月份了，今年的上半年结束了，突发奇想对我上半...

2021-08-01

0 569

来搞一个小爬虫~基金经理人信息！

'''爬取天天基金网站，所有基金经理人以及所管的基金的信息。网址:http://fund.eastmoney.com/Data/FundDataPortfolio_Interface.aspx?dt=14&mc=returnjson&ft=all&pn=50&pi=...

2021-08-01

0 707

python删除列表中空字符

一、目的近期，处理数据中遇到了删除列表中空字符的需求。 # -*- coding:utf-8 -*- ''' 目的：删除None和'' ''' 二、数据 table1=[['地区', None, None, '公司名称', '', '注册资本', '', '成立时间', '银监会批复时间'...

2021-08-01

0 449

python爬取公众号历史文章

文章来源学习网上以及自己修改。参考链接： https://blog.csdn.net/d1240673769/article/details/75907152 目的 ''' 爬取公众号的历史文章信息：标题、链接、发布时间步骤：登录某一公众平台（随意一个），在新建图文的超链接里搜索公众...

2021-08-01

0 2835

python中时间戳和日期的转换

#时间戳和日期的转换 import time,datetime print(datetime.datetime.today()) print(time.time()) print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(...

2021-08-01

0 358

python返回上一个交易日

一、周一到周五微交易日，其他不处理 #返回上一个交易日lastworkday，根据周一到周五为工作日（不考虑他，采用下一个方法） import time,datetime #时间 date=datetime.datetime.today() #今天 #print(date.today()) w=d...

2021-08-01

0 1034