这是我自己写的一个小爬虫,爬取极客学院网站上的课程头像 
  
 主要工具: 
 正则表达式 
 requests库 
 BeautifulSoup库 
 代码如下:
import re
import requests
from bs4 import BeautifulSoup
url = 'http://www.jikexueyuan.com/'
r = requests.get(url)
demo = r.text
soup = BeautifulSoup(demo,'html.parser')
i = 1
for link in soup.find_all('a','card'):
          demo = str(link.contents)
          pattern = re.findall('src="(.*?)"',demo) #这是一个list,但是只有一个字符串
          html = pattern[0] #把list中的字符串提取出来
          print('now downloading the '+str(i)+' picture')
          with open('pic//' + str(i) + '.png','wb')as f:
            f.write(requests.get(html).content) #注意这里是content
          i += 1
 京公网安备 11010502036488号
京公网安备 11010502036488号