我的第1个爬虫
python3编写
画师通这个网站没有反爬虫,也没有登录
比较好爬
因为我直接爬的主页,没有进去爬
可能图片不是很高清
有需要的小伙伴可以自己改代码(不是我懒!!!)
###如果你不想启动它,那就直接白嫖图片吧!!!(下面是百度网盘链接)
百度网盘
提取码:sxfe
我之前发的一个python爬虫的资料
下面就是源码了
再说一遍!!!
这是python3编写的!!!
import urllib.request import re import time import threading def xz(url,name): for kkk in range(3): try: urllib.request.urlretrieve(url,'%s.jpg'%name) except Exception as r: print('%s 获取错误 %s'%name%r) else: print("%s获取成功"%name) break h='https://www.huashi6.com/hot_' n=1 for th in range(1,8264): s=h+str(th) while 1: try: a=urllib.request.urlopen(s).read().decode('utf-8') except: print("页面获取失败") time.sleep(2) else: print("页面获取成功") break print(a) c=re.findall('http[^"]*jpg" alt="',a) c+=re.findall('http[^"]*png" alt="',a) ttt=[] for f in c: i=f[0:-7] #print(i) #time.sleep(1) print("add",n) t=threading.Thread(target=xz, args=(i,n,)) t.setDaemon(True) ttt.append(t) n+=1 for hh in ttt: hh.start() for hh in ttt: hh.join() print("第",th,"页执行完毕")