我的第1个爬虫
python3编写
画师通这个网站没有反爬虫,也没有登录
比较好爬
因为我直接爬的主页,没有进去爬
可能图片不是很高清
有需要的小伙伴可以自己改代码(不是我懒!!!)
###如果你不想启动它,那就直接白嫖图片吧!!!(下面是百度网盘链接)
百度网盘
提取码:sxfe
我之前发的一个python爬虫的资料
下面就是源码了
再说一遍!!!
这是python3编写的!!!
import urllib.request
import re
import time
import threading
def xz(url,name):
for kkk in range(3):
try:
urllib.request.urlretrieve(url,'%s.jpg'%name)
except Exception as r:
print('%s 获取错误 %s'%name%r)
else:
print("%s获取成功"%name)
break
h='https://www.huashi6.com/hot_'
n=1
for th in range(1,8264):
s=h+str(th)
while 1:
try:
a=urllib.request.urlopen(s).read().decode('utf-8')
except:
print("页面获取失败")
time.sleep(2)
else:
print("页面获取成功")
break
print(a)
c=re.findall('http[^"]*jpg" alt="',a)
c+=re.findall('http[^"]*png" alt="',a)
ttt=[]
for f in c:
i=f[0:-7]
#print(i)
#time.sleep(1)
print("add",n)
t=threading.Thread(target=xz, args=(i,n,))
t.setDaemon(True)
ttt.append(t)
n+=1
for hh in ttt:
hh.start()
for hh in ttt:
hh.join()
print("第",th,"页执行完毕")
京公网安备 11010502036488号