和同学聊天的时候他告诉我,他看小说的这个网站防盗版做的很牛逼,网上都找不到盗版,我有点不信,连起点这些都到处是盗版,总不能一个不知名小说网站在安全上做的比这些大站还牛逼吧,所以就尝试了一下。
普通的章节毫无难度,直接就可以爬下来了,VIP 章节没尝试,太穷了,啥时候有钱了去充个VIP 来试试,我感觉应该都差不多,对于这个网站没有盗版的原因呢,,,可能是名气太小了,又整了VIP ,大佬们都忙着爬大站,所以这些VIP 章节被忽略了
# coding:UTF-8
from urllib import request
from bs4 import BeautifulSoup
url = "https://b.faloo.com/p/614602/1.html"
r = request.Request(url)
download_response = request.urlopen(r)
download_html = download_response.read().decode('gb2312', 'ignore')
soup = BeautifulSoup(download_html, 'html5lib')
texts = soup.find_all(id='content') #获取content标签的内容
soup_text = BeautifulSoup(str(texts), 'lxml')
content = soup_text.get_text('\n', '<br>') #替换<br>为换行
f = open('1.md', 'w+')
for line in content:
if line == "-":
break
else:
f.write(line)