读取网页的第一种方法:
#encoding: utf-8
import urllib2
def download1(url):
return urllib2.urlopen(url).read()
#读取全部网页,由于是read
url="https://www.baidu.com"
print download1(url)
url="http://www.baidu.com"
#urlopen只能处理http,不能处理https
print download1(url)读取网页的第二种方法:
def download2(url):
return urllib2.urlopen(url).readlines()
url="http://www.baidu.com"
print download2(url)
#此时显示出来的是列表,由于readlines读取每一行的网页数据,压入列表读取网页的第三种方法:
def download3(url):
response=urllib2.urlopen(url)
while True:
line=response.readline()
if not line:
break
print line
url="http://www.baidu.com"
print download3(url)
京公网安备 11010502036488号