本周学习内容 06
本次分享主题
Xpath的学习笔记及相关心得 03
自动爬取网页内容并保存为TXT 05
2.代码Review
2.1
res_xpath.xpath('//a[@href="/41556/"]/text()')
#Xpath标签继承绝对路径 指定值可访问指定位置
#标签属性使用双引号 外面对应使用单引号
2.2
res_xpath.xpath('//a[@href="/41556/" and @class]/text()')
#使用多个属性 可以先加关键字在多次@属性
#多个参数可以用关键字进行运算
#制定属性进行提取
#可以指定多个属性提取
2.3带属性提取&二次提取
#提取对应标签中的超链接或者图片源地址
二次提取(在Xpath提取的结果中在进行提取)用于在标签中提取相应属性,可简化代码,增加代码可读性&提高提取速度
res_xpath.xpath('//*[@id="content"]/p[4]/text()')
#使用中括号指定提取第几个标签
#//*[@id="content"]/p[4]
#指定位置来提取
2.4
#无法使用标签属性提取可以使用绝对路径提取
#网页代码更新后无法提取
#将标签链接组合成真实链接 多次请求组合
这里讲的就是Xpath的一些高级用法,需要多次练习才可以掌握,使用频率不高~
以后慢慢练习吧
未完待续
Xpath 学习笔记分享完毕
2020年1月11日23:53:10