本周学习内容 06


本次分享主题  

Xpath的学习笔记及相关心得 03

自动爬取网页内容并保存为TXT 05


2.代码Review

2.1

res_xpath.xpath('//a[@href="/41556/"]/text()')

#Xpath标签继承绝对路径 指定值可访问指定位置

#标签属性使用双引号  外面对应使用单引号 

2.2

res_xpath.xpath('//a[@href="/41556/" and @class]/text()')

#使用多个属性 可以先加关键字在多次@属性

#多个参数可以用关键字进行运算

#制定属性进行提取

#可以指定多个属性提取

2.3带属性提取&二次提取

#提取对应标签中的超链接或者图片源地址

 二次提取(在Xpath提取的结果中在进行提取)用于在标签中提取相应属性,可简化代码,增加代码可读性&提高提取速度

res_xpath.xpath('//*[@id="content"]/p[4]/text()')

#使用中括号指定提取第几个标签

#//*[@id="content"]/p[4]

#指定位置来提取

2.4  

#无法使用标签属性提取可以使用绝对路径提取

#网页代码更新后无法提取

#将标签链接组合成真实链接  多次请求组合


这里讲的就是Xpath的一些高级用法,需要多次练习才可以掌握,使用频率不高~

以后慢慢练习吧


未完待续 

Xpath 学习笔记分享完毕  

2020年1月11日23:53:10