xpath简介
1.xpath使用路径表达式在xml和html中进行导航,即可以通过路径表达式确定在html中所需元素的位置
2.xpath包含标准函数库
3.xpath是一个w3c的标准
xpath节点关系
1.父节点
2.子节点
3.同胞节点
4.先辈节点
5.后代节点
xpath语法

article       选取所有article元素的所有子节点
/aticle       选取根元素article
article/a     选取所有属于article的子元素的a元素
//div         选取所有div子元素
article//div  选取所有属于article元素后代的div元素
//@class      选取所有名为class的属性
/article/div[1]          选取属于article子元素的第一个div元素
/article/div[last()]     选取属于article子元素的倒数第一个div元素
/article/div[last()-1]   选取属于article子元素的倒数第二个div元素
//div[@lang]             选取所有拥有lang属性的div元素
//div[@lang='eng']       选取所有lang属性为eng的div元素
/div/*                   选取属于div元素的所有子节点
//*                      选取所有元素
//div[@*]                选取所有带属性的div元素
//div/a|//div/p          选取所有div元素的a和p元素
//span|//ul              选取文档中的span和ul元素
article/div/p|//span     选取所有属于article元素的div元素的p元素以及文档中所有的span元素