基本用法及注释
1 | #安装 |
1、节点选择
html为树状结构,通过/来选取相应的节点:
1个/表示选取当前节点的直接子节点,//表示选取当前节点的所有子节点(相当页面上的所有节点)
1 | #选取页面中所有的tbody标签 |
1个.表示选取当前节点,..表示选取当前节点的父节点
1 | #等同于html.xpath('//a') |
2、文本获取
1 | #获取a标签的直接子节点的文本 |
3、属性获取
@表示选取属性
1 | #获取a标签的直接子节点的href属性 |
4、属性匹配
部分情况下标签可能需要进行筛选才能准确获取想要的信息
1 | #指定tbody标签,id属性包含字符normalthread |