Xpath学习

2020-03-24

记录了Xpath几个常用的方法。

方法

获取文本
- a/text() 获取a标签下的文本
- a//text() 获取a标签下所有标签的文本
- a[text()='xxx']获取文本为xxx的a标签
@符号
- a/@href 获取a标签的href的属性，其他属性获取方法相同
- a[@class='xxx']获取class属性为xxx的a标签
// 获取当前位置下的所有标签
- a//sapn获取a标签下的所有的span标签

获取豆瓣电影排行榜的所有电影名：

1、

我们可以看到属于类为article的div，我们写上//div[@class='article']

2、我们进一步发现该div下只有一个div，于是可以加上/div，这样所有的影片块就被选中了

3、观察发现每一个电影都是一个table

4、进一步定位到属于一个类属性为pl2的div下的a标签

5、追加//div[@class='pl2']/a//text()