Python爬虫系列（5）XPath语法

1.什么是XPath?

xpath是一门在XML和HTML文档中查找信息的语言，可用来在XML和HTML文档中对元素和属性进行遍历

表达式	描述	示例	结果
nodename	选取此节点的所有子节点	bookstore	选取bookstore下所有的子节点
/	如果在最前面，代表从根节点选取，否则选择某节点下的某个节点	/bookstore	选取根元素下所有bookstore节点
//	从全局节点中选择节点，随便在哪个位置	//book	从全局节点中找到所有book节点
@	选取某个节点的属性	//book[@price]	选择所有book节点的price属性

谓语用来查找某个特定的节点或者包含某个指定值的节点被嵌在方括号中。

在下面的表格中，我们列出了所有带有谓语的一些路径表达式，以及表达式的结果：

*表示通配符

通配符	描述	示例	结果
*	匹配任意节点	/bookstore/*	选取bookstore下的所有节点
@*	匹配节点中的任何属性	//book[@*]	选取所有带有属性的book元素

| 选取所有带有属性的book元素 |

Python爬虫系列（5）XPath语法