什么是BeautifulSoup

Beautiful Soup是一个Python包，功能包括解析HTML、XML文档、修复含有未闭合标签等错误的文档（此种文档常被称为tag soup）。这个扩展包为待解析的页面创建一棵树，以便提取其中的数据，这在网络数据采集时非常有用.

BeautifulSoup的基本用法

解析器

Python网络爬虫【持续更新】-BeautifulSoup库的使用

基本元素

Python网络爬虫【持续更新】-BeautifulSoup库的使用
基本元素在html文档中的位置：

遍历方式

遍历方式有上行遍历、下行遍历和平行遍历。不同的功能需要利用到不同的遍历方式。
Python网络爬虫【持续更新】-BeautifulSoup库的使用
下行遍历对应的功能(contents和children的效果一致，只是返回的对象类型不一样，并且他们返回的都是直接儿子节点，descendants返回的是所有的子孙节点）