什么是BeautifulSoup?

Beautiful Soup是用Python写的一个HTML/XML的解析器，它可以很好的处理
不规范标记并生成剖析树(parse tree)。它提供简单又常用的导航(navigating)，
搜索以及修改剖析树的操作。它可以大大节省你的编程时间。
（摘自百度文库）
python网络爬虫与信息提取-02-beautifulsoup

HTML节点树

在HTML中，所有标签定义的内容都是节点:
●整个文档是一个文档节点
每个HTML元素是元素节点
●HTML元素内的文本是文本节点
●每个HTML属性是属性节点
●注释是注释节点
这些节点构成了一个HTML节点树，节点树中的节点彼此拥有层级关系，我们常用父节点、子节点、兄弟节点来描述节点之间的关系
父节点拥有子节点，同级的子节点被称为兄弟节点，每个节点都有父节点，同时可拥有任意数量的子节点或兄弟节点
（摘自：https://www.cnblogs.com/pzk7788/p/10530042.html）