Beautiful Soup库的概述
Beautiful Soup库
Beautiful Soup
提供一些简单的python式
的函数用来处理:导航、搜索、修改、分析树等功能
它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所有不需要多少代码就可以写出一个完整的应用程序
Beautiful Soup是python的一个库,最主要的功能是:从网页获取数据
beautifulsoup4==4.7.1第四版本,简称bs4
学习Beautiful Soup库的目的
可以增加一种获取数据的方法
在正则表达式、XPath的基础上再增加一个bs4
安装Beautiful Soup库
pip install beautifulsoup4
Beautiful Soup支持的解析器
主要用前面两种解析器比较多,但主要的还是用第二种(lxml HTML解析器)
如果用第二种解析器,那么需要额外安装lxml库
命令:pip install lxml