python基础——BeautifulSoup的安装与使用

声明:本文章首发于笔者的公众号【软妹与你学IT】,转载请注明出处!



上次我们讲到,如何将整个网页的代码显示出来,这次我们细化到每一个tag。


☆安装


首先我们需要安装一个BeautifulSoup库。我安装的版本是python3。所以就可以直接在cmd下用pip3命令进行安装。

命令:

pip3 install beautifulsoup4


执行结果:

python基础——BeautifulSoup的安装与使用


在安装好BeautifulSoup后,我们可以通过导入该库来判断是否安装成功。

命令:

>>> from bs4 import BeautifulSoup


敲入命令回车后不报错,这说明我们已经将其安装成功。


    ☆使用


接下来我们就可以抑制住心中的小激动去使用它了:

我们用chrome浏览器(可根据需要自行调整)打开百度翻译(http://fanyi.baidu.com),按f12来查看网页具体的tag分布。

python基础——BeautifulSoup的安装与使用

比如我们想获取图中的title标签内容,我们就可以这样做:

代码:

from bs4 import BeautifulSoup

from urllib.request import urlopen

html = urlopen("http://fanyi.baidu.com")

bsObj = BeautifulSoup(html.read(),"html.parser")

print(bsObj.head.title)

如图:

python基础——BeautifulSoup的安装与使用

按f5执行结果:

python基础——BeautifulSoup的安装与使用

看,有了BeautifulSoup是不是很轻松的就可以获取到tag中的元素内容了。大家可以通过例子举一反三哦!




***推广***  程序内外我们一起成长,欢迎关注【程序外的碎碎零零】,长按二维码,识别关注!


python基础——BeautifulSoup的安装与使用