python基础——BeautifulSoup的安装与使用
声明:本文章首发于笔者的公众号【软妹与你学IT】,转载请注明出处!
上次我们讲到,如何将整个网页的代码显示出来,这次我们细化到每一个tag。
☆安装
首先我们需要安装一个BeautifulSoup库。我安装的版本是python3。所以就可以直接在cmd下用pip3命令进行安装。
命令:
pip3 install beautifulsoup4
执行结果:
在安装好BeautifulSoup后,我们可以通过导入该库来判断是否安装成功。
命令:
>>> from bs4 import BeautifulSoup
敲入命令回车后不报错,这说明我们已经将其安装成功。
☆使用
接下来我们就可以抑制住心中的小激动去使用它了:
我们用chrome浏览器(可根据需要自行调整)打开百度翻译(http://fanyi.baidu.com),按f12来查看网页具体的tag分布。
比如我们想获取图中的title标签内容,我们就可以这样做:
代码:
from bs4 import BeautifulSoup
from urllib.request import urlopen
html = urlopen("http://fanyi.baidu.com")
bsObj = BeautifulSoup(html.read(),"html.parser")
print(bsObj.head.title)
如图:
按f5执行结果:
看,有了BeautifulSoup是不是很轻松的就可以获取到tag中的元素内容了。大家可以通过例子举一反三哦!
***推广*** 程序内外我们一起成长,欢迎关注【程序外的碎碎零零】,长按二维码,识别关注!