科技 | 产品岗入职第二周周报

心得体会:学好Python、Excel,上班摸鱼神器(不鼓励摸鱼,但能摸着也是种能力)

这周用Python爬取了一下页面信息,学习地址如下:
Python爬取学习

首先要引入两个库:
requests和lxml
requests是用于获取网页源代码的,lxml是得到源代码种指定数据的。

现在,以我要爬取的海南海口学校信息网站为例:

网址为:https://www.ruyile.com/xuexiao/?a=324&t=2

科技 | 产品岗入职第二周周报
但事实上我只需要学校的名字和地址,如果一个个的复制进入Excel,嗯……让我看看

科技 | 产品岗入职第二周周报
光小学就有151所!!!

鲨了我吧,如果要全部学校的信息,加班也复制不完呀!

为了提高效率(tou lan),我决定学一下爬网页。

代码如下,写了备注:

科技 | 产品岗入职第二周周报

打印效果:
科技 | 产品岗入职第二周周报
然后再将名称指定位置换成地址指定位置就可得到地址信息了。

未完待续