科技 | 产品岗入职第二周周报
心得体会:学好Python、Excel,上班摸鱼神器(不鼓励摸鱼,但能摸着也是种能力)
这周用Python爬取了一下页面信息,学习地址如下:
Python爬取学习
首先要引入两个库:
requests和lxml
requests是用于获取网页源代码的,lxml是得到源代码种指定数据的。
现在,以我要爬取的海南海口学校信息网站为例:
网址为:https://www.ruyile.com/xuexiao/?a=324&t=2
但事实上我只需要学校的名字和地址,如果一个个的复制进入Excel,嗯……让我看看
光小学就有151所!!!
鲨了我吧,如果要全部学校的信息,加班也复制不完呀!
为了提高效率(tou lan),我决定学一下爬网页。
代码如下,写了备注:
打印效果:
然后再将名称指定位置换成地址指定位置就可得到地址信息了。
未完待续