python爬虫与信息提取课程内容导学
常用的python IDE工具:
文本工具类IDE:IDLE、Notepad++、Sublime Text、Vim & Emacs、Atom、Komodo Edit
集成工具类IDE:PyCharm、Wing、PyDev & Eclipse、Visual Studio、Anaconda & Spyder、Canopy
基本要求:掌握定向网络数据爬取和网页解析的基本能力
内容部分:1.Requests库:自动爬取HTML页面自动网络请求提交
robots.txt:网络爬虫排除标准
2.Beautiful Soup库:解析HTML页面
Projects:实战项目A/B
Re:正则表达式详解,提取页面关键信息
3.Scrapy*:网络爬虫原理介绍专业爬虫框架介绍