Python爬虫4:利用正则表达式+requests爬取某浪财经一张网页的文字,并写入txt文件

某浪财经有反爬虫限制,最好选择其他网站。

方法:利用正则表达式+requests爬取某浪财经重庆啤酒(600132)的研究报告,写入txt文件。

1.爬虫思路分析
• (1)爬取的内容为重庆啤酒(600132)的研究报告,如图所示。
Python爬虫4:利用正则表达式+requests爬取某浪财经一张网页的文字,并写入txt文件
(2)爬取该研究报告的信息,通过手动浏览,网址:
http://stock.finance.sina.com.cn/stock/go.php/vReport_Show/kind/search/rptid/625347604206/index.phtml
(3)需要爬取的信息为全文文字信息,如下图所示。
Python爬虫4:利用正则表达式+requests爬取某浪财经一张网页的文字,并写入txt文件
(4)运用Python对文件的操作,把爬取的信息存储在本地的txt文本中。

2.操作
步骤1:打开以下页面,这个就不在介绍了。
Python爬虫4:利用正则表达式+requests爬取某浪财经一张网页的文字,并写入txt文件