Python爬虫下载嗅事百科出现BadStatusLine错误

在写爬取嗅事百科段子的爬虫时候,使用urllib2下载网页内容,代码抛出如下异常:Python爬虫下载嗅事百科出现BadStatusLine错误


后来发现是因为嗅事百科网站访问的时候,后台进行了Header校验,在调用urlopen方法之前,加上Header内容就可以了。更改后的代码如下:红框圈起来的是加上header

Python爬虫下载嗅事百科出现BadStatusLine错误