Python爬虫下载嗅事百科出现BadStatusLine错误
在写爬取嗅事百科段子的爬虫时候,使用urllib2下载网页内容,代码抛出如下异常:
后来发现是因为嗅事百科网站访问的时候,后台进行了Header校验,在调用urlopen方法之前,加上Header内容就可以了。更改后的代码如下:红框圈起来的是加上header
在写爬取嗅事百科段子的爬虫时候,使用urllib2下载网页内容,代码抛出如下异常:
后来发现是因为嗅事百科网站访问的时候,后台进行了Header校验,在调用urlopen方法之前,加上Header内容就可以了。更改后的代码如下:红框圈起来的是加上header