如何使用selenium自动化爬取淘宝信息

如何使用自动化爬取淘宝信息

1、首先我们要确保安装了谷歌浏览器,并且是84.0版本

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传如何使用selenium自动化爬取淘宝信息

因为接下来我们要用到自动化这款软件,必须得和版本相匹配,否则就会失败

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传如何使用selenium自动化爬取淘宝信息

2、然后接下来,打开我们的taobao文件选择里面dist文件,这里提醒一下文件名最好不要随便乱改,因为这个exe文件是和py文件相匹配的,所以防止出错,test.exe这个文件是获取淘宝商品的属性,taobao-shangpingxinxi.exe这个是获取商品的销量、价格、标题,至于为什么不能放到一起爬取呢,因为这两个是不同页面来的,之前我一直在反复尝试,试着把这两个exe文件一起写,但是可惜一直都是失败告终。

3、前言说完了,接下来说说具体操作流程,首先打开我们其中的一个exe文件等他出现一个这个黑色的文件框即可,如果中途问你是否允许这个文件执行,点击确认即可,然后往里面输入你要搜索的关键词

如何使用selenium自动化爬取淘宝信息

例如我输入的是灯具组合 全屋 套餐

如何使用selenium自动化爬取淘宝信息

个人建议,最好就是先随便找个文本输入关键词,然后复制粘贴进去这个终端,因为在终端打字挺麻烦的,确认好你的关键词之后,按一下回车就开始运行这个程序了

4、运行这个程序之后,会自动弹出我们下载好的谷歌,这里我使用的是手机扫码登录,这样方便一点,可用度也高,任何人有淘宝号都可以运行这个程序,我设置了10秒钟的时间,如果超过10秒,那么程序会重新执行,所以最好速度要快

如何使用selenium自动化爬取淘宝信息

点击右上角那个扫码登录

如何使用selenium自动化爬取淘宝信息

拿出手机打开淘宝APP在搜索栏旁边有个扫二维码的东西,点击即可,然后扫码在手机端点击确认

如何使用selenium自动化爬取淘宝信息

都确认好之后就会跳转到我们需要爬取的页面
如何使用selenium自动化爬取淘宝信息

这时候我们什么都不用干,让它自己自动化爬取就好了,会自动翻页,淘宝搜索关键词最多只有100页,那么我们设置100页就好了,每当爬一页就会写入成功一次,这个是写入我们的CSV文件的
如何使用selenium自动化爬取淘宝信息

5、但是当我们打开我们的CSV文件的时候发现一个奇怪的现象

如何使用selenium自动化爬取淘宝信息

我们的CSV文件乱码了,这是因为我们的编码格式出了问题,这时候我们用Excel转换一下就好了,先创建一个Excel表打开,选择数据选择自文本,打开我们要导入的CSV文件

如何使用selenium自动化爬取淘宝信息

然后按照下面步骤来就好了

如何使用selenium自动化爬取淘宝信息

在导入我们的CSV文件之后,第一步先选择好我们的原始格式,第二步按下一步,第三步选择逗号,并且把tab键那个钩子去掉,文本识别符号选择双引号,然后再点击下一步

如何使用selenium自动化爬取淘宝信息

如何使用selenium自动化爬取淘宝信息

然后点击完成,最后的效果就是我们需要的信息了

中…(img-LXmQHQWC-1598376822720)]

然后点击完成,最后的效果就是我们需要的信息了

如何使用selenium自动化爬取淘宝信息
源代码我放到GitHub上了,最好有一定基础,不然看不懂不会操作的

这个是适合小白,新手,什么东西我都做好了,你按照上文描述来使用即可