Python 爬虫进阶必备 | 某外卖优惠平台内容加密参数分析
今日网站
aHR0cHMlM0EvL3N0YXRpYy53YWl0d2FpdHBheS5jb20vd2ViL3NkX3NlL2luZGV4Lmh0bWwlMjMvc2VhcmNoL3NlYXJjaGZvciUzRHZlbmRvciUyNmtleXdvcmQlM0QlMjVFNyUyNUIxJTI1QjMlMjVFNyUyNUIyJTI1ODk=
最近因为个人的一些特殊情况,断更不少时间,有问题可以在交流群里 @ 我,有看到都会回复的。
Js 加密的内容其实大同小异,目前咸鱼也在不断学习 APP 逆向的知识,之后会出一部分关于 APP 逆向在爬虫中的应用相关的文章,这部分设计的技能栈较广,大家可以先预习 Java 基础与 Android 基础。
抓包与加密定位
这个网站的加密部分是返回值加密,返回值是长串的密文
就像上面这样
定位加密的方法
方法一:XHR 断点然后分析就完事了
可以直接找到处理请求和返回值的地方,之后在请求的地方单步调试就可以了
方法二:之前分析过不少的网站就是这样的加密形式,其实可以使用 hook 脚本直接找到,也可以像我这样搜索JSON.parse()
按照上面的方法,可以找到下面这样的代码
可以在代码运行到这个位置的时候,配合console
输出查看明文是否是我们想要的数据,来验证我们是不是定位对了位置,就像下面这样
可以看到密文的确实在这里进行解密的
加密分析
接下来就是老套路,把解密代码逐个扣取出来就完事了
就像我这样,先把主要的解密逻辑扣取出来,然后直接实例化运行
当然肯定会报错的,然后再按照报错信息逐一补全就行了,补全的实在太多了,我写了一半发现实在太多了,图片加文字有近两万字还没有写完
所以我直接给你们上视频学习!!
因为这个代码的扣取难度属于中等难度,这个涉及到的知识就比较多了,建议你学习一下我之前写过的三篇系列文章之后再看下面的****
爬虫工程师也应该会的 NodeJS 知识(三)- 快速抛弃 execjs
这个视频资料我直接放在后台了,这个教程的录制者是花哥,他的公众号是
【妄为写代码】
感兴趣的可以关注一下啊
****中讲述了整体加密代码应该如何扣取,实验的网站是豆瓣读书的搜索加密参数,扣取方法和这篇文章的思路是通用的。
那么如何获取这个加密扣取的视频呢?
后台回复【教学视频】即可