【项目】offline danmu -- 爬取bilibili弹幕并分析弹幕用户ID
弹幕接口
随意找一个视频,获取弹幕
- 方式1
https://api.bilibili.com/x/v1/dm/list.so?oid={cid}
cid就是弹幕文件的id - 方式2
http://comment.bilibili.com/{cid}.xml
直接加载弹幕静态资源 - 获取cid
https://api.bilibili.com/x/player/pagelist?aid={aid}&jsonp=jsonp
cid是弹幕comment的id,与aid对应
这个接口还能看到视频大小
弹幕分析
获得的弹幕就是xml文件。xml就是一种规范方式。
p中的内容分别表示
弹幕出现时间,模式,字体大小,颜色,发送时间戳,弹幕池,用户Hash,数据库ID
(大佬分析参考链接)
如果后期需要实现过滤功能,需要知道用户hash的实际id。
通过在线分析发现
hash算法的是crc32
逆向暴力**的方法我这也实现了。
有需要的可以关注上面这个UID的b站账号,关注后私聊获取代码
或者关注我的公众号(大胃水手)获取