DPI大数据助力战“疫”
导读:
新型冠状病毒感染的肺炎疫情牵动着全国人民的心,在这场没有硝烟的战争中,智慧运营与大数据研究部积极进行了战“疫”探索。本次分享主题是《DPI大数据助力战“疫”》,主要内容分为3部分:
- DPI大数据综合讲解
- DPI大数据助力疫情防控
- DPI大数据未来展望
一. DPI数据综合讲解
1. 什么是DPI
DPI是Deep Packet Inspection的英文缩写,中文是“深度包检测技术”。深度包检测技术是在传统IP数据包检测技术(OSI L2-L4之间包含的数据包元素的检测分析)之上增加了对应用层数据的应用协议识别、数据包内容检测与深度解码。现网DPI采集设备同时具备传统IP数据包检测技术及深度包检测技术。
2.什么是DPI数据
运营商数据中移动网络OSS数据分为DPI采集数据和OMC网管采集数据。DPI采集数据主要指从核心网接口采集到的原始码流中解析出来的XDR话单数据。
DPI数据(XDR话单数据)具体生成过程:
1)核心网接口链路中的原始码流通过分光、镜像、汇聚分流等方式输出给DPI采集设备。
2)DPI采集设备再对原始码流进行解码、合成、各协议关联、用户信息回填,最后生成XDR话单数据
二. DPI数据助力疫情防控
1.传染源控制思路
疫情防控中可分为5类人:
A类人:使用DPI数据的时空信息,通过分析用户的历史出行轨迹,可以精确找出。
B类人:无法精确找出,但可以使用DPI数据的时空信息及行为信息,通过数据建模进行预测。
C类人:通过找出A,因为A认识C,C也就很容易被找出,当前大部分C已被官方隔离。
D类人:如果持续在家,则无隐患。
2B类人:通过找出B从而最大化降低2B的产生
总结:能够准确预测出B类人群是疫情防控的关键,将从两个切入点去预测B类人群:1)高频活动,2)前往过市内高危地区,例如医院。
2.高频活动人群分析
使用数据:HTTP话单数据(DPI数据的一种)
高频活动人员判定条件:
1)移动范围跨度 > 5km,移动范围跨度 =
2maxLongitude-min(Longitude)2+maxLatitude-min(Latitude)2
2)经过小区数量 > 30个,小区指ECI。
基于2020年2月21日(星期五)北京全天HTTP话单数据的“高频活动人群轨迹热力图”:
3.前往过医院人群分析
……
后文欢迎大家关注公众号:通信大数据分析及应用
扫码: