Graph Analysis for Detecting Fraud Waste and Abuse in Healthcare Data
作者
帕罗奥多研究中心:
- Juan Liu
- Eric A. Bier
- Aaron Wilson
- Tomo Honda
- Sricharan Kumar
- Leilani H Gilpin
- Daniel Davies
摘要
检测欺诈、浪费和滥用(FWA)是一个重要但具有挑战性的问题。在本文中,我们描述了一个在大型医疗保健数据集中检测可疑活动的系统。每个医疗保健数据集都被视为一个异构网络,由数百万名患者、数十万名医生、数万家药店和其他实体组成。开发图形分析技术是为了发现可疑的个人、个人之间的可疑关系、随时间的异常变化、异常的地理空间散布和异常的网络结构。可视化界面被称为网络浏览器,提供了良好的数据概览,使用户能够根据需要过滤、选择和放大网络细节。该系统已在多个政府和商业网站和数据集上部署,并发现了许价值数百万美元每月的超额付款。
主要内容
本文构造了病人、医生、药房和其他实体的异质网络,并借助了图分析技术,在时间和空间上发现异常信息(欺诈、浪费和滥用),并制作了一个系统(XPIV)。
四种异常:
- 个体异常
- 关系异常
- 时间或空间异常
- 结构异常
图分析技术类别:
- the ego-net approach
- the global structure
为了避免杂乱,可以根据一些属性只选择前 top k 个进行可视化。
使用指标:
- degree
- weight
- entropy ratio
有些要会有较高的 re-sale 价格,可以给予关注。
时序或地理空间推理:
- sink vertices
- source vertices
- heavy links
用到具体技术:
- 最大似然估计
- 传递矩阵
- 累计分布函数
- DBSCAN
- 隐狄利克雷分配模型等
特征提取使用属性:
- Community Size
- Community density
- Average dollar amount
- Average anomaly score
思考
Critical thinking:
异常检测的精度
Creative thinking:
可以应用异构图的方法
用户采取的行动也可以成为算法的输入
How to apply to our work:
离线分析
实时分析(流)