Graph Analysis for Detecting Fraud Waste and Abuse in Healthcare Data

论文传送门

作者

帕罗奥多研究中心:

  • Juan Liu
  • Eric A. Bier
  • Aaron Wilson
  • Tomo Honda
  • Sricharan Kumar
  • Leilani H Gilpin
  • Daniel Davies

摘要

检测欺诈、浪费和滥用(FWA)是一个重要但具有挑战性的问题。在本文中,我们描述了一个在大型医疗保健数据集中检测可疑活动的系统。每个医疗保健数据集都被视为一个异构网络,由数百万名患者、数十万名医生、数万家药店和其他实体组成。开发图形分析技术是为了发现可疑的个人、个人之间的可疑关系、随时间的异常变化、异常的地理空间散布和异常的网络结构。可视化界面被称为网络浏览器,提供了良好的数据概览,使用户能够根据需要过滤、选择和放大网络细节。该系统已在多个政府和商业网站和数据集上部署,并发现了许价值数百万美元每月的超额付款。

Graph Analysis for Detecting Fraud Waste and Abuse in Healthcare Data

主要内容

本文构造了病人、医生、药房和其他实体的异质网络,并借助了图分析技术,在时间和空间上发现异常信息(欺诈、浪费和滥用),并制作了一个系统(XPIV)。

Graph Analysis for Detecting Fraud Waste and Abuse in Healthcare Data
Graph Analysis for Detecting Fraud Waste and Abuse in Healthcare Data

四种异常:

  • 个体异常
  • 关系异常
  • 时间或空间异常
  • 结构异常

图分析技术类别:

  • the ego-net approach
  • the global structure

为了避免杂乱,可以根据一些属性只选择前 top k 个进行可视化。
使用指标:

  • degree
  • weight
  • entropy ratio

有些要会有较高的 re-sale 价格,可以给予关注。

时序或地理空间推理:

  • sink vertices
  • source vertices
  • heavy links

用到具体技术:

  • 最大似然估计
  • 传递矩阵
  • 累计分布函数
  • DBSCAN
  • 隐狄利克雷分配模型等

特征提取使用属性:

  • Community Size
  • Community density
  • Average dollar amount
  • Average anomaly score

思考

Critical thinking:
异常检测的精度

Creative thinking:
可以应用异构图的方法
用户采取的行动也可以成为算法的输入

How to apply to our work:
离线分析
实时分析(流)