近年来,医保欺诈骗保等现象层出不穷,且逐渐呈现出复杂化、多样化、隐蔽化的特点,为我国医疗保险服务的监控和治理带来了巨大的挑战。传统的智能审核能解决合规性问题,针对隐藏在真实数据中的、违背合理性逻辑的欺诈骗保行为捉襟见肘,推进大数据手段在医保监管中的应用迫在眉睫。
2017年以来,成都市医疗保险信息服务中心建立大数据反欺诈平台,内置百余种创新算法,通过神经网络、机器学习、人工智能等深度数据挖掘,在海量数据中挖掘可疑行为,精确定位异常场景,为医保打击欺诈骗保提供依据。
经过多年医保事业的创新发展,成都市囤积了高质海量的医保数据资源。据统计,截至2018年末,成都基本医疗保险参保人数1682.22万,“两定”机构数量超过13000家。2018年全年,门诊统筹结算超614万人次,住院医疗费用结算超293万人次,日均医保刷卡26.13万人次,每天医保基金支出超过7100万元。数据存储日均新增5G,累计超过150T。面对如此庞大的数据金山,医保管理者该如何撬动?
对此,成都市医保信息服务中心科学研析,以大数据分析手段为主,以循证医学为辅,结合当前成熟先进的大数据算法,建立了大数据反欺诈平台。通过智能引擎对结算数据、电子病历等平台采集到的住院、门特相关数据进行全方位、多维度、长周期的分析,挖掘其中的行为模式、常用药方和治疗项目。再根据数据聚类,将存在其中的真实性问题数据识别出来,达到辅助工作人员决策,对医疗单位和参保人的精细化管理,控制欺诈骗保行为的目标。
以真实性问题为导向,围绕“住院行为真实性”和“门诊特殊疾病治疗真实性”两条主线,从现实欺诈场景出发,平台共设计了频繁就医识别监测、住院时间重叠识别监测、滞留住院识别监测、虚假医疗服务识别监测在内的四种算法模型。
比如频繁就医识别监测,重点针对有关联关系的参保人在相同时间相同医院的就诊行为监测。利用聚类算法识别出就诊行为高度一致的可疑行为,作为联合骗保疑点。住院时间重叠识别监测,直观的数据表现是患者的住院时间存在重叠,可能导致患者在报销的过程中,由于各种原因,出现2次及以上的医保报销,造成医疗资源浪费。滞留住院识别监测,重点针对患者在就诊的过程中出现连续7天以上未发生实质性治疗的行为监测,该类患者结算费用明细往往只有护理费、诊查费、床位费等,存在滞留住院浪费医疗资源的嫌疑。
虚假医疗服务识别监测,重点针对工作人员在对参保人药品、诊疗项目进行报销时发生对码错误的行为,具体数据表现如医院端名称与中心端名称不匹配,导致医保报销出现错误的经办人员违规操作等。
在平台智能引擎识别出可疑数据后,中心按批次下发稽核任务,由稽核人员对可疑数据进行现场检查并将稽核结果反馈回系统,大数据算法模型自动获取反馈结果进行学习,从而对系统的算法进行优化更新,使算法在未来的异常识别过程中更加精准。比如,中心在对2016年和2017年结算数据和明细数据进行专项筛查时,在“疑似重复报销”场景中,发现门诊特殊疾病结算数据可疑就诊记录377条,涉及医院30多家。中心据此分3批次下发稽核任务。经现场检查,共计查实疑点数据302条,查实率近80%。对此,中心利用稽核结果对平台该场景进行了集中优化,一举将“疑似重复报销”场景查实率提升至98%以上。
截至2019年4月底,中心利用大数据反欺诈平台共找到可疑就诊记录3526条,查实违规记录3192条,查实准确率达到90.53%,涉及金额3133519.9元,有效降低了基金损失。借助大数据反欺诈平台,成都市在海量的医保数据中能够快速、准确筛查出相关异常记录,降低了人工审核的巨大成本,显著提升了识别欺诈行为的准确率,为打造风清气正的营商环境提供了医保助力。
下一步,中心将持续调整算法模型的方向和阈值,优化架构,推进任务精准度不断提升。同时,进一步拓展平台功能,开发如药品组滥用、过度医疗等其他违规场景算法模型。