在数字化浪潮的推动下,数据资产化已成为各行业发展的关键驱动力,健康医疗领域亦是如此。中文健康医疗数据中蕴含着海量极具价值的信息,但其中敏感信息的保护却面临着严峻挑战。
神州医疗秉持“学以致用,因地制宜”的思想,参照国际上最严格的美国HIPAA法案(Health Insurance Portability and Accountability Act)开展个人隐私保护策略及我国适用性研究,解决国际医学信息学界存在的暴露风险量化的核心技术挑战。具体而言,首先开展去识别化策略和在中国电子病历数据中的应用情况研究,并进一步开展我国人群的敏感信息保护研究,从技术上扎根解决风险量化问题,完成了“技术验证—暴露揭示—策略制定”的全流程敏感信息保护技术构建,相关成果已发表于多个国际知名期刊。
HIPAA Safe Habor:安全港在中国还安全吗?
研究成果《Evaluation of Privacy Risks of Patients' Data in China: Case Study》(JMIR Medical Informatics, 2020),通过参照美国HIPAA法案,在中文语境中首次系统评估了HIPAA Safe Habor技术路线的“去识别-再识别”风险平衡思路,提出针对中国患者数据的独特性的技术验证方案,验证了去识别De-identification与再识别Re-identification之间的风险平衡,是中文EMR数据个人识别信息保护的有效技术路线,可以达到国际上公认的安全水平。
孕产敏感信息:EMR数据利用还有多少河里的石头需要摸清?
隐私与敏感信息保护是EMR数据使用的先决条件,但中英文环境具有巨大的差异,无法简单“拿来主义”,并且国际上也并无孕产敏感信息保护的先例。对此,神州医疗发表了研究成果《Effective Privacy Protection Strategies for Pregnancy and Gestation Information From Electronic Medical Records: Retrospective Study in a National Health Care Data Network in China》(Journal of Medical Internet Research, 2024),这是中国首次全国范围EMR孕产信息定量分析研究,揭示了中文EMR系统里的敏感信息分布情况,指出电子病历中孕产信息暴露的主要来源,并且提出了基于风险定量的孕产信息保护策略EPPGI,风险保护有效率(Recall)96.8%,处于国际顶尖水平。
性传播疾病:如何制定中文语境下敏感EMR信息保护策略?
敏感信息泄露可能导致患者巨大的社会压力,尤其在中国社会氛围中性文化趋于保守,因此对于任何性传播疾病的信息泄露,都有可能直接对患者临床治疗产生重要影响。针对此,神州医疗发表研究成果《Privacy Protection of Sexually Transmitted Infections Information from Chinese Electronic Medical Records》(Scientific Reports, 2025),对19类性传播疾病(Sexually Transmitted Infections)患者的敏感信息暴露进行风险量化研究,并制定了保护策略EPSTII对与性传播感染相关的关键词及大量同义词进行发现和保护,成功率(Recall)达到99.5%,最大限度地保障了性传播疾病患者的隐私。
这些研究成果首次在中国开展去识别化后的再识别风险量化研究,验证HIPAA数据安全港在我国的适用性,为政策制定者和数据管理人员提供决策参考依据;除此之外,研究进一步对我国大样本人群开展隐私暴露风险的量化研究,利用先进的自然语言处理及统计技术,揭示了孕产和性传播疾病敏感信息的分布模式,并针对性地提出了保护策略。从考察HIPAA数据安全港在中国的适用性,再到基于中国数据体系和大规模人群的自主创新,神州医疗基于中文电子病历数据自主技术突破,为国内外敏感信息保护提供了深刻洞察和先进技术赋能!