Chinese English
公司新闻 媒体报道 专家观点
谁来破解全链条、多维基因组学大数据的治理与应用?
2022-09-02 分享:

自从DNA的双螺旋结构被人们解析开始,人们在探究健康与疾病基因组复杂性与差异性上迈出了巨大的突破。随着新一代高通量测序技术(NGS)的发展和广泛应用,基因测序价格降低,测序速度大幅提高,伴随而来的是基因组数据的爆发式增长。如何实现组学数据的快速传输与存储?如何实现组学数据标准化存储与治理?如何将海量数据转化解析,为临床所用,助力患者诊疗?这些是摆在业内科学家面前的重大课题。

彼时,英美等国都启动了精准医学计划,面对来自国际上的基因大数据深度挖掘挑战,2018年,作为医疗大数据创新企业,在上海交通大学牵头下,神州医疗与一众精准医学领域的优秀团队一起,开展了一系列针对精准医学大数据的有效挖掘与关键信息技术研发,推动精准医学的可持续发展。项目希望在关键技术体系上进行自主创新,着重在多维基因组学大数据全链条分析技术和适用于生物医学大数据应用场景的云计算技术方面完成突破,以实现生物医学数据有效安全的综合利用。


打通全链条、多维基因组学大数据分析

单一组学数据对于探究生物学问题具有单一局限性,然而生命医学问题的解决往往需要多维度信息进行表征。多维度的基因大数据可以助力精准诊断及个性化治疗,以便及时对高风险患者进行精准筛查和健康管理,也可以为复杂疾病的精准诊疗提供科学依据。

当时的神州医疗,在基因组大数据分析、基因大数据算法及数据质控方面已经取得瞩目成果,正在迅速成长为医疗大数据领域的“先锋队”,作为项目骨干参与到这项制胜未来的工作,运用擅长的全链条数据治理技术,针对基因大数据挖掘的痛点,打通多维基因组学数据治理“传-存-治-算-用”的全链条通路,为患者能享受个性化诊疗和推动科研进步,发挥了强有力的技术支撑作用。

在数据存储环节,通过适用于医学大数据场景的知识库,实现基因组大数据分字段存储;在数据治理上,在完成数据敏感信息加密脱敏后,依托自然语言处理技术、一体化中文医学知识本体库,匹配国际标准的OMOP科研数据通用模型,完成对医疗数据系统中结构化数据和非结构化数据的全流程处理;在数据分析中,神州医疗开发了基于SPARK加速的WES数据的分布式计算系统,大大提高了硬件运行效率;利用知识库和跨模态算法,建立起了临床决策支持系统,帮助提升临床诊断效率。

这些工作不仅开创了复杂多元异构大数据有效整合与深度挖掘的创新,而且进一步夯实了生物组学大数据多维度治理和闭环融合的经验,树立了神州医疗在业内全链条、多模态数据处理能力的核心优势和行业壁垒。


推进面向科研和临床的精准医学落地应用

所有的技术突破和创新只有在真正帮助到疾病诊疗时,才能发挥其应有的光彩。完成全链条、多维组学数据治理突破第一步后,神州医疗基于对临床的深度认知和洞察,积极开拓将数据面向临床和科研的应用,让数据发挥更大的价值。

结合我国疾病谱变化,神州医疗锁定五大高发疾病的临床应用,完成了在恶性肿瘤、心脑血管、免疫性疾病、慢性呼吸系统、惊厥类遗传疾病等重大疾病的预警与风险评估、个体化诊疗与预后判断的分析模型和自动化报告。

其中交付的iCMDB综合知识库,打通了公共数据库和诊疗数据库,汇聚了大量的生物医学研究文献,覆盖临床的诊断治疗数据、生物医药的研发数据、患者的累计数据、生物医药知识库数据等四个方面。所有数据经过高度结构化处理,按照特定的规则和模型进行存储。

最终,可为临床医生提供辅助决策建议,为患者提供个性化诊疗方案、个性化用药指导。知识库包含了近40种癌症大类,在云端和本地均可部署实施。


面向未来的精准医学大数据治理

“以科技之极,创健康无限”,不断探索、突破技术壁垒,服务医生和临床诊疗,始终是神州医疗的使命。基于精准医学大数据的有效挖掘和关键信息技术研发,神州医疗进一步积累了在多维基因组学数据的全链条治理技术,并结合自身在影像、临床数据的技术优势,打通了临床数据、影像数据和基因组学数据间的壁垒,正以全链条智能数据处理能力,助力精准医学时代到来。事实上,公司也是国内少数能够实现多组学、多模态大数据闭环融合的企业。

以终为始,以行为知。未来,神州医疗基于自身强大的数据治理技术及临床洞察,将大力推进科研创新成果的产业化和规模化,从而使每一项科研创新都落实到产业发展和社会生活的实处,最终服务临床诊疗,实现对于疾病和患者的个性化精准治疗。


背景介绍

“精准医学大数据的有效挖掘与关键信息技术研发”项目,是“十三五”国家重点研发计划“精准医学研究”项目之一。由上海交通大学作为项目牵头单位,中国医学科学院北京协和医院、华中科技大学、复旦大学、浙江大学、神州医疗等作为课题参与单位,从临床应用和转化研究需求出发,共同研发精准医学大数据集成平台,旨在形成一个集数据操作、分析操作、信息操作于一体的整体解决方案,为医疗与科研等各类场景下的精准医学大数据分析提供全链条、易部署、易运营的解决方案。项目集中了多个国内知名生物信息、生物统计、医学信息、生物大数据和临床医学团队。


TOP