当大数据遇上医学科学研究,开放科学、数据密集型医学科研范式逐渐兴起。《药物流行病学杂志》曾提到,相较于评估药物有效性和安全性的金标准——随机对照试验RCT的结果,基于大型医疗数据库开展真实世界研究获得的证据近年来受到越来越多医疗决策者的关注。
当前,建设医学科研平台十分必要。许多临床专家与医院领导都曾想建立一个专病大数据库,把科室内的特色专病数据收集起来,后期再进行数据分析和挖掘。建设一个高质量的临床科研数据库,对经验传承和临床研究均具有不同寻常的意义。例如,某医院课题组在建立专病大数据库后,1年内发表了6篇SCI文章。这些文章不仅帮助科室数位研究生顺利毕业,更重要的是让该科室建立了一套可以传承的临床科研体系。
显而易见,医疗数据库将带来医学科研模式的巨大改变。过去是“假设驱动、验证假设”,现在是“数据驱动、发现知识”。然而,实际情况中,医疗数据库在临床与科研实际应用率和产出并不高。背后原因在于“底层基础”没有搭好。
在全国级别的疾病数据库建设层面,中国仍处于“初级阶段”。
大部分医院目前依然面临着临床业务数据分散、患者隐私泄露、数据未授权使用、搜集病例数据耗时太多、数据难以复用以及数据标准不一等问题。
厦门市妇幼保健院是集保健、医疗、教学、科研为一体的大型三级甲等妇幼保健院,医院的科研实力增长强劲,医院科研也正如火如荼地进行。在2019年中国医院科技量值妇产科学榜单中排名全国第69名,位居福建省第一。在临床研究方面,医院近年先后获得中国与世界卫生组织合作项目、国家自然科学基金、省科技重点课题等国际和省市级科研课题60余项。
大数据时代的到来,催化了“数据驱动、发现知识”的新医学科研模式。一方面,厦门市妇幼保健院经过多年的信息化建设沉淀的数据需要进一步挖掘价值;另一方面,如何进行数据治理进而为医院临床科研提供有效的数据服务,在数据挖掘链条中又如何保护数据安全,逐渐成为厦门市妇幼保健院信息化建设中要面临的主要问题。
面对这些难题,厦门市妇幼保健院选择通过携手翼方健数,利用其“隐私安全计算+人工智能+大数据”的技术实力赋能医院科研发展。该院副院长吴谨准表示,之所以对隐私计算技术寄予厚望,是看重它能够给医院科研平台带来的数据隔离、模型效果、公平协作以及长远发展。
在数据隔离方面,隐私计算能够避免数据泄漏到外部,满足用户隐私保护和数据安全的需求;在模型效果方面,比单中心孤立模型训练更好;在公平协作方面,参与方地位均等,能够实现公平合作;
在长远发展方面,其能够保证各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。
总的来说,翼方健数基于“隐私安全计算+人工智能+大数据”为一体的智能科研平台,在保护数据安全和数据授权使用的前提下,通过高质量的数据治理,将数据作为资产管理,能够实现平台数据价值的充分开发,从而有效地支持数据在临床科研的应用。
长远来看,利用隐私安全计算平台数据集成维度将变得更多,不仅支持常见的公共数据,同时支持院内院外数据集成,尤其在专病库的基础建设方面,更将凸显平台的优势。众所周知,专病专科库建设将是未来支撑医院专科建设和发展的支柱。专科专病库构建既需要将临床中对专科疾病的认知总结、归纳成CRF表单的能力;又需要海量、多来源、多层次、多标准的高可用数据支撑,翼方健数的智能科研平台不仅可以融合多机构、多中心的多模态数据,并可根据eCRF表入排条件进行自动填充,实现增量数据的持续录入,保障专科专病库中的数据有效更新。例如,帮助医生实现在平台内有效数据的找寻附带的数据统计,也能帮助科研者快速了解数据内容,并且自始至终都是受到隐私保护的。
随着越来越多医院加入隐私安全计算数据联盟,平台用户既可在单点也可通过联盟的方式开展协作,整个联盟乃至生态的数据也会越来越多,通过合作生成高质量的可用数据,推动更多的临床研究在这个平台上开展,最终促进中国临床医学研究和临床辅助决策的进步。
正如吴谨准副院长所言,“数据驱动临床科研,临床科研赋能临床”会是未来趋势。作为隐私计算领域的佼佼者,翼方健数欢迎并期待更多志同道合的专家、学者参与到科研协作中来,共同为提升临床科研效率、提高广大妇女儿童健康水平而努力。