来源:Cardiac Research 发布时间:2026/6/23 11:40:40
选择字号:
Cardiac Research|北京大学刘阳博士发表评论:守护全球生物样本库:心血管科学界的责任与行动

论文标题:Safeguarding the World’s Biobanks: A call to cardiovascular science

期刊:Cardiac Research

作者:Liu, Yang PhD

发表时间:May 15, 2026

DOI:10.1097/re9.0000000000000017

微信链接:点击此处阅读微信文章

研究概况

生物样本库已成为现代心血管科学的基石,UK biobank以其约50万参与者规模的基因组、心脏磁共振(CMR)影像和健康档案链接,深刻塑造了当代心血管研究。然而,2026年发生的两起数据安全事件暴露出生物样本库治理的深层薄弱环节,并引发学界对"去标识化"是否等同于"匿名化"的反思,尤其在高维CMR表型、罕见心肌病变异携带者与多基因风险极端人群等情境下,再识别风险的累积效应可能远超直接标识符缺失所暗示的水平。

本文阐明了心血管科学界对生物样本库参与者所负的伦理责任,指出全球大型生物样本库共同面临的结构性挑战,并向期刊、研究机构、资助机构和研究者提出五项分级行动建议,涵盖可信研究环境默认分析声明、数据与代码可用性声明改革、代码仓库扫描、高风险研究治理审查与跨界问责生态建设。文章最终呼吁,开放科学的真正含义是开放方法、代码与可重复分析,而非个体数据的开放发布,旨在为心血管科学界在保障参与者信任与维护科学可及性之间寻求平衡,并为生物样本库的可持续治理提供方向与启示

图1. 图形摘要

● 第一作者/通讯作者:刘阳

北京大学公共卫生学院流行病与卫生统计学系

● 原文链接:

https://journals.lww.com/cares/citation/9900/safeguarding_the_

world_s_biobanks__a_call_to.17.aspx

● DOI:10.1097/re9.0000000000000017

1.背景

2026年4月,UK Biobank通报,一批向注册研究者发放的去标识化参与者数据,被发现出现在某消费类电商平台上公开售卖,据报道至少一份清单包含全部50万参与者的记录。事件迫使UK Biobank紧急关闭其研究分析平台,使60多个国家、超过2.2万名注册研究者的分析项目陷入停滞。事实上,早在3月,UK Biobank已发现部分研究者无意间将参与者数据上传至公共代码仓库;牛津大学的独立追踪显示,相关下架通知已涉及14个国家、约197个代码仓库。对于深度依赖UK Biobank的心血管科学界而言,这绝不只是一个英国的问题,它是一记面向全球的警钟。

2.正文

2.1 心血管科学界对生物样本库参与者的责任

现代心血管流行病学正被“弗雷明汉时代”研究者难以想象的人群规模数据资源所重塑。UK biobank汇集了约48.8万人的全基因组数据、空前规模的心脏磁共振影像,以及与国家健康档案的完整链接,已成为当代心血管研究最具影响力的平台之一。基于UK Biobank开发的冠心病多基因风险评分,识别出与单基因家族性高胆固醇血症风险相当的人群,正在重塑心血管一级预防的格局;而CMR衍生的中间表型则揭示了左心室结构的全新遗传位点,并使扩张型心肌病的多基因预测成为可能。可以说,心血管学界是50万UK Biobank志愿者所付出信任的最大受益群体之一,而这份信任,绝非一句"方法学部分引用UK Biobank"就能轻易回报。

2.2 "去标识化"≠"匿名化"

UK Biobank在事件后强调,泄露的数据不包含姓名、住址或NHS编号等直接标识符,但同时承认,"完全消除再识别的可能性"从来就不现实。在欧盟《通用数据保护条例》和英国《2018年数据保护法》框架下,这类数据应被理解为"去标识化"或"假名化"数据,其残余可识别性取决于具体场景、链接方式与访问条件,而非"匿名化"。研究发现仅凭15项人口学变量即可正确再识别99.98%的参与者;基因组数据本身亦可通过姓氏推断与家族搜索充当准识别信息。对心血管研究而言这一风险尤为突出:高维CMR表型刻画了个体生物学的精细特征,罕见心肌病变异携带者本就属于极小亚群,多基因风险分布两端的个体同样人数稀少,一旦与出生年月、地理信息和纵向就诊数据交叉,累积的再识别风险可能远超直接标识符缺失所暗示的水平。

2.3 这不是一个英国独有的问题

"UK Biobank是新一代人群规模数据资源中最具显示度的代表,但绝非孤例。美国All of Us、中国慢性病前瞻性研究项目、开滦研究、日本生物样本库、FinnGen、德国国家队列与Our Future Health,都在UK Biobank无法独自完成的领域作出了不可替代的心血管贡献,从跨族裔多基因风险评分验证,到东亚人群特有的危险因素发现,再到千万级参与者的深度表型扩展。这些资源共同支撑着SCORE2、Pooled Cohort Equations等心血管风险预测工具在不同人群中的国际验证。任何一个核心生物样本库的重大数据事件,都将动摇其余资源的公信力,并迟滞心血管预防在不同人群间的公平推进。"

2.4 不作为的代价:心血管研究将付出什么?

2026年的两起事件不仅造成即时损失,更可能在心血管研究中留下三重深远后果:数据导出管控收紧或将阻碍心血管风险算法的跨界外部验证;深度学习ECG与CMR表型等AI模型因严格环境与算力不足而停滞在当前泛化水平;反复发生的治理失败将侵蚀公众信任,使新一代心血管队列招募更加困难。每一重后果都不是收紧准入的理由,而是更应推动行动的呼声,真正的解法在于充足的算力、联邦学习框架与统一的跨界访问程序,让正当的国际验证不再成为正当安全收紧的"附带损伤"。

2.5 心血管科学界的行动倡议

心血管期刊编辑既不是数据托管方,也不是法律监管者或司法审计人,生物样本库治理的首要责任,仍在数据托管方、伦理审查机构、研究单位与代码托管平台。但作为科学传播的关键节点,期刊拥有一个不可替代的政策杠杆:让开放科学的要求与人群规模数据的契约义务和伦理责任同向而行。向心血管学界提出五项分级行动建议:

•行动一:TRE默认分析声明,要求作者声明个体水平分析(包括CMR内表型、深度学习心电图解读、多基因风险评分构建)是否在托管方批准的安全平台内完成。

•行动二:数据与代码可用性声明改革,以生物样本库专用语言取代"如有合理需求可获取数据"等通用表述,使其与样本库实际访问规则一致。

•行动三:代码仓库扫描机制,建立投稿前的自查清单与自动扫描,重点防范ECG波形、CMR DICOM文件、PLINK/BGEN基因型文件被无意嵌入Jupyter或R notebook的风险。

•行动四,高再识别风险研究的额外治理审查,对多基因风险极端人群、罕见心肌病变异携带者、高维CMR表型等研究执行更严格审查,参照NIST SP 800-188框架与最小单元格(k-匿名)规则。

•行动五:跨界问责生态建设,建立事件通报渠道、机构调查程序、按比例的处分机制,让对数据使用协议的遵守,不再被视为官僚摩擦,而是对参与者信任最基本的伦理回应。

2.6 期刊之外:机构、资助方与研究者的同行责任

期刊的五项行动是必要的,却远非充分。生物样本库治理的可持续性,需要整个研究生态系统的协同承担。研究机构应将生物样本库数据治理纳入既有的科研诚信体系,对项目负责人与学生开展关于访问协议、输出审查与再识别风险的强制培训,并将遵守数据使用协议视为与伦理审批同等严肃的合规要求。资助机构应将"研究使用何种安全分析环境"作为项目立项的前置条件,并明确预留在该环境中开展研究所需的算力与人员预算。研究者本人,尤其是日益通过计算路径进入心血管学科的年轻学者,应将生物样本库治理培训视为方法学教育的核心组成部分,与研究设计和统计推断同等重要。

总结

一份我们不能辜负的社会契约

将这两起事件解读为"反对开放科学"的依据,将是一种误读。真正的开放科学,意味着开放的方法、开放的代码与可重复的分析,这些追求与对参与者数据的严格守护并不矛盾,反而相辅相成。可信研究环境(TRE)虽曾被批评以技术保障替代人际信任,但UK Biobank的此次停摆恰恰说明了相反的事实:不受控的数据外泄,对科学造成的影响远比一个治理良好的安全环境更深、更广。研究分析平台的临时关闭,让60多个国家、超过2.2万名注册研究者的工作骤然中断,这一事实本身便提醒我们,治理疲弱与监管过度,同样可能成为科学进步的阻碍。技术手段可以守护参与者的信任,却永远无法替代信任本身。在英国,有50万人;在全世界,还有数百万人。他们之所以愿意把自己的健康数据托付给科学,是因为他们相信这能帮到别人。我们这一代心血管学者的使命,就是让今天的科研基础设施,配得上下一代愿意继续把信任交给我们的志愿者。

第一/通讯作者

刘阳

北京大学公共卫生学院

博士生研究生

刘阳,中共党员,北京大学公共卫生学院流行病与卫生统计学(健康数据科学)博士研究生,重点关注心血管代谢疾病的人群防控策略与机制解析。入选“2025中国科协青年科技人才培育工程博士生专项计划”,曾荣获“研究生国家奖学金”、“高层次应用型公共卫生人才培养项目-腾讯奖学金”、“Cardiac Research优秀青年编委”、“辽宁省优秀毕业生”等重要荣誉。基于我国中国慢性病前瞻性研究、开滦研究、青航队列、中国健康与养老追踪调查等大型数据库开展研究,提出服务于国民的系列本土化研究证据。以第一作者(含共同)于Stroke、Eur J Prev Cardiol、Food Res Int等国际期刊发表研究性SCI论文10篇(中国科学院一区6篇,二区4篇),中文核心期刊2篇(中华高血压及中华心血管病杂志),共计参与发表研究性论文>30篇,受邀担任Cardiac Research科学编辑、European Heart Journal以及Alzheimer’s & Dementia等国际期刊同行评审专家。

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
研究揭示:精神疾病之间可能存在基因共性 要坠落?NASA机器人紧急上天救援
轻夸克希格斯相互作用研究取得新进展 我国攻克硅基量子芯片关键材料
>>更多
 
一周新闻排行
 
编辑部推荐博文