
丁型肝炎病毒基因组成功载入量子计算机。图片来源:James Cavallini
本报讯 具有里程碑意义的人类基因组解码工作在21世纪初完成后,DNA测序技术迎来了爆炸式增长,而传统计算机已难以应对海量数据和激增的算力需求。这也推动了替代解决方案的发展。
如今,量子计算距离实现这一目标又近了一步。科学家宣布,他们首次将一个完整的基因组——丁型肝炎病毒基因组编码到量子计算机上,从原理上证明了这类机器未来有望助力基因组学研究。相关研究结果近日公布于arXiv。
“这是至关重要的一步。”意大利国际高等研究院的Guglielmo Mazzola表示,“想要处理基因组,首先必须把数据载入进去。”但他提醒,在量子计算机能够处理更大的基因组或真正对这些数据开展分析前,很难判断它是否会超越其他先进的技术。“量子计算能否真正带来好处,目前仍不清楚。”
与传统计算机以0和1的二进制编码信息不同,量子计算机依靠量子比特运行,后者可以被设定为0、1,或同时处于0和1的叠加态。理论上,这种并行状态让量子计算机能够处理传统计算机无法解决的问题。原则上,量子计算机可以将多种可能的答案表示为量子比特上的波状态,从而提升某些问题的优化速度。随着这些状态的演化,它们会像水面的涟漪一样相互干涉,让出现更优解的可能性更高,出现较差解的可能性更低。
这种方法有望为研究人类及其他生物体内海量的遗传变异带来希望。尽管遗传学家一直依赖以单一线性序列为代表的参考基因组,但他们正越来越多地转向泛基因组,后者被视为个性化医疗和理解病原体演化的关键,但它们在计算上很复杂。构建和分析泛基因组需要在海量、交错的序列组合“迷宫”中寻找路径,而这正是量子计算机可能擅长的任务。
量子生物计划(Q4Bio)是由惠康飞跃资助的一个5000万美元的项目。惠康飞跃是源自英国慈善机构惠康基金会的一个高风险生物医学资助机构,旨在推动此类与健康相关的量子计算应用。共有12个团队经历了一场“饥饿游戏”般的竞争——通过展示在各自领域的量子优势,换取奖励和后续融资。
由英国牛津大学的Sergii Strelchuk与惠康桑格研究所的研究人员开展的量子泛基因组项目,是进入Q4Bio决赛的6个项目之一。Strelchuk团队开发的算法,能够高效地压缩DNA序列并将其编码为量子态。
团队最初打算用感染细菌的ΦX174病毒进行测试。该病毒于1977年成为首个完成DNA完全测序的生物体。但ΦX174的5386个碱基需要一台拥有387个量子比特的量子计算机,超出了研究人员使用的具有156个量子比特的IBM处理器的能力。
团队于是转向丁型肝炎病毒,它仅有约1700个RNA碱基,是已知最小的人类病毒基因组。研究人员最终用117个量子比特成功编码了丁型肝炎病毒的遗传信息。
“我们才刚刚起步。”惠康桑格研究所首席信息官James McCafferty表示,他们目前正在商议如何处理这些编码数据。团队希望开发一个在线界面,供研究人员未来上传、处理和分析序列使用。
美国弗吉尼亚大学的Stefan Bekiranov称赞了这一技术成就,但认为量子基因组学短期内不会快速发展。Strelchuk则持乐观态度,认为未来几年,随着基因组数据压缩与编码方法的进步,加上更大、更稳定的量子计算机的出现,这项研究将变得更为现实。
Strelchuk补充说,尽管将量子计算机应用于拥有31亿个碱基对的人类基因组仍是一个遥远的目标,但研究人员可以先聚焦更短、在医学上重要且高度变异的DNA区域。
Q4Bio的其他项目团队同样也抱有乐观的预期。美国芝加哥大学的Fred Chong负责一个关于癌症生物标志物的项目,他开发了一个量子-经典混合算法,用于在海量癌症样本数据集中挖掘可用来预测疾病的模式。尽管因量子比特数量有限,该方法目前在量子计算机上仍无法超越经典方法,但Chong认为,“我们预计未来两三年内将具备这一能力”。(王方)
相关论文信息:
https://doi.org/10.48550/arXiv.2604.06106
《中国科学报》 (2026-04-22 第2版 国际)