|
北京脑科学与类脑研究所基因组学中心主任张力: |
国产算力硬件已能很好支持基因组学科研工作 |
|

张力 受访者供图
■本报记者 赵广立
高端芯片进口受限、核心基因数据库禁止国内用户访问……诸多外部事件,让基因组学的国产科研方案从备选成为必选。但面对未充分运转的国内基因组学生态体系,科研人如何切换国产科研环境成为新问题。
近日,北京脑科学与类脑研究所基因组学中心主任张力在接受《中国科学报》专访时表示,国产算力硬件已能很好地支持基因组学科研工作。而面对国内海量基因测序与分析需求,国产软件将迎来快速发展的机遇,并逐步实现基因组学计算生态的自主与可控。
国产算力能够很好支持基因测序
“国产CPU(中央处理器)和GPU(图形处理器)在某些直接性能测试中可能不如国外最新产品,但在实际应用中,硬件参数并非决定因素,更重要的是算力设施对整个基因组学软件生态的支撑与持续优化能力。”张力强调,基因组学是数据密集型的,其研究核心是海量数据的处理和分析,而高性能计算是支撑这一过程的关键技术。
以全基因组测序为例,每1万人的原始数据就达到1PB(1PB=106GB),经初步处理后数据量通常会达到5PB。而对这种规模的数据进行处理,某些国产高性能计算平台已可支撑。
尽管国产算力设施已能较好支持基因组学研究,但要实现基因组学的自主可持续发展,生态建设仍是关键。
“软件大多用的是国外产品,国产软件不是没有,但严格说,从顶层设计到应用没有形成一个体系。”张力介绍,依托国内海量基因测序与分析需求,基于国产硬件完善基因组学软件工具链,可以应对可能出现的极端情况。
生态缺失导致科研成果转化难
建立基因组学的国内生态体系,除能防范供应链风险外,更重要的是可推进基因组学产业化应用,加快科研成果转化。
张力介绍,北京脑科学与类脑研究所基因组学中心建设时,从样本采集到数据处理的整个流程都使用国产解决方案,但研究成果落地却面临产业化“鸿沟”。
目前,北京脑科学与类脑研究所承担着由北京师范大学牵头的中国学龄儿童脑智发育队列的基因组学子任务。截至今年5月,该中心已完成6000名儿童横断队列全基因组测序,但这些测序数据如何与第三方同步、进行产业化应用,却面临一系列包括安全、产权、技术、运营等在内的问题。
“我们的数据集不仅在国内领先,在全球范围内也非常有竞争力,已有多家药企表示感兴趣。但如何实现数据安全共享,国内并没有标准化的解决方案。”张力表示,产业化难题与基因组学生态体系不完善密切相关。
目前,我国正在努力推进建立人类遗传资源保护和利用体系,通过完善的顶层设计,综合产权、技术、运营等方面打造创新模式,力图在人工智能加速药物研发的机遇窗口实现我国药物研发的“弯道超车”。
生态发展需兼容国际主流研究环境
对于如何加快国内基因组学生态体系建设,张力表示,需从兼容性、完善性和人才培养多方面入手,在兼容国际主流研发环境的情况下,逐步构建并优化国产软硬件生态。
“兼容国际主流生态并不意味着被动跟随,而是要在保证兼容性的同时,逐步构建起具有中国特色的国产生态,并培养一批能够熟练使用国产软硬件的技术人才。”张力说。
他举例,在与国内某厂商合作中,对方曾派出三四十人的团队就北京脑科学与类脑研究所500多款生物学专业软件进行优化,以适配该公司提供的算力平台。
虽然迁移最终完成了,但生物学软件都在持续迭代,若不能兼容国际主流生态或开发出国产硬件的软件版本,每个海外软件新版本迁移都需要投入大量人力和时间,这将导致使用成本大幅上升。
“在当前窗口期,需要在国产兼容生态上加快完善国产工具链,抓住人工智能加速药物研发的历史机遇,逐步建立和推广中国标准与软硬件生态。”张力说。
《中国科学报》 (2025-06-12 第3版 综合)