2017年诺贝尔化学奖颁给了在开发用于溶液中生物分子高分辨率结构测定的冷冻电镜技术方面作出贡献的3位科学家。如今,这项诺奖成果的科学应用成为全球最大超算竞赛ASC18的赛题。来自全球超过300支大学生队伍将在接下来几个月内,完成这项世界顶尖科学成就的应用挑战——冷冻电镜三维重构软件Relion的计算优化。
冷冻电镜是重要的结构生物学研究方法,旨在获得核酸和蛋白等生物大分子的结构,进而阐释其功能机制。在过去的两年里,冷冻电镜技术完成了自上世纪70年代以来最大的技术飞跃。相比X射线晶体衍射技术和核磁共振技术,冷冻电镜技术的优势在于能更好地保存生物大分子的结构完整性,并且获得高清晰度的三维图像。利用这项技术,科学家可以更深入地研究各类生物大分子结构,探寻生命活动的规律,从而理解生命。
冷冻电镜技术主要包含三大环节,首先需要对样品进行快速冷冻,使蛋白质和所在的水溶液环境迅速从溶液态转变为玻璃态,玻璃态能使蛋白质结构保持其天然结构状态。随后通过冷冻成像来保存样品的高分辨率结构信息,并获取二维投影图像。最后,利用三维重构将二维图像通过计算得到三维密度图。
对于冷冻电镜技术来说,技术难点远非单纯冷冻,冷冻成像和图像处理算法一直都是瓶颈。冷冻电镜技术从生物大分子溶液的冷冻—玻璃化开始,需要以高通量的方式收集数以千计的高质量冷冻电镜显微照片,随后的图像处理包括显微照片校正和评估、对比度传递函数(CTF)估计、粒子选取和排序、二维和三维分类、定向精化和重建以及后处理。这需要先进的计算资源配合有效的算法才能实现。从冷冻电镜技术诞生以来的近30年里,快速高效的图像处理算法包括三维重构一直是这个领域内最大的计算挑战。
ASC18赛题提供了一个人类载脂蛋白铁蛋白的冷冻电镜数据集,要求参赛队伍采用最新的超算技术使用冷冻电镜领域最通用的软件Relion对排序后的粒子图像执行2D分类、3D分类、3D模型重构任务。这道赛题的挑战在于,参赛队员需要在保证最终3.3埃米分辨率的前提下尽可能降低计算时间。参赛队伍需要提交的文件包括一篇关于超算系统环境如硬件平台、操作系统、并行库、数学库的介绍和评估与优化方法的说明文档,以及Relion的输出文件2D分类图像、3D分类图像和3D重构图像。
ASC世界大学生超级计算机竞赛是由中国发起的世界最大规模的大学生超算竞赛,发韧于2012年,经过7年发展,影响力不断攀升。迄今为止,ASC 竞赛已吸引到全球超过 5500 名年轻人才参与,参赛队伍总数超过1100支。(闫洁)