近日,《自然》杂志对“可能在未来一年对科学产生影响”的7项技术进行了综述。这些技术包括完整版基因组、蛋白质结构解析、量子模拟、精确基因组调控、靶向基因疗法、空间多组学、基于CRISPR的诊断等。
完整版基因组
2019年,当端粒到端粒(T2T)合作组成立时,大约有1/10的人类基因组仍然未知。但现在,这个数字已经降到了零。在2021年5月发表的一篇预印本论文中,该合作组报告了第一个人类基因组的端到端序列,为广泛使用的人类参考基因组序列GRCh38增加了近2亿个碱基对,并为人类基因组计划完成了最后一章。
GRCh38于2013年首次发布,是一个很有价值的研究工具,也是绘制测序序列的支架。但它们不够长,不足以清晰地绘制高度重复的基因组序列。
长读长测序技术被证明是之前规则的“改变者”。这一技术由美国太平洋生物科学公司和英国牛津纳米孔技术公司开发,可以在一次读取中对数万甚至数十万个碱基进行排序。2020年,当T2T合作组首次重组单独的X染色体和8号染色体时,太平洋生物科学公司的测序工作进展已经可以让T2T合作组科学家检测到长片段重复序列的微小变化。这些微妙的“指纹”使长而重复的染色体片段变得容易处理,基因组的其余部分很快归位。牛津纳米孔技术公司平台还捕获了许多调节基因表达的DNA修饰,T2T合作组能在全基因组范围内绘制这些“表观遗传标记”。
美国洛克菲勒大学遗传学家、脊椎动物基因组项目主席Erich Jarvis说:“我认为,在未来10年内,端粒到端粒的基因组组装将是一种常态。”
蛋白质结构解析
过去两年,实验和计算方面的进展提供了“互补”的工具,让研究人员以前所未有的速度和分辨率确定蛋白质结构。
位于英国的DeepMind公司开发的AlphaFold2结构预测算法依靠“深度学习”策略,从折叠蛋白质的氨基酸序列推断其形状。自从2021年7月公开发布以来,AlphaFold2已应用于蛋白质组学研究,以确定在人类和20个模式生物中表达的所有蛋白质结构,以及鉴定Swiss-Prot数据库中近44万种蛋白质的结构。同时,冷冻电镜(cryo-EM)的改进也使研究人员能用实验方法处理最具挑战性的蛋白质及其复合物。cryo-EM用电子束扫描快速冷冻的分子,生成多个方向的蛋白质图像,然后通过计算将其重新组装成3D结构。cryo-EM硬件和软件的改进,使得两个团队在2020年获得了1.5埃以下的结构分辨率,确定了单个原子的位置。
还有一种名为冷冻电子断层扫描的相关的技术也相当令人兴奋,这种方法可以在冰冻细胞的薄片上捕捉到自然发生的蛋白质行为。
量子模拟
量子计算机以量子比特的形式处理数据。通过名为纠缠的量子力学现象耦合在一起,量子比特可以在一定距离内相互影响,并显著提高计算能力。
多个研究团队已成功地将单个离子用作量子比特,但它们的电荷使其难以进行高密度组装。法国国家科学研究中心的Antoine Browaeys和美国哈佛大学的Mikhail Lukin等物理学家正在探索另一种方法。研究小组使用光学镊子在紧密排列的2D和3D阵列中精确固定不带电的原子,然后用激光将这些粒子激发成大直径的里德堡原子,使其与附近原子纠缠。
短短几年时间里,技术进步提高了里德堡原子阵列的稳定性和性能,量子比特数量也从几十个迅速扩展到几百个。
Browaeys估计,这种量子模拟器在一两年内就可能商用。这项工作也为量子计算机的更广泛应用铺平了道路。
精确基因组调控
尽管CRISPR-Cas9技术拥有强大的基因组编辑能力,但它更适合于让基因失活而非修复。这是因为尽管将Cas9酶靶向基因组序列相对精确,但细胞对随后双链切割的修复却并不精准。
美国哈佛大学化学生物学家刘如谦表示,大多数基因疾病需要的是基因修正而非基因破坏。为实现这一目标,刘如谦团队已经开发了两种很有前景的方法。
两种方法都利用了CRISPR的精准靶向能力,同时限制了Cas9在该位点切割DNA的能力。第一种方法被称为碱基编辑,它将催化受损的Cas9与一种酶结合,这种酶有助于一种核苷酸向另一种核苷酸的化学转化。不过,目前只有特定的碱基—碱基转换可以利用这种方法实现。第二种方法被称为引导编辑,它将Cas9与逆转录酶相联系,并使用一种经过修改的向导RNA,以将所需的编辑内容整合到基因组序列中。通过多阶段生化过程,这些成分将向导RNA复制到最终取代目标基因组序列的DNA中。
重要的是,这两种方法都只切割一条DNA链,对细胞而言,这是一个安全性更高、破坏性更小的过程。
靶向基因疗法
基于核酸的药物可以在临床上产生影响,但其可应用的组织仍有诸多限制。大多数治疗需要局部给药或自患者体内提取细胞进行体外处理,然后再移植回患者体内。
腺相关病毒是许多基因疗法的首选载体。动物研究表明,仔细挑选合适的病毒,结合组织特异性基因启动子,可以实现局限于特定器官的高效药物递送。然而,病毒有时很难大规模生产,还会引起免疫反应,破坏疗效或产生不良反应。
脂质纳米粒是一种非病毒载体,过去几年发表的多项研究显示了对其特异性进行调控的潜力。例如,美国得克萨斯大学西南医学中心生物化学家Daniel Siegwart和同事开发的选择性器官靶向技术有助于快速生成和筛选脂质纳米粒,以找出能有效靶向组织(如肺或脾脏)细胞的纳米粒。
空间多组学
单细胞组学的发展意味着研究人员能很容易地从单个细胞中获得遗传学、转录组学、表观遗传学和蛋白质组学方面的见解。但单细胞技术将细胞从其原始环境中剥离出来,这一过程可能遗漏关键信息。
2016年,瑞典皇家理工学院的Joakim Lundeberg团队提出了一种处理这一问题的策略。该团队用条形码寡核苷酸(RNA或DNA的短链)制备了载玻片,这些条形码寡核苷酸可以从完整的组织切片中捕获信使RNA,这样每个转录本都可以根据其条形码对应到样本中的特定位置。
此后,空间转录组学领域迎来了爆发性的发展。目前,已有多种商业系统可用,学术研究团队也继续研发新方法,以更好的深度和空间分辨率绘制基因表达图谱。比如,现在有研究团队正在他们的空间图谱上叠加组学数据。Lundeberg团队也改进了他们的空间转录组学方法,以同时捕获DNA序列数据,这使得他的团队可以开始绘制肿瘤发生背后的时空事件。
基于CRISPR的诊断
CRISPR-Cas系统精确切割特定核酸序列的能力,源于其作为细菌“免疫系统”抵御病毒感染的作用。这一联系启发了该技术的早期采用者思考其对病毒诊断的适用性。
Cas9是基于CRISPR的基因组操作的首选酶,但基于CRISPR诊断的大部分工作都使用了一个名为Cas13的靶向RNA分子家族。这是由于Cas13不仅能切割向导RNA所靶向的RNA,还能对附近的其他RNA分子进行“旁系切割”。许多基于Cas13的诊断都使用报告RNA,将荧光标记“拴”在抑制荧光的淬灭分子上。当Cas13识别病毒RNA并被激活时,它会切断报告基因并从猝灭分子中释放荧光标记,产生可被检测的信号。有些病毒会释放很强的信号,可以在不扩增的情况下检测到,大大简化了即时诊断。
例如,研究人员就展示了一种快速、基于鼻拭子的CRISPR-CAS试验,使用手机摄像头对新冠病毒进行无扩增检测。
其他Cas酶有望继续扩充这个诊断工具箱,包括Cas12蛋白,他们表现出与Cas13相似的特性,但其目标是DNA而非RNA。这些酶可以检测范围更广的病原体,甚至可以有效诊断其他非传染性疾病。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。