Aviv Regev 图片来源:Casey Atkins
计算生物学家Aviv Regev喜欢挑战一些看似不可能完成的任务。2011年,她与分子遗传学家Joshua Levin合作,测试了RNA测序的几种方法。科学家希望找到这几种技术的极限,以查看哪种方法表现最佳。他们用降解RNA或极少量的分子处理样品。最终,Levin指出,一些技术的灵敏度非常高,能检测含量低于单细胞中含有的RNA量的样本。
对于Regev而言,这似乎是个好机会。她一直在寻找探索复杂的基因网络在单个细胞中的运作机制的方法,并想了解在各个细胞中这些网络有何差异,以及最终各种细胞群体如何协同工作。
这些答案将揭示细胞如何构建复杂生物体,如人类。就职于美国博德研究所的Regev和Levin对18个来自小鼠骨髓的、看似相同的免疫细胞进行了RNA测序,结果发现其中一些细胞与其余细胞的基因表达模式截然不同。它们就像两个不同的细胞亚型。
这使得Regev想进一步推进研究,即使用单细胞测序了解人体内存在多少种不同的细胞类型、它们在哪个部位,以及如何发挥作用。Regev的实验室同时对18个细胞进行了检测,一共测定了数十万个RNA的序列,并将单细胞分析与基因组编辑技术结合起来,以了解关键调控基因被抑制时会发生什么。
结果是发现了一些新的细胞类型,例如,识别两种新型视网膜神经元。但Regev还希望找到更多的细胞类型。2016年底,她帮助推出了“国际人体细胞图谱计划”。该计划准备对人体中所有(估计37万亿个)细胞进行分类和测序。
瑞典皇家理工学院微生物学家Mathias Uhlén指出,现在测绘单个细胞的研究越来越流行了。“但我认为,人体细胞图谱计划会是历史上最重要的生命科学项目之一,它甚至要比人类基因组计划更重要。”
纽约市纪念斯隆凯特琳癌症中心计算生物学家、认识Regev已有18年的Dana Peer表示,Regev就喜欢这种大规模项目。“Regev非常独特的一点就是她的视野非常开阔。我从未见过一个科学家,能同时深入而创新地思考这么多事情。”
悬而未决
当Regev还是以色列特拉维夫大学本科生时,学生们必须在开始学习之前选择一门课程。但她不想选。“太多有趣的事情了。”她说。最后,她选择了一个先进的跨学科项目,以便同时学习多个学科,跳过学士学位,直接攻读硕士。
Regev本科期间的转折点是得到了进化生物学家Eva Jablonka的指导。Jablonka提出了一个关于表观遗传进化的备受争议的理论。Regev佩服Jablonka面对批评的勇气和坦率。Regev认为,“容易的路总是很多,但选择走困难道路的人更让人印象深刻。”
Jablonka的课程有Regev喜爱的复杂遗传学问题。而且,她表示,“基因非常有趣,但更有趣的是基因之间的相互协作。而基因彼此协作的第一媒介是细胞。”
之后,Regev在以色列魏兹曼科学研究所Ehud Shapiro实验室攻读计算生物学博士学位。2003年,她搬到了哈佛大学鲍尔基因组学研究中心。在那里Regev拥有了属于自己的独立的小团队。
Regev着重于通过观察细胞中的RNA分子分析遗传网络。2004年,她将这种技术应用于肿瘤,由此发现了不同类型癌症共享的基因表达模式,以及一些更具体的基因表达模式。到2006年,35岁的她在博德研究所成立了自己的实验室。
打破相似性
在博德研究所,Regev致力于研究如何从RNA测序数据中筛选出复杂信息。2011年,她开发了一种在不使用参考基因组的情况下,组装出完整的转录组的方法,这种技术在生物体的基因组未被深入测序时非常很重要。
当时,Levin也提出了对单个细胞内RNA进行测序的前景。在此之前,单细胞基因组学几乎是不可能的,因为技术不够灵敏,无法检测一个细胞内的微量RNA或DNA。但2011年情况开始发生变化。
Regev等人使用18种免疫细胞——也是树突状细胞,测试相关方法。Regev当时的博士后、现在就职于纽约基因组中心的Rahul Satija提到,“我当时坚持实验会证明同样类型的细胞的检测结果是相同的。”然而结果并非如此,他发现了两种完全不同的细胞亚型。甚至即使是同一亚型里,个体细胞的调控表达和免疫基因都存在很大的差异。Regev回忆,那是很小的一个研究,但却发现了很多信息。
在标准遗传测序中,研究人员会从许多细胞的混合物中提取DNA或RNA,以产生整个细胞群体的平均读数。Regev将这种方法比喻成水果冰沙。颜色和味道能提示冰沙的成分,但是其中一个甚至十几个蓝莓的味道,很容易被一堆草莓覆盖。
相比之下,“单细胞数据就像水果沙拉。你可以轻而易举地将蓝莓和黑莓分开。”Regev说。这有助于揭示细胞的多样性。生物学家可以使用单细胞基因组学对肿瘤进行序列分析,以确定哪些基因被恶性细胞表达、哪些被非恶性细胞表达、哪些被免疫系统或血管表达——这可以推动新型癌症药物的开发。
该技术还能帮助开发针对其他多种疾病的药物。在全面分析哪些细胞高表达致病基因的情况下,了解哪些基因是潜在的药物靶标更具临床意义。
实际上,Regev不是唯一一个迷恋大规模单细胞分析的人。至少从2012年起,科学家就一直想使用这些技术绘制人类其他细胞类型。加州斯坦福大学生物工程师、陈—扎克伯格生物科技中心共同负责人Stephen Quake表示,几乎同时,世界多个地区的研究组都各自提出了这种想法。
人体细胞图集
2014年前后,Regev开始举办关于细胞测绘的讲座和研讨会。英国维康信托桑格研究所细胞遗传学主管Sarah Teichmann听说了Regev的想法,并于去年联系她,问她是否愿意合作建立一个国际人体细胞图谱项目。该项目不仅需要基因组学研究人员参与,还需要研究各种组织和器官系统的生理学专家参与。
Regev抓住了这个机会,她和Teichmann现在是人体细胞图谱计划的联合负责人。该项目计划将对人体各种细胞的RNA进行测序,然后使用这些基因表达谱将细胞分类,定义新的细胞,并绘制所有细胞及其分子的空间组织方式。
该项目还旨在发现和表征人体中所有可能的细胞状态。科学家认为,人体内大约有300种主要的细胞类型,但Regev认为人体内的细胞类型和状态远超过这个数字。Teichmann 指出,现在项目还处于起步阶段。
一些科学家担心,人体细胞图谱计划将耗尽其他项目的资金和努力——这是许多类似大型国际大科学项目都会受到的批评。Regev实验室博士生Atray Dixit指出,确实有这个压力。“我们知道会得到很多重要发现,从学术意义上讲,这个项目是低风险的。但成本太高了。我们应思考如何在学术意义和经济成本之间寻找平衡。”
而且,英国剑桥大学发育生物学家Azim Surani不确定该项目能否平衡数据量和信息深度。“人体细胞图谱给你的是一幅很大的图,但你并不能深入了解不同的细胞类型,以及它们之间的关系。因此很难说人体细胞图谱计划的投入产出比有多高。”他说。
Surani也怀疑单细胞基因组学是否已经成熟到足以开展一个大项目。“技术已经成熟到你可以充分利用了吗?”他说。例如,在无偏向且不影响RNA品质的情况下,从组织中提取单细胞仍然是非常困难的。如果很多团体独立摸索这类问题,效果可能比现在直接开展大规模细胞图谱绘制要好。
很多人还担心这个项目何时才能完成。但Regev认为完成不是唯一的目标。计划是模块化的,你可以把它分解成很多碎片。她表示,即使该项目只是对视网膜中的所有细胞进行编目,也会对药物开发非常有用。“时间会证明它的价值。”她说。
现在,Regev工作起来没日没夜。而她的工作强度和高度聚焦源自于对细胞的无限热爱。“我是非常幸运的人,做的是最爱的事情。无论怎么看,细胞都是神奇而迷人的。”她说。(唐一尘编译)
更多阅读
《自然》相关报道(英文)