传统的系统学方法强烈地支持这个结论:龟与鸟和鳄鱼的亲缘关系最近,与蜥蜴的关系较远。而日前科学家通过基因研究发现,龟的系统发育位置存在大量的不一致性。
■本报记者 冯丽妃
龟和鸟类、鳄鱼、蜥蜴三个物种中的哪一类亲缘关系更近?中科院成都生物所的科学家提出了新的推断方法。
龟和鸟类、鳄鱼、蜥蜴三个物种中的哪一类亲缘关系更近?这是长期以来困扰国际系统发育生物学界的一个问题。
“系统发育是指某一个类群的形成和发展过程,系统发育分析即是推断或评估这些进化关系。”中国科学院成都生物所博士吕彬在接受《中国科学报》记者采访时说。然而,随着基因组时代的到来,传统的系统发育学研究方法并不能很好地适用于大数据集,阻碍了新兴的系统发育基因组学的快速发展。
对此,吕彬和成都生物所研究员傅金钟等人在对十余种物种的4500多个基因进行分析研究的基础上,提出“一个基因、一种性状”的新方法,让物种进化与系统发育学研究释放出新的活力。
“一个基因,一种性状”
利用基因组或转录组数据和基因组学方法可以解决重要类群的进化关系,并揭示物种起源与分化以及多样性形成机制等重要问题。
随着二代基因测序技术的发展,生物学的数据量呈现出爆炸式的增长。对此,很多进化生物学专家认为,滞后的研究方法和庞大的数据量的严重不对称是当前生物学研究中的一大问题。
“系统发育基因组学具有信息量大、结果可靠度高的优点,然而传统的方法在处理成千上万个基因数据时存在难以克服的速率异质性等系统误差。”吕彬告诉记者。然而,对这些数据分析方法的创新一直以来却没有跟上数据增长的步伐,过去的老方法在应对海量数据的分析时显得力不从心。
为此,在国家自然科学基金等项目的资助下,吕彬和傅金钟等科研人员新提出了“一个基因一个性状”的系统发育基因组学研究方法、以更好地适应系统发育基因组学发展的要求。
“DNA序列可以看成是由ATCG四个字母组成的文本,传统上,我们用‘一个位点’对应‘一个性状’的办法来进行系统发育分析。”吕彬解释说。比如,在同一个位点上,狗的碱基是A,鸡的碱基是G,位点的碱基不同就是区分物种的一个标志,这如同超市商品的条形码,每个商品对应的是唯一的条码。
然而,如果有大量的基因数据,由于基因以及碱基之间的速率差异很大,再用碱基位点作为性状来对物种作进化分析就会不可避免地引入系统误差。为此,吕彬等人通过生物信息学的手段,用基因代替碱基作为系统发育的性状,有效减缓了系统误差的影响。
新旧结合,互相检验
在四足动物中,龟的系统发育位置长期以来备受争议。2012年,吕彬和傅金钟等人与华大基因合作,通过测定乌龟的转录组,得到了4584个同源基因,同时使用了传统方法和“一个基因、一个性状”的新方法进行推断。
“传统的系统学方法强烈地支持龟与鸟和鳄鱼的亲缘关系最近,与蜥蜴的关系较远,但是对于每个基因的研究却发现龟的系统发育位置存在大量的不一致性。”吕彬介绍说。经过分析,课题组发现“一个基因、一个性状”的方法不仅能够更加高效地使用基因组海量数据进行计算,而且能够真实地反映出这种不确定性。
与此同时,课题组还用新旧两种方法对鸡、鳄鱼、蟒蛇等12类动物的基因组作了分析,均得出明确的结果。
“传统和系统基因组的区别就是前者用少量基因来鉴别物种,而系统基因组学是用上百和上千个基因从基因层次上去区分物种。”吕彬说。如果出现不一致,新方法与传统方法可以互相检验,二者相辅相成,能够更好地推动系统发育基因组学的普及和发展。
相关研究成果已于近日在线发表在PLoS ONE上。对此,吕彬表示,这只是第一步,课题组还将继续对方法进行完善和优化。
据介绍,课题组目前的研究都是围绕两栖爬行动物展开的,尤其是两栖动物。他表示,相关研究不仅涉及到两栖动物的起源问题,同时还可以研究这些物种从水到陆生活的适应过程,并有望通过基因检测和分析找到这些两栖类动物在水陆变化的过程中发生变化的基因,从而对人类和其他动物的起源有更进一步的认识。
除了两栖爬行类等物种之间未知的关键进化关系以外,课题组还将搜集更多编码基因探析物种进化背后的机制,并不断完善新方法,使其得到进一步推广,为系统发育基因组学研究发展出力。
《中国科学报》 (2014-03-31 第8版 基金)