生物的基因组是由A,T,G和C四个核苷酸组成的。科学家已经发现一个基因组不同区域的定长核苷酸串(譬如双核苷酸串有6个,分别为AT,AG,AC,TG,TC和GC)基本一致。最近,佐治亚大学系统生物学实验室的科学家周丰丰博士发现,通过将一个基因组不同区域的所有定长核苷酸串的出现频率映射为不同颜色的图形方式,可以非常直观有效的表现出以上特征(见上图)。
该特征被称为一个基因组(或者一条染色体)的条形码。进一步分析表明,同一个物种不同染色体的条形码互相比较相似,不同物种的基因组(或者染色体)的条形码有一定的差别。真核生物、原核生物、叶绿体和线粒体的条形码可以非常清晰的分隔开。这些特性可以大大提高超基因组学(metagenomics)的分类研究。一个基因组(或者染色体)的条形码中可能存在一些具有不同条形码的区域。研究表明,这些区域可能是通过水平转移等机制从其他物种中得到的。
该成果发表于《BMC生物信息学》(BMC Bioinformatics)。(来源:生物谷)
更多阅读