来源:Frontiers of Agricultural Science & Engineering 发布时间:2025/7/24 10:08:34
选择字号:
FASE 亮文解读丨中国农大黄银花教授团队—图泛基因组分析揭示地方品种与商业鸡中结构变异的多样性

论文标题:Graph-based pan-genome analysis reveals diversity of structural variations in native and commercial chicken

期刊:Frontiers of Agricultural Science & Engineering

作者:Yiming WANG, Zijia NI, Yinhua HUANG

发表时间:15 Jun 2025

DOI:10.15302/J-FASE-2024591

微信链接:点击此处阅读微信文章

Jun 2025, Volume 12 Issue 2

· 第十二篇 ·

▎论文ID

Graph-based pan-genome analysis reveals diversity of structural variations in native and commercial chicken

图泛基因组分析揭示地方品种与商业鸡中结构变异的多样性

文章类型:Research Article

发表年份:2025年

第一作者:王乙茗

通讯作者:黄银花

Email: cauhyh@cau.edu.cn

作者单位:中国农业大学,生物学院

Cite this article :

Yiming WANG, Zijia NI, Yinhua HUANG. Graph-based pan-genome analysis reveals diversity of structural variations in native and commercial chicken. Front. Agr. Sci. Eng., 2025, 12(2): 355–366 https://doi.org/10.15302/J-FASE-2024591

· 文 章 摘 要 ·

鸡是最重要的驯化动物之一,是重要的蛋白质来源。研究鸡的遗传变异以提升其生产性能具有重要潜在价值。第二代测序技术的出现使鸡单核苷酸多态性及插入/缺失变异的精准分析成为可能,而第三代测序技术可实现结构变异的准确识别。然而,三代测序技术的高成本限制了其在群体研究中的应用。图泛基因组策略通过利用经济高效的二代测序数据实现结构变异检测,可克服这一挑战。本研究利用12个高质量基因组构建了鸡的图泛基因组。该泛基因组以线性基因组GRCg6a为参考基因组,包含2个商业品种和9个地方品种的变异信息。与线性基因组相比,泛基因组在结构变异识别效率上显著提升。基于该泛基因组,本研究预测了来航鸡中与高产蛋性能相关的高频结构变异。此外,结合二代测序与转录组学数据,发现了藏鸡中与高原适应性相关的潜在结构变异。本研究提出了一种利用泛基因组图识别鸡目标性状相关结构变异的新策略。

· 文 章 亮 点 ·

1. 构建了地方鸡的图泛基因组。

2. 鉴定出来航鸡中与产蛋相关的结构变异。

3. 鉴定出藏鸡中与高原适应相关的结构变异。

4. 提出了一种结构变异检测的方法学。

· Graphical abstract ·

· 研 究 内 容 ·

▎引言

原鸡 (Gallus gallus) 是世界上最重要的驯化动物之一,起源于红原鸡的云南南部亚种,主要分布于我国西南、泰国北部和缅甸等地区。作为驯化最广泛的家畜,其养殖数量远超猪、羊和牛等大型动物。鸡肉作为优质蛋白质来源,具有低脂高营养的特点。尽管商业品系主导市场,但地方鸡种在亚洲饮食文化中被视为特色美味,且在环境适应和育种研究中价值显著:丝羽乌骨鸡因器官高黑色素含量而罕见;藏鸡对高海拔低氧环境具有强适应性;裸颈鸡的裸颈性状则是商业鸡抗热应激的宝贵资源。

高质量参考基因组对精准鉴定遗传变异至关重要。传统依赖单一线性参考基因组 (如GRCg6a) 的方法难以全面代表鸡物种的多样性,且无法准确检测长度大于50 bp的结构变异 (SV)。这推动了泛基因组学的发展——通过整合多个个体遗传信息构建更全面的参考基因组。早期迭代组装方法虽包含多基因组信息,却无法保留个体原始序列。基于图策略的泛基因组解决了这一问题:遗传变异存储为节点,链方向编码为边,变异区域定义为“缠结区” (snarls),使基因组呈现非线性,不同单倍型以多条路径表达。

本研究利用12个鸡品种的高质量基因组,构建了鸡的图泛基因组。结果显示,其性能优于线性参考基因组,尤其在SV检测中表现出色。通过该泛基因组,本研究鉴定了品种特异的SV,揭示了与高产蛋量及环境适应相关的潜在变异,为农业动物SV研究提供了可靠的方法学。

▎材料与方法

研究从NCBI获取了2个商业鸡和9个地方鸡的基因组数据,NGS短读长数据和转录组数据分别收集自NCBI序列读取存档库和CNCB基因组序列档案库。基于图的泛基因组以红原鸡GRCg6a为参考,通过Minigraph-Cactus流程构建,包括微图构建、序列回映射、染色体拆分、多基因组比对及染色体图连接等步骤。利用VG工具将NGS数据映射到图泛基因组进行SV检测,并与基于GRCg6a的线性方法 (Lumpy) 对比。通过BEDTools鉴定与启动子区域重叠的SV,结合RNA-seq数据分析差异表达基因 (DEGs)。

▎研究结果

1. 鸡图泛基因组的构建

基于Minigraph-Cactus流程构建的图泛基因组包含来自2个商业品种 (白来航鸡和罗德岛红鸡) 和9个地方品种 (丝羽乌骨鸡、藏鸡、阿西尔鸡、康沃尔鸡、霍丹鸡、法尤米鸡、胡须鸡、裸颈鸡和泰国斗鸡) 的11个基因组,以线性参考基因组GRCg6a (红原鸡) 为参考 (图1)。图中的变异分为四类:单核苷酸多态性 (SNP)、长度小于50 bp 的插入缺失突变 (indels)、长度50–1000 bp的短结构变异 (SVs) 和长度大于1000 bp的长结构变异。泛基因组包含43,710,347个SNP、9,139,049个indels、317,533个短SVs和55,211个长SVs。这些变异的大部分与基因间区和内含子区重叠。该图泛基因组包含4691条单倍型路径、532,221,40个节点和73,118,282条边,平均每10 kb窗口含476个节点和654条边。

图1 图泛基因组构建与统计:(a) 用于构建图泛基因组的鸡品种;(b) 插入/缺失 (indels) 与结构变异 (SVs) 长度统计;(c) 插入/缺失与结构变异重叠区域统计;(d) 图中边与节点数量。

2. 图泛基因组性能评估

为评估图泛基因组,研究将高深度NGS数据 (> 40倍) 分别比对至图泛基因组和GRCg6a线性基因组。结果显示,基于图方法的比对率 (中位数>98%) 显著高于GRCg6a (图2)。利用四个鸡品种 (丝羽乌骨鸡、白来航鸡、罗德岛红鸡和藏鸡,7–15倍) 的低深度NGS数据进一步验证发现,四个品种的比对率中位数均大于98.8%。在SV检测数量上,基于图方法在来航鸡、罗德岛红鸡、丝羽乌骨鸡和藏鸡中分别检出9944、8725、8010和11970个SV,而线性工具Lumpy仅检出3246–4916个,证明图泛基因组显著提升了SV检测的灵敏度。需注意的是,RNA-seq数据在图泛基因组上的映射率略低于HISAT2,表明其流程仍需优化。

图2 鸡图泛基因组评估:(a) 基于线性基因组和基于图泛基因组的高深度测序数据比对率比较;(b) 通过VG工具对图中变异的检出率 (各品种图中结构变异检出数/图中总结构变异数);(c) 四类鸡群体低深度基因组二代测序 (NGS) 数据比对率;(d) 基于线性基因组和基于图泛基因组的RNA测序数据比对率比较。

3. 来航鸡产蛋相关SV鉴定

研究随后分析了四个群体 (来航鸡、罗德岛红鸡、丝羽乌骨鸡、藏鸡) 的高频SV,发现来航鸡具有666个特有的SV (52.4%为插入,47.6%为缺失),其中20.7%位于外显子、69.1%位于内含子、10.2%位于启动子区。尽管多数SV位于内含子,但RNA-seq分析显示,218个SV重叠基因在卵泡发育期表达,17个基因的内含子SV区域存在显著读段覆盖,提示其可能影响转录本。值得注意的是,在CLOCK基因 (昼夜节律调节因子) 内含子区鉴定到661 bp插入,该基因与BMAL1形成异二聚体,可激活卵巢STAR基因转录,调控孕酮合成。此外,还在MKI67基因 (卵泡增殖标志物) 外显子区发现61 bp缺失,可能影响繁殖性能 (图3)。

图3 来航鸡繁殖相关基因结构变异鉴定:(a) 来航鸡特异性结构变异覆盖内含子的基因表达水平热图;(b) MKI67外显子61 bp插入位点及MKI67表达信号。

4. 环境适应相关SV筛选

结合转录组数据,研究比较了来航鸡 (低地) 与藏鸡 (高原) 的中脑和大脑皮层组织,分别发现了619个差异表达基因 (DEGs)和453个DEGs。中脑中的DEGs富集于ABC转运、类固醇激素合成等通路;皮层中的DEGs则关联主要组织相容性复合体功能。其中,SULT2B1L1、HSD11B1b (类固醇合成) 和ACE (高原适应相关) 等基因的差异表达验证了数据可靠性。

进一步结合SV分析,发现藏鸡中MRPS24基因启动子区的94 bp插入可能通过调节线粒体活性增强低氧适应,来航鸡中SYTL1基因启动子区的260 bp插入可能与驯化适应相关 (图4)。

图4 预测的功能性结构变异及外显子区域表达信号:(a) MRPS24启动子区插入及MRPS24外显子区域表达信号;(b) SYTL1启动子区插入及SYTL1外显子区域表达信号。

· 结 论 ·

本研究构建了鸡的图泛基因组,并证实了其在SV检测中的优越性,揭示了来航鸡高产蛋性能和藏鸡高原适应的遗传变异基础。结合转录组数据进一步筛选出了可能调控关键形状的候选基因 (如CLOCK、MRPS24)。未来需深入验证SV功能,并优化基因组组装完整性,以推动图泛基因组在农业动物育种中的应用。

《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
中国学者研究入选联合国可持续发展案例 人工智能在黄石公园下发现8.6万次地震
研究发现调控甜瓜成熟的两个关键转录因子 月壤取水 可产燃料
>>更多
 
一周新闻排行
 
编辑部推荐博文