Rosa的基因组测序为现代月季的驯化提供了新见解
主要发现和解决的科学问题
①对Rosa进行了全基因组测序,在现代月季的驯化上提供了新的见解。
②了解了香味生物合成、颜色、开花和非生物胁迫等由哪些基因控制。
③通过比较草莓、杏、苹果和梨等其他植物,得出月季与草莓、覆盆子在进化上比较接近。
摘要:
玫瑰作为观赏植物和在香水行业有重要的文化和经济价值。通过进行了全基因组测序以及主要基因组的组装和重测序,为玫瑰的驯化奠定基础。从杂合的现代月季二倍体Rosa chinensis 中得到“Old Blush”(粉月季)这个纯合品种 ,利用单分子测序的方法得到质量较高的全基因组,通过多样性分析,确定了“La France”的起源,它是一个生长活力较强的欧洲物种和中国反复开花物种杂交的品种。通过重建次级代谢途径,从而提出了调节花气味和花色的模型。该基因组为理解玫瑰特性的机制提供了基础,并应加速玫瑰及蔷薇科观赏植物的改良驯化。
介绍:
玫瑰是世界上最常见的栽培观赏植物。在中国的种植历史悠久,极强的装饰性及治疗和美容价值使得更多的玫瑰品种被驯化出来。蔷薇属约有200种,其中一半以上是多倍体。随着种间杂交,基因渗入和多倍体化,玫瑰经历了广泛的网状进化。目前认为,只有8-20种玫瑰对目前复杂的杂交玫瑰品种Rosa × hybrida 有贡献。中国月季Rosa chinensis(二倍体)在十八世纪被引入欧洲,被认为是广泛参与欧洲、地中海和中东(主要是四倍体)的玫瑰杂交过程的主要物种之一。这些杂交产生了杂交茶玫瑰(tea rose)品种,这是现代玫瑰的亲本,具有很强的多样性。在源自中国玫瑰的繁殖性状中,开花能力以及颜色和气味特征是关键。随着最新的研究不断发现,缺乏玫瑰基因组序列,已经阻碍了研究这些性状的遗传决定因素的分子机理和育种驯化的进步。
基因组组装注释
由于自然杂交和人工种间杂交,所有玫瑰都具有高度杂合的基因组,从而在组装上很有难度,尽管它的基因组大小看起来很小,相对尺寸560 MB。到目前为止,如果试图用short reads方式装配玫瑰基因组,会导致出现数千个高度分散的scaffolds(83,139(参考文献9)和15,938(本研究))组成的装配体。为了克服这些障碍,能够有质量较好的参考基因组,所想的办法就是获得了一个纯合子基因组,然后使用long-read测序技术对其进行了测序。具体方案是,通过体外培养,将它微调饥饿处理,冷胁迫和激素处理结合起来诱导中国月季'Old Blush'小孢子从配子体切换到孢子体发育。这种方法会使小孢子引发分裂,形成纯合的细胞簇,同时还能形成可再生纯合植物的胚性愈伤组织(补充注释 2和补充图 1)。
在PacBio RS II平台上对所培养出来的纯合体测序。用40个单分子实时细胞获得80×的测序覆盖率,与单个汇编玫瑰数据的初级组件产生几百个重叠群,可以看出组装植物基因组所面临的挑战,甚至采用长读取数据。改善组装连续性的一个关键步骤是通过检测和过滤重叠图中的伪边缘。汇编器CANU在数据读取层面能够过滤数据,从而得到更精确和连续较强的组装数据。研究者还同时开发了称为til-r的软件,它也可以作为一个类似的工具来尝试清理FALCON汇编器的重叠区域(补充图 2 ; URL)。然后,执行CANU,由CANU和FALCON / TIL-R(补充说明3 ; URL)生成的六个补充原始程序集的汇编目录。最终的装配由82个contig组成,N50为24 Mb(其中N50为重叠区长度,因此整个装配体的50%包含在等于或大于该值的重叠群中),增加一个简单的邻接度量,通过三重装配来保证结果的准确性。
通过整合K5 rose高密度遗传图谱中的25,695个标记,利用其中的86.4%来构建七个伪染色体。该组件大部分(97.7%,503 Mb)的Pearson相关系数为0.986至0.996,因此说明了序列和遗传数据之间具有高度一致性。通过Hi-C染色体接触图数据的图谱(图1和补充图3)证实了基因组结构和质量较好,凭借极少数遗留差异和遗传测序数据之间的高度一致性,玫瑰基因组组装是迄今为止所获得的植物基因组中最连续的一个。
A图是Old blush的成熟花朵,B是样本物理位置和遗传位置中拟重建的染色体关系(左图);中间图x轴是表示物理位置,y轴表示遗传位置,Rhodes表示相关系数;右图中显示每个染色体的Hi-C染色体内接触图,像素的强度代表对数尺度上染色体上400-kb窗口之间Hi-C链接的计数,较深的红色表示较高的接触概率。
补充图3.染色体Hi-C接触图数据分析。
a,染色体间Hi-C接触图。 每个像素的强度代表之间的Hi-C链接的数量,较深的红色像素表示较高的接触概率。
b,协方差矩阵。 每个点表示x轴和y轴上两个值i和j之间的协方差,每个值是每500kb分别观察到的交互次数。
进化生物学的研究部分
通过比较基因组学的研究,评估蔷薇科家族中的蔷薇亚科的进化史。通过确定9个原型染色体和8,861个原生质构成的祖先蔷薇科核型(补充图5a)从而确定了保守基因。
对于的进化过程的确定,草莓和蔷薇基因组在原始的蔷薇亚科核型分为8个原生质体,含有13070个原生质体,通过一个祖先染色体分裂和两个融合,衍生出蔷薇科祖先核型。有趣的是,草莓基因组经历了额外的染色体扩增和融合,这种扩增来自于蔷薇亚科(Rosoideae),所以才达到了现代基因组结构,而蔷薇属植物,经历了一次和草莓不同的裂变和两次融合,才现代基因组结构。基于748个基因序列的系统发育表明,蔷薇、草莓和覆盆子在短时间内发散,因此暗示了蔷薇亚科内部的进化关系(补充图 5b)。
为了深入了解现代月季的构成,通过重新研究现代月季杂交品种中所涉及三个具有代表性的驯化和育种品种,观察到杂交品种基因组变异密度的离散水平(图 2b),这可能反映了不同基因渐渗程度。
上图中,a是重测序的基因型谱系图;b表示遗传结构和变异密度;c是三个代表性品种的主成分分析。
其中主要利用变异密度的变化将基因组分成35个区间(2-56 Mb),并通过主成分分析研究它们的遗传结构(图2c和补充图6)。主要研究Rosa×hybrida ‘La France’,这是一个具有欧洲月季的强生长能力和中国月季多开花能力的品种。
以拟建立的七条染色体为模式,表明Rosa×hybrida ‘La France’'这个种的基因组是具有复杂的重组进化过程,由在目标玫瑰部分代表的三个祖先的多样性池所传播的DNA片段形成(图 2a)。例如,染色体4的单倍型由Cinnamomeae,Synstylae和Chinenses基因组的组合构成,而染色体7单倍型由Synstylae和Chinenses而来,Cinnamomeae没有明显贡献。
利用中国月季杂交种的反复开花基因可能传播到Rosa×hybrida ‘La France上的推测,来鉴定可能参与经常开花的新候选基因。在TE的插入TFL1(RoKSN),TFL1是一种赤霉素,来影响花的开放,我们发现中国月季将TE传播给'La France' ,因此可能参与其反复开花。通过分析,发现 “Old blush”× Rose wichurana回交,所产生的子代表明,该基因可能可能有第二个通路。这个“第二通路”可能仅通过中国月季传输到Rosa×hybrida ‘La France 月季,因此可以位于中国月季染色体片段始发部位,例如,我们确定了转录因子的推定同源物SPT(图 3A),其已知可以控制拟南芥开花(图 3A),这是被广泛熟知的通过作用于miR156来修饰开花的基因,因此这些基因也可能会决定月季的反复开花。
颜色生物合成和一些香味途径之间的调控关系
玫瑰具有花的香气和丰富绚丽的颜色,其中部分合成控制途径已经被解释(补充注释 9和补充图7)。通过对玫瑰基因组的数据挖掘,和对挥发性有机化合物的生物化学分子深入分析,可以确定萜烯途径中至少有22个生物合成步骤没有在玫瑰中表现。
为了研究颜色和气味途径之间的关系,我们进行生物化学和分子分析,首先分析了花青素,花青素的糖基衍生物代表总花色素苷和大根香叶烯色素的99%以上。检测中国月季“Old Blush”发现,在花瓣细胞中有产生的挥发性有机化合物,分析表明,这两种化合物的生物合成是通过miR156来协调实现SPL9调控模块。在拟南芥中,SPL9是衰老植物细胞中花青素合成的阻遏物。miR156在幼株的细胞中对SPL9负调节,从而形成MYB-bHLH-WD40蛋白复合物,能激活花青素生产。本模块中,通过对“Old Blush”的花瓣的分析,在表达SPL9最大值之前,花青素合成酶(ANS)的达到峰值表达(补充图8)。在完全着色的花瓣中,我们观察到miR156的诱导表达,其与SPL9表达的下调和ANS表达的上调相关(图 3b,补充图 8和补充图 9)
miR156- SPL9调控中心通过允许先前存在的MYB-bHLH-WD40蛋白的复合来协调产生有色花青素和某些萜烯,而这些蛋白又调节两种途径的不同组分(图3)。因此,玫瑰花中的花青素合成可能与某些挥发性化合物的产生有关,因此为非标准萜烯生物合成途径的演变提供了解释。此外,这种共同调节可能阻碍玫瑰杂交种中色素沉着和特定气味的结合。
该研究的意义:
首先,为改善玫瑰品质和进一步的育种驯化奠定了基础,其次,通过获得候选基因(如涉及脱落酸合成和信号转导的候选基因)为改善玫瑰质量铺平了道路,提高了水的利用效率并延长了瓶插寿命,以及对其他特征的培育,如增加对病原体的抗性等,也可以以这些数据为基础,这能有效的减少杀虫剂的使用。
该文章的原文、补充材料及评述文章
百度云整理链接:链接:https://pan.baidu.com/s/1khqBSwr5IvSwsDj-YAFwFA 密码:r3mv
更多精彩内容,欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史