当前位置:首页 > 技术分享 > 正文

比较系统基因组和转录组为了解固氮根瘤共生遗传复杂性提供了见解

编译:微科盟楼楼,编辑:微科盟景行、江舜尧。导读植物与固氮细菌的根瘤共生现象(RNS)是被子植物的一个分支——结瘤固氮分支(NFNC)的一个独有现象,这一分支的植物也是豆科植物中研究最多的。可能是因为1亿多年前由一个共同祖先分化而来(假说Ⅰ),也可能是不同起源在同一段时间内趋于相似(趋同演化)(假说...

编译:微科盟楼楼,编辑:微科盟景行、江舜尧。导读植物与固氮细菌的根瘤共生现象(RNS)是被子植物的一个分支——结瘤固氮分支(NFNC)的一个独有现象,这一分支的植物也是豆科植物中研究最多的。可能是因为......

编译:微科盟楼楼,编辑:微科盟景行、江舜尧。

导读

植物与固氮细菌的根瘤共生现象(RNS)是被子植物的一个分支——结瘤固氮分支(NFNC)的一个独有现象,这一分支的植物也是豆科植物中研究最多的。可能是因为1亿多年前由一个共同祖先分化而来(假说Ⅰ),也可能是不同起源在同一段时间内趋于相似(趋同演化)(假说Ⅱ),总之,结瘤物种之间有许多相似之处。无论如何,对多样化结瘤物种的比较分析可以为结瘤的制约因提供见解——对于功能性共生什么必须获得或不能失去的以及共生关系中的变化空间。然而,关于结瘤,特别是豆科植物以外的结瘤,仍有待探索。在本研究中,为了阐明根瘤共生,研究者对88个物种(NFNC分支+外群)进行了大规模的系统基因组分析,并辅以151个RNA-seq文库。研究结果进一步证明了转录因子NIN作为结瘤的主要调节因子的独特性,并确定了影响其在结瘤固氮分支(NFNC)中功能的关键突变。而比较转录组学评估揭示了不同根瘤植物中根瘤特异性上调基因,同时也鉴定了根瘤特异性及氮响应基因。在选定的四个代表性物种中,大约70%的共生相关基因是高度保守的,而防御相关基因和宿主范围限制基因往往是谱系(目)特异性的。此外,还发现了超过90万个保守的非编码元件(CNEs),其中超过30万个是(结瘤固氮分支)NFNC样本物种所特有的。结瘤固氮分支(NFNC)特有的保守非编码元件(CNEs)富含活性H3K9ac标记,并与可接近的染色质区域相关,因此是固氮共生相关基因的候选调控元件。这些发现为结瘤进化提供了新的见解,并为重要农业作物根瘤共生(RNS)性状的工程设计奠定了基础。

论文ID

原名:Comparativephylogenomicsandphylotranscriptomicsprovideinsightsintothegeneticcomplexityofnitrogen-fixingroot-nodulesymbiosis

译名:比较系统基因组学和系统转录组学为了解固氮根瘤共生的遗传复杂性提供了见解

期刊:PlantCommunications

IF:10.5

发表时间:2024年1月

通讯作者:程时锋,

DOI号:10.1016/

实验设计


结果

1结瘤固氮分支物种新的基因组和转录组序列

放线菌根瘤植物的系统发育多样性丰富,然而,相比于豆科植物,放线根植物可用的基因组和转录组数据十分匮乏。为了填补这一空缺,研究者在原有样本基础上增加了三种植物:(1)最近也是刚被测序的山毛榉目非结瘤成员—欧洲山毛榉(Fagussylvatica);(2)不结瘤的仙女木(Dryasoctopetala)与结瘤的亮黄仙女木(Dryasdrummondii)互为补充,形成同一蔷薇属中的一对比对;(3)同属于蔷薇属的结瘤植物羚梅(Purshiatridentata)(图1)。

研究者使用传统的鸟枪法测序,对以上增加的三个物种的基因组进行测序,对基因组进行组装后,从中获得了28191个注释基因,中获得了23155个注释基因;中获得了35140个注释基因。研究者将277个已鉴定与豆科植物共生相关的基因和这三个基因组的基因进行序列比对,发现在这三个物种中均存在同源基因。随后,研究者发现,关键的结瘤调节因子NIN在非结瘤的仙女木()中是一个假基因,其与同属的亮黄仙女木()相比,缺失了69个核苷酸(21个氨基酸)(补图1)。这与另一种非结瘤植物欧洲山毛榉()形成鲜明对比,后者的NIN与其他非结瘤植物一样完好无损。


2没有证据支持个体基因趋同

结瘤过程中募集的蛋白质可能进化出新的、结瘤特异性的氨基酸。在假说II中,这种变化可能会收敛地发生,例如,结瘤物种将共享非结瘤亲缘物种所没有的位点。研究者进行了一项测试,这一测试之前被其他研究者用于证明回声定位哺乳动物(蝙蝠和海豚)基因组数百个基因中少数氨基酸的趋同进化。研究者选取了30个结瘤物种和50个亲缘关系很近的非结瘤物种的基因组,以及8个外群物种(图1)。绝大多数被检测的同源基因(4412/4413),包括全部54个共生相关基因,和预期中一样,生成的基因树与物种树的系统发育模式一致(图2)。为了证明趋同进化,研究者比较每个基因座对这种拓扑结构和一种结瘤物种被迫形成一个单系群体的拓扑结构的支持程度,然而未发现具有显著趋同进化信号的位点。Parkeretal利用这种基于拓扑结构的方法研究与哺乳动物回声定位进化相关的趋同进化,这种方法被认为过度预测了趋同进化。因而,研究者认为,他们以上得到的结论是可靠的,即结瘤植物共生固氮性状进化过程中不存在趋同演化。


图2.基于数千个基因正群对RNS(结瘤固氮共生)起源的两种假说的系统发育推断:建立了两种进化情景。(A)假说Ⅰ.单一祖先起源多重独立丢失假说,该假说认为,结瘤固氮分支的植物拥有共同祖先,在进化过程中逐渐出现在固氮结瘤共生中发挥作用的新基因或者突变。(B)假说Ⅱ.在结瘤固氮分支植物类群的进化过程中,先是发生了一种普遍的遗传变化,然后是在不同的谱系(目)中独立出现了相似的结瘤共生功能,这是一种平行进化的现象。(C和D)利用树拓扑推断法和比对法确定哪些基因家族遵循本文提出的假说I(左)或假说II(右),并检测来自不同目的结瘤物种的同源序列中的趋同信号(没有趋同信号被视为H0,如假说I所示;存在趋同信号被视为H1,如假说Ⅱ所示)。共有4412个基因支持H0,其中54个为固氮共生相关基因,只有一个单一的非共生基因支持H1。

3基因家族扩张

像结瘤这样复杂的新现象的起源可能涉及到基因家族的扩张;在独立起源的情况下,扩张可能涉及一些相同的基因家族。此前已在较小的物种子集上进行了测试,揭示了基因家族扩张的证据,但并没有为单一祖先起源多重独立丢失假说或多重独立起源趋同演化假说提供明确支持。因此,研究者在更大物种规模上对结瘤和非结瘤物种之间基因拷贝数的显著性进行了关联检验。在88种带有基因注释的物种中检测到候选同源群(53657个OGs)后,发现与非结瘤物种相比,有96个基因家族在结瘤物种中发生了扩张(t检验p<0.01,平均拷贝数差异>1),几乎所有这些扩张都是目特异性基因扩张,不同结瘤目之间没有趋同进化趋势。并且,在这96个扩张的基因家族中,有8个编码蛋白和豆科植物的固氮共生相关(图3A),这可以用先前证明的结论解释:豆科植物复杂的祖先多倍化可能导致了共生基因的复制。多样结瘤谱系中不同基因家族的扩张可能是由于在单一起源后结瘤的细化(假说I)或结瘤的独立起源(假说II)。更复杂的情景可能涉及家族成员的丢失,尤其是在假说I下。

随后,研究者试图鉴定在非结瘤物种中经历了丢失或突变成假基因的同源基因。为避免由于不同研究中基因组数据质量的差异(包括测序、组装、注释或比对)而导致对存在/缺失变异结果的错误解读,研究使用了一组阈值来定义结瘤物种中同源基因的存在(50%–100%存在,6个条件)和非结瘤物种中同源基因的缺失(50%–100%缺失,6个条件),从而产生了36个条件。最后,研究者将非结瘤物种中同源群的多重缺失定义为至少在70%的结瘤物种中存在同源群,而至少在60%的的非结瘤物种中不存在同源群,通过基因-性状存在/缺失变异关联研究,发现461个同源群,这其中包括先前报道的基因(NIN和RPG)和另外3个共生基因(IAG12、CNGC15a、BZF)(图3A)。这些基因在早期信号传导(CNGC15a)、根瘤菌/弗兰克氏菌感染(RPG,IAG12)和根瘤器官发生(NIN,BZF)中发挥重要作用。

4关键结瘤相关基因NIN在结瘤固氮分支(NFNC)中的亚/新功能化

为了从结瘤固氮分支特异性的蛋白编码基因的角度评估基因组创新和结瘤的相关性,研究者对每个基因家族进行了系统发育分析及每个家族成员进行了互惠最佳匹配搜索(RBH),以检测快速进化的基因、基因亚群,或者对于结瘤固氮分支具有潜在特异性的新功能化序列。最终,鉴定出了37个同源基因家族或亚家族,这些基因家族或亚家族在所有外群分类群中都不存在,但在至少60%的结瘤固氮分支物种中存在。而这37个同源基因簇中,发现NIN是唯一一个已经进行功能验证的参与结瘤共生的基因簇。随后,研究者进一步评估这37个候选同源基因簇中物种数量和基因之间的显著相关性以及这些物种是否结瘤,同样地,NIN与结瘤表型的相关性最为显著(图3C)。研究者重建了基因组和转录组数据集(包括1KP转录组)中所有检测到的NIN和NIN样蛋白(NLP)家族成员的系统发育树(图3B),发现与其他豆类相关的研究结果保持一致。保守的NLP类基因家族成员是硝酸盐反应的主要调节者,该家族的起源可以追溯到绿色植物的共同祖先。之后经历了至少三次的重复复制事件,进化出了4个NLP亚群。与先前研究的观察结果一致,NLP亚群3(NLP3)中的重复事件发生在分支分化的早期(图3C,duplication3),并产生了两个相似的分支,其中一个包括NIN(在NFNC成员中)及其同源物(在其他分支中)。

为了确定可能导致NLP由原始未知功能向NIN的关键结瘤功能转变的序列变化是一次性的还是收敛性的,研究者鉴定了NIN的非同义突变,这些突变可能导致NFNC(结瘤固氮分支)特异性的新功能化。NIN的两处变化被认为发生在NFNC的共同祖先身上,首先是在非NFNC物种中保守的NIN的硝酸盐反应结构域(NRD)中硝酸盐感应基序的丢失或失活:与外群中的NLP3同源基因相比,本研究中涉及的根瘤菌固氮共生植物,包括非豆科的热带大麻科树,其NIN基因中携带独立的点突变或小的缺失,并且在豆科植物的NIN中该基序的缺失更大(图3D)。在拟南芥中,这一硝酸盐感应基序中一丝氨酸残基(S205)的磷酸化对于AtNLP7编码蛋白从细胞质到细胞核的转运及其下游硝酸盐应答基因的激活是不可或缺的。相反地,在苜蓿属植物中,NIN丧失了感知硝酸盐并进入细胞核的能力。另一个NFNC特异性突变发生在NINNRD结构域的363位:一个氨基酸突变成苏氨酸(363T事件)。这个363T位点是唯一一个只发生在NFNC的MRCA上的NIN特异性突变。随后,研究者使用不同的LjNIN变体,包括苏氨酸替换为丙氨酸和苏氨酸替换为天冬氨酸,对LjNIN-2突变植株进行了互补实验。接种百脉根中慢生根瘤菌(Mesorhizobiumloti)MAFF303099后观察不同LjNIN突变株的结瘤表型及每株的平均结瘤数。然而,互补突变体和野生型植株的平均结瘤量没有显著差异,这表明363T位点并非影响结瘤的唯一因素。关于NIN在结瘤和非结瘤物种中的结构和功能还有待进一步研究。

在缺氮条件下接种固氮细菌后,NIN同源基因几乎只在结瘤物种的结节和桤木的根部高表达(图4B),而NLP3同源基因在缺氮根中相对高表达。有几个基因与NIN共表达:如根瘤中的GLB1和SST1(图4A),根中的bHLHm1和DWARF27(图4C)。

5非结瘤植物共生相关基因的转录组学分析


图3.结瘤固氮分支(NFNC)中共生相关基因的存在和缺失,以及NIN和NIN样基因家族的系统发育和结构分析。通过系统发育分析发现一些同源基因在非结瘤物种中偶然丢失,并使用OrthoFinder展示推测的基因家族收缩及扩张情况。(A)使用IQ-TREE(JTT+I+G4,1000bootstrap)对NIN/NLP蛋白进行多序列比对,并使用最大似然法构建NIN样蛋白家族的进化树。(B)在结瘤、非结瘤和外群物种中,同源基因存在/缺失与结瘤表型相关性的显著性检验。使用Fisher精确检验来推断候选基因和固氮共生之间的关系。横坐标为候选基因,纵坐标为显著性检验的p-value加权后取负对数的值,该值越大,表明该基因与结瘤的相关性越大。(C)NIN和NLP蛋白及其上游序列在不同亚群之间的保守性和变异分析,以及NRD(NIN蛋白中的硝酸盐应答结构域)区域的进化变化。


图4.NFN分支中结瘤植物和非结瘤植物内部和之间对硝酸盐处理和/或接种固氮细菌条件下的差异表达基因。NFN分支(左图)中代表性结瘤物种(红字)在接种氮适应性细菌(N-B+处理)后根和根瘤中基因表达变化。根据基因表达量的TPM值,使用R包hclust对根瘤基因表达谱进行层次聚类分析。N,氮;B,固氮细菌;+,包括;-,不包括。(A)NIN和NLP-3在不同物种及不同处理条件下根和根瘤中的表达水平(TPM)。(B)不同处理下(N+B-,N+B+,N-B+,及N-)结瘤植物桤木和相近非结瘤物种桦树中同源的共生相关基因的表达量(TPM)比较。(C)根中不同处理(外源硝酸盐和弗兰克氏菌)条件下差异表达基因的总体分析。条形图表示不同处理下上调的基因数量,不同颜色表示不同的处理条件:蓝色,5mM硝酸盐;红色:接种弗兰克氏菌;紫色:5mM硝酸盐及接种弗兰克氏菌;灰色:空白对照,不做处理。

6比较转录组学分析表明增强的固氮共生(RNS)相关基因表达网络具有很强的保守性

数百种编码基因在苜蓿属、山豆麻属及多种放线根结瘤物种结瘤过程中发挥作用。然而,有关结瘤固氮分支的不同目对于硝酸盐或者固氮细菌的应答还有待了解。基于此,研究者从结瘤固氮分支的每一个目中选择至少一个结瘤物种:山毛榉目的粗枝木麻黄(,Fagales),葫芦目的头序野麻(,Cucurbitales),蔷薇目的羚梅(,Rosales),豆目的蒺藜苜蓿(,Fabales),对这四个代表物种的根和根瘤样本的差异表达基因进行比较分析。结果发现,在粗枝木麻黄,头序野麻,羚梅,蒺藜苜蓿的根瘤中,分别有3088、1854、2517、4416个基因表达量上调;而根部上调的基因数量相对较少,分别有2459、1183,2161、3411个(图5D)。随后,研究者分析结瘤相关基因在共生基因所属的基因家族的系统发育树上的分布情况。NIN,NF-YA1,NOOT,MCA8,NADH这5个只分布在一个单系同源基因枝上,而其他基因具有更复杂的表达模式,并在不同目中表现出目特异性的上调,这表明这些根瘤的作用可能依赖于具有谱系(目)特异性的不同基因集。此外,至少有6个与共生相关的基因(CHIT5、NF-YA1、CP6、NFH1、NIN、RSD)存在于结瘤的各个阶段,并在这4个结瘤物种的基因组中都呈现上调趋势(图5D)。

接着,研究者进行了全基因组系统评估,评估了同源基因组的保守性与跨谱系基因表达水平的关联性。对上述四个代表性结瘤植物物种的基因进行分类:在四个目中都存在的基因;在三个目中存在的基因;在任意两个目中存在的基因;在豆目或山毛榉目、葫芦目或蔷薇目中存在的基因;在两个姐妹目中存在的基因;或者是某一目的物种特有的基因(见图5A)。推测前三类基因出现在NFNCMCRA,而在两个姐妹目中存在的基因未有证据可以证明其在NFNCMCRA中的存在;它们同样可能存在于NFNC祖先中,而在其他两个目的祖先中丢失,或者起源于具有该基因的姐妹目的祖先。仅在一个物种中发现的基因推测是在从该物种回溯到其目的祖先的谱系的某个点上出现的。

为了确定277个蒺藜苜蓿共生相关基因在结瘤的哪个具体过程(如早期信号传导,结瘤器官发生等)中发挥作用,研究者计算了核心基因在目特异性基因中的比率。尽管目特异性基因在四个基因组中都占很高的比例(图5A),在结瘤的大多数细分过程中都是由高度保守的基因发挥主导作用(图5B),这在参与根瘤器官发生的过程中尤为显著,其次是早期信号,根瘤菌感染,根瘤代谢和运输,以及根瘤的自动调节。除此之外,参与其它过程的基因总数相对较少,不过目特异性基因主要在防御和宿主限制范围中发挥主导作用(图5B)。总体而言,227个结瘤相关基因中超过70%的基因是高度保守的,显著高于从蒺藜苜蓿任意挑选的相同数量(227个)基因集中高度保守的基因的比例(图5C)。

此外,研究者对根瘤和根以及结瘤固氮分支不同目之间的差异表达基因进行了分类。NFNCMRCA中存在的目特异性基因在结瘤上调基因中所占的比例要高于在结瘤下调或未有显著变化的基因中的比例(图5E)。并且,在这四个结瘤物种中,根瘤中上述比例大约是根中的两倍(图5E)。由此可见,下调基因(DEG-)和未有显著变化的(non-DEG)目特异性基因代表着在这些物种中存在但不参与结瘤的基因的基线,而目特异性结瘤上调基因的增多表明这些基因中的许多可能是在结瘤过程中不断进化。


7结瘤相关的保守非编码元件

近年来的研究发现了在共生相关基因的时空表达和调控中起重要作用的顺式调控元件(CREs)。研究者对先前报道的鉴定流程进行了整合,对88个本研究中涉及的系统多样性基因组中的保守非编码元件(CNEs)进行了广泛的鉴定和表征:将所有88个物种结合起来进行全基因组比对,然后进行CNE鉴定,从而减少假阳性结果。

为了进一步评估鉴定得到的CNEs的质量和功能,研究者将每一类CNEs与PLACE和数据库进行了比较。基于每个CNE的Z-score计算基序的富集程度,获取CNEs在以上数据库的富集程度,结果发现52.94%的CNEs至少能在一个数据库中检测到,表明这些CNEs具有潜在的功能作用。其中一个最初在大豆血红蛋白lbc3启动子中被发现的与根瘤相关的基序“AAAGAT”,其Z-score得分在所有结瘤植物中保守的CNEs中排名前十。至少有4468个CNEs含有位于共生基因附近的“AAAGAT”基序,这表明该基序在结瘤植物中的扩增可能促进了固氮根瘤共生的出现。

研究者将CNEs在蒺藜苜蓿基因组中的分布(所有931454个CNEs和331153个结瘤固氮分支特异性CNEs)和转录调控相关的各种特征(两种异染色质抑制性组蛋白标记H3K9me2和H3K27me1,活跃标记H3K9ac,以及通过ATAC-seq测定的开放染色质)进行比较(图6C,图6D)。结果发现,CNEs在根瘤和根的转录起始和结束位点周围的H3K9ac标记处富集,可能促进其相关基因的表达。有趣的是,绝大多数结瘤固氮分支特异性CNEs与活跃标记H3K9ac和活性ATACseq峰重叠和富集(图6D),这表明一些NFNC特异性CNEs是顺式调控元件(CREs),并在启动固氮根瘤共生相关基因的表达中发挥作用。

研究者还检测到两个保守的CRE。一个位于NIN翻译起始位点上游20kb的一个远端顺式调控区,这与先前报道所得结论保持一致,即该区域内假定的细胞分裂素响应元件是细胞分裂素触发中柱鞘中NIN表达所必需的,并且对于结瘤器官发生是必不可少的。而另一个豆类特异性顺式表达元件是位于LBD16a内含子中的一个NIN结合位点,LBD16a参与侧根形成和根瘤发生,其中根瘤发生依赖于NIN。


图6.结瘤固氮分支中CNEs的鉴定、分类、进化与功能分析。(A)通过全基因组比对在88个基因组中鉴定的CNEs分布的汇总统计,以蒺藜苜蓿(Truncatula)基因组作为参考。Distal-远端区域,距离转录起始位点20kb;Upstream-上游,基因上游20kb;Downstream-下游,转录终止位点上游20kb。(B)模拟实验(共10000次重复)随机选取7651个CNEs中NFNC特异性CNEs数量的频率分布。红色三角形表示7651个结瘤基因相关CNEs中NFNC特异性CNEs的数量。(C)组蛋白标记/ATAC峰的基因组区域与本研究中检测到的所有CNEs的比较。用GAT计算显著性(**P<0.001)。ChIP/ATAC数据集从。Expected:在模拟实验中,从整个基因组中随机选择相同数量的CNEs(重复10000次),得到与ChIP/ATAC峰重叠的基因组区域长度的频率分布。横坐标为转录调控相关特征,纵坐标为本研究中所有的CNEs和CHIP/ATAC峰之间重叠的基因区域长度,红色为观察值(Observed),绿色为期望值(Expected)。(D)与(C)中相同的分析,但仅针对特异于NFNC的CNEs进行。那些已经进行功能验证的CNEs,即功能性NFNC特异CNEsPACE、CE和CRE1-5,与ATAC峰重叠,并且CRE1-5还与H3K9ac峰重叠。

讨论

新测序的基因组和转录组有助于填补NFNC的重要空白。本研究来自欧洲山毛榉()、仙女木()和羚梅()的新基因组不仅增强了现有数据的系统发育多样性,而且为更可靠的比较分析提供了相关的结瘤/非结瘤对。所有227个典型豆科植物共生相关基因都在这三个物种的基因组中被发现,这一事实再次证实了这些基因在结瘤中的基本作用。假基因NIN在非结瘤物种仙女木中的发现强调了它作为少数几个基因之一在NFNC结瘤中具有独特功能。成功测序的NFNC中4个目的20个具有代表性的结瘤和非结瘤物种的新转录组,为未来在分子水平上探索结瘤的多样性和相似性提供了坚实的基础。

多年来,人们一直认为结瘤是一种复杂的现象,其中的许多成分都是从已有的过程中吸收的,这些过程在结瘤和非结瘤物种中都广泛存在,并且不仅限于结瘤物种起源的单一被子植物分支NFNC中。结瘤的独特之处在于,这些不同组分被组装成一个功能性联合体,吸引了机会致病菌,帮助它们穿过高效的器官和细胞层面的防御,利用现有的发育程序建立它们的栖息地,提供营养,并运输它们劳动的含氮果实进入植物。这个组装过程是如何发生的?是否存在中间状态,例如,类似于鸟类翅膀在用于飞行之前的关键特征的起源。如果是这样,那么现存的一些非结瘤物种是否可能起源于结瘤物种?具有部分但不是全部结瘤成分的非结瘤物种的例子将是推动在NFNC之外设计固氮共生的一个令人激动的进展,并应该加强对结瘤固氮分支中结瘤物种的近亲非结瘤物种的研究。这些植物有可能揭示假说Ⅱ中结瘤发展的过程。或者,在假说Ⅰ中,它们将代表失去了结瘤全部能力的植物,但在这种情况下,不结瘤并没有导致所有结瘤相关特征的丧失。如果是由于保留的特征仍然提供了一些选择性的好处而避免了损失,后一种情况极具研究价值。

进化生物学中的一个主要争议是关于新调控序列与蛋白质编码基因对进化创新的相对贡献。在结瘤的情况下,LjLBD16和MtSCR中特定CRE变化已被证明是豆科植物与根瘤菌共生所必需的。结瘤基因的招募可能涉及与保留着原始功能的基因相关的新调控序列的进化,使得这些序列的表征不仅对理解招募过程至关重要—包括潜在地区分两种进化假说,而且当结瘤被添加到现有的发育程序时,基因调控过程如何被修改。CNEs(保守非编码元件)包括调控元件,最近的一项研究发现了许多与结瘤相关的此类元件,并通过实验验证了其中一个元件。

本研究基于先前报道的鉴定CNEs的鉴定流程,综合建立了更优质的CNEs鉴定流程,确定了更多的NFNC特异性和RNS特异性CNEs,其中许多和共生基因相关,这为寻找与结瘤相关的调控元件提供了大量的候选元素,包括那些目前与结瘤相关的元素,以及那些可以为非结瘤物种以前的结瘤能力提供化石证据的元素。然而,CNE的鉴定和表征仍然是一项具有挑战性的任务,需要额外的高质量染色体水平基因组组装和注释,以及在调控基因组学的背景下对已鉴定的CNE进行功能验证。

研究者发现NFNC特异性CNEs与活跃标记H3K9ac和代表着染色质开放区域的ATAC-seq峰显著重叠并且富集,这种关联表明,这些NFNC特异性CNEs的一部分可能积极参与启动RNS相关基因的转录,这增加了对驱动RNS的调控机制的理解的复杂性,强调了这些CRE在这种情况下可能在调节基因表达方面发挥的作用。未来的研究可能旨在剖析这种调控的确切性质和特定的靶向基因,为RNS的调控机制提供更深入的见解。

结瘤物种的系统发育多样性为探索结瘤固氮分支这些目的物种为吸引和容纳细菌而进化出的许多不同解决方案提供了机会。不同的模块是一次组装还是多次组装的问题,虽然很吸引人,但与确定结瘤如何在分类群中产生相同的结果相比,意义就显得微不足道了。这些分类群中的一些在1亿多年前就分化了,其中包括不同的细菌,它们被放置在极为不同的结构中,尽管发育上是共同的。如果假说Ⅰ是正确的,那么在这些目中结瘤方式的差异为遗传共生的稳健性提供了线索;如果假说II是正确的,那么收敛的相似性代表了建立新的结瘤共生的要求。在任何一种情况下,都明显需要额外的系统基因组学和系统转录组学样本,并对整个NFNC的蛋白质编码基因、基因表达和保守非编码元件进行深入的比较生物学分析,如豆科植物结瘤和NFNC系统基因组学项目所建议的那样。

最新文章