云雾林岛植物分支的重复辐射演化（云雾林是热带雨林的一种）

文章信息

摘要

重复辐射，其中相似形式的集合在不同区域内重复进化，可以为平行进化和群落内功能多样性的组装提供有力的见解。动物中已经描述了一些案例，但在植物中，我们缺乏有据可查的重复辐射案例，这些案例结合了全面的系统发育和生物地理学分析、一组“生态形态”独立进化的地理区域的划分以及潜在潜在机制的识别。在这里，我们记录了一组新热带植物中一组叶子生态形态的重复进化。被子植物分支荚蒾属中的Oreinotinus谱系通过分离的云林环境从墨西哥传播到阿根廷。在11个特有地区中的9个地区，具有相似叶子形状的物种是平行进化的。我们拒绝相似叶子的基因流介导的进化，并表明具有不同叶子形式的物种在其气候生态位中存在差异，支持生态适应作为并行性的驱动力。我们对植物中重复辐射案例的识别为对生命之树中的此类现象进行比较分析奠定了基础。

引言

重复辐射[1,2]已在许多动物群体中得到记录，包括加勒比地区的安乐蜥蜴[3,4]、非洲裂谷湖中的慈鲷鱼[5,6]和夏威夷的蜘蛛[7,8]。在植物中，汇聚和平行进化的案例研究比比皆是，包括授粉（例如，参考文献[9]）、传播（例如，参考文献[10]）和光合作用（例如，参考文献[11]）特定模式的重复进化。）。同样，许多研究令人信服地记录了植物谱系的快速适应性辐射和形态多样化与其地理运动的关系（例如，参考文献[12-14]）。然而，这些研究并没有提供令人信服的复制辐射例子[15]。虽然一些出版物提到了植物中的这种现象[16-21]，但这些案例在范围、规模或确定性上都无法与动物中的几个现在经典的例子相媲美[3-8]。一个关键的缺失要素是对不同的EndeMism区域的界定，在这些区域中，物种形成和适应导致了一组特定“生态形态”（占据不同生态位的不同形式）的重复进化[1,2]。因此，缺乏用于深入分析平行功能多样化的可比较的植物学平台，因此很难在整个生命树中广泛比较和对比此类辐射[15]。在这里，我们记录了新热带植物分支中一组叶子生态形态的重复进化，这些植物通过地理类似于岛屿群岛的分离的云林环境实现了多样化。

荚蒾属植物（Adoxaceae、Dipsacales）包括约165种灌木和小树，它们开着小白花，由昆虫授粉，肉质单籽果实由鸟类传播[22,23]。荚莲属植物的两个谱系在约40迈尔前的始新世[24]时期从亚洲进入北美。在这些主要谱系之一中，Oreinotinus分支[25]从中新世晚期（~8-12Ma）开始从墨西哥向南传播，并迅速多样化[26]。这种辐射既不是由形态创新[25,26]触发的，也不是由染色体数量或基因组大小[27]的新变化触发的。相反，它似乎是由多种因素共同推动的[28,29]，包括向斑块分布的云林环境的转变（其特点是冠层云层频繁覆盖和有限的季节性，但每日温度波动较大[30,31]）和常绿习惯的演变[32]。如今，约42种Oreinotinus物种主要分布在整个新热带地区1,000至3,000m之间，我们已为该分支确定了11个特有山区，每个地区都存在许多物种（图1a、b，方法、扩展）数据图3、补充表1和2以及补充图2）。大多数这些地区都被众所周知的低地屏障隔开，阻碍了高海拔中湿森林植物的传播，例如特万特佩克地峡、巴拿马地峡，以及牙买加和古巴的加勒比海。它们还对应于其他云林生物研究中认可的生物地理省份（例如，我们的厄瓜多尔南部和秘鲁北部地区对应于万卡班巴洼地，而我们的哥伦比亚东部委内瑞拉地区对应于参考文献[30]的东方科迪勒拉山脉；对于墨西哥，请参阅参考文献[31]）。在此研究的40种Oreinotinus物种中，只有4种存在于11个区域中的1个以上区域。这种分布模式，加上这些物种在与植物功能相关的一组叶子性状方面的显着差异，为探索复制辐射的可能性提供了一个理想的系统。

图1 Oreinotinus的系统发育和生物地理学。a，使用时间校准的物种级系统发育和DEC模型推断的Oreinotinus历史生物地理重建（方法）。物种级提示按特有区域着色，分支/节点颜色显示最可能的(P>0.5)祖先范围。广泛分布的血统被分配多种颜色，该范围内每个居住区域都有一种颜色。灰色虚线表示P>0.5时不支持任何一个范围。除非另有说明，系统发育关系得到了很好的支持（自举值>95%），并且我们的推论对于多个节点标记的系统发育不确定性是稳健的（方法和补充图3）。b，Oreinotinus在新热带山地森林11个特有区的分布；彩色点标记植物标本馆标本位置；引脚标记了a中的加入位置（方法和扩展数据图3）。照片显示，玻利维亚塔里哈附近的图库马诺森林被云层笼罩（上图），墨西哥瓦哈卡州圣地亚哥科马尔特佩克高地云雾森林覆盖着苔藓的林下植物（下图）。c，应用于rAD-seqSNP的降维方法（方法和扩展数据图4）显示特有流行区域内和区域之间的遗传相似性。UMAP投影区分局部和全局结构匹配地理；PCA显示了整个Oreinotinus范围内的样本之间的差异：墨西哥、中美洲、加勒比海和南美洲。E=东、S=南、W=西、CA=中美洲、Oax=瓦哈卡州。

结果与讨论

系统发育和生物地理学

我们的系统发育分析基于跨越Oreinotinus地理范围的180个个体的群体基因组限制性位点相关DNA测序(RADseq)数据，映射到新的Viburnum lautum参考基因组草图（方法和补充表3）。对完整数据集的分析（方法、扩展数据图1和补充表3）表明，除了五个实例外，来自相同形态物种的多个种群的种质在所有情况下都形成进化枝（在补充说明1中进一步讨论）。在两种情况下（涉及V.sulcatum和V.fuscum的限制），我们将在其他地方描述新物种以反映我们的分子和形态学发现。此处鉴定为荚蒾属植物“新名称1”的标本似乎与V. reticulatum和V. ayavacense并列，但对这些关系的支持太弱，不足以保证命名法的改变。玻利维亚最近才被荚蒾属植物占据，我们将这一地区缺乏互惠单系性解释为由于持续的物种形成而导致谱系分类不完整的证据。在最后一个例子中，V. tinoides，我们的材料出现在两个不同的分支中。由于我们目前无法根据形态学或生态学来区分这些种群，V. tinoides被保留在这里，等待进一步研究，作为一个广泛分布的物种。

我们的生物地理学分析是在分散灭绝分支发生（DEC）框架[33]中进行的，并使用了Oreinotinus的时间校准物种树（图1a，方法，补充图1和补充说明2和3），显示了从北部、东部的渐进运动。墨西哥和瓦哈卡州、恰帕斯州和中美洲，并从那里一次进入加勒比海，一次进入南美洲（~5Ma）。物种丰富度在较长期被占领的地区较高，而在最近被占领的地区较低，与面积大小无关（例如，瓦哈卡有7个物种，而秘鲁、玻利维亚和牙买加古巴有2个物种）。

图2 Oreinotinus的叶形演化。a，左上：NMDS形态空间显示39个Oreinotinus物种的位置，根据3个定量和2个分类叶变量进行评分（方法、扩展数据图5和补充图4）。颜色对应于四种叶子生态形态：DEN、粉色；LPT，绿色；SGE，蓝色；IGE，橙色（见正文）。11个特有区域中每个区域中存在的物种都显示在同一个NMDS图上，并按叶子生态形态着色。E=东、N=北、S=南、W=西、Bol=玻利维亚CA=中美洲、Col=哥伦比亚、Cr=哥斯达黎加、Ecu=厄瓜多尔、Jam=牙买加、Mex=墨西哥、Ven=委内瑞拉。b，每个物种的代表性叶子轮廓（方法）显示了rAxML物种树上叶子形式的分布，显示了基于100个重复的分支长度和bootstrap值（黑色节点>85%）。九个特有地区包含具有两种或多种生态型的物种，四个地区包含三种生态型，一个（瓦哈卡州）包含所有四种生态型。c、代表叶：SGE、V.acutifolium(Oaxaca)；DEN，V.dentatum（外类群，北美洲东部）；IGE，V.fuscum（瓦哈卡）；LPT，V.microcarpum（墨西哥东部）。

最重要的是，大多数特有区域内的物种形成分支（图1a和2b以及扩展数据图1和2），也就是说，同一区域内的物种彼此之间的关系比同一区域内的物种之间的关系更密切。其他地区，与原位物种形成一致。瓦哈卡是一个例外，有两个独立的分支，而恰帕斯和中美洲地区与牙买加/古巴和哥斯达黎加-南美洲分支都是并系的（图1a和2b）。与这些发现惊人一致的是，应用于单核苷酸多态性(SNP)的降维方法（统一流形近似和降维投影，UMAP；主成分分析，PCA）证明了每个特有区域内物种的遗传相似性和遗传差异其中（图1c，方法，扩展数据图4和补充说明4）。具体来说，遗传结构与我们研究中地理区域的“北向南”布局强烈对应，墨西哥、中美洲和加勒比地区的三个大的不同区域与南美洲有很大的差距，其中也有几个不同的集群确定。

叶形演化

随着Oreinotinus的多样化，几种叶子形式独立于祖先的叶子形式进化而来，这似乎促进了沿着特定变异轴的重复分化（平行进化，如此处所用；图2）。我们在田间和植物标本室中区分了四种叶子形态。(1)具有中等大小卵形叶子的DEN形式，具有明显的、规则间隔的边缘齿和稀疏的柔毛。DEN形式与北美东部的Dentata分支相同[24,25]，并且可能是Oreinotinus的祖先（方法和扩展数据图6）。(2)LPT形式，叶大，背面密生星状短柔毛，边缘有齿。(3)SGE形式，叶子小而无毛，边缘完整（即，除了靠近叶柄交叉处的一对或两对腺齿（额外的花蜜腺[34]）外，没有齿）。(4)中等尺寸的IGE形式，具有无毛至疏生柔毛的分片和整个边缘。

这些叶子的形状在功能重要性方面有所不同。众所周知，叶子的大小和形状会影响光捕获、温度调节和气体交换的效率[35,36]，并且叶子的大小会随着光、温度和干旱梯度的变化而发生可预测的变化[37,38]。与叶子大小一样，叶子表面毛状体的存在具有多种功能效应：柔毛影响叶子能量芽的获取、气体交换、反射率、润湿性和对食草动物的保护[39-42]。叶缘长有牙齿的物种与中温带森林有关[43]，其中牙齿被假设是在生长季节早期促进光合作用的一种手段[44]，是进化薄叶[36]的生物力学和水力影响，或者是越冬芽内叶原基的延长发育[45]。

为了评估四种叶形的独特性，我们使用39个物种（包括来自北美东部的V.dentatum，但不包括V.hirsutum和V.membranaceum，因为我们缺乏足够的采样）进行了非度量多维标度(NMDS)分析；方法）对五个相关叶子特征进行评分，包括三个定量变量（叶片面积、叶长相对于宽度（长宽比）和边缘齿的密度）和两个分类变量（四态柔毛密度特征和双态毛状体类型）特征；方法和补充表5)。这些分析确定了一种对应于我们的DEN类别的叶子形式，一种对应于我们的LPT类别，以及一种包括我们的IGE和SGE类别的叶子形式（扩展数据图5和补充图4）。叶子大小在本质上变化很大，导致IGE和SGE形式之间产生一些重叠，但我们能够在现场一致地区分它们，部分是基于叶子形状和迄今为止测量的变量未捕获的其他特征的额外细微差异（例如，植物整体大小：大多数SGE物种是小型、多分枝的灌木，而大多数LPT和IGE植物成熟时为小乔木）。对于我们确定为IGE和SGE的物种，我们对叶片面积进行了额外的分析，结果揭示了对叶片尺寸双峰分布的强有力的统计支持（扩展数据图5）。我们还注意到，单独使用三个数量性状的PCA，或者还包括四个柔毛状态的数量表示，产生了非常相似的结果，我们的四种叶子形式主要占据PC形态空间的相邻和非重叠区域（方法和补充图）7）。此外，系统发育独立对比分析显示，定义我们叶子形态的变量之间存在很强的相关性（补充图6）。在这几次分析的基础上，我们在进一步的分析中保留了IGE和SGE形式之间的区别，从而总体上识别了四种叶子形式，如图2a左上图所示。图2a中的附加图突出显示了占据NMDS空间中11个EndeMism区域的物种的叶子形态。每个物种（方法）的代表性叶子轮廓显示在图2b的物种树上，图2c显示了四种叶子形式的示例。

我们的系统发育、生物地理学和形态测量分析共同清楚地记录了重复的辐射。这三种衍生的叶型并非起源于Oreinotinus进化的早期，然后在各地区传播。相反，随着谱系在每个特有区域内多样化，它们反复穿越叶子形态空间的相同区域。在这11个区域中，有9个区域至少有2种叶子变种；4个区域包括3种形式，1个（瓦哈卡州）包含4种。衍生叶形的平行进化得到了叶形特征异常高水平的同质性的有力支持（扩展数据图6和补充图5）。我们还对系统形态空间中特定区域的重复占据进行了分析[46]，发现派生的叶子形式都表现出显着的平行进化（IGE：P=0.005；LPT：P=0.022；和SGE：P=0.013；方法和补充图7）。基于使用后验预测框架（方法）的模拟，我们拒绝使用简单的进化模型（其中叶子形状和生物地理范围独立进化）来解释叶子形状在区域之间的分布（方法）。具体来说，我们发现不可能像我们那样仅仅偶然地观察到具有2种或更多叶子形式的9个特有现象区域（0.7%或1/150空样本）和5个具有3种或更多形式的区域（2%或1/150）。3/150无效样本；补充图8)。此外，我们设计了一个测试来比较性状进化率（方法），发现一个区域内物种的性状进化布朗率高于同等大小的随机抽样物种组之间的性状进化率（补充图9）。基于这几条证据，我们得出结论，特定的叶子形状在多个区域内平行进化，并且区域内叶子形状的多样性和性状进化的速率比偶然预期的要大。

由于整个系统发育过程中叶形态的同质性很高，因此很难推断区域内不同形态进化的精确顺序（扩展数据图6和补充图5）。简约性推断出叶子形式有22+种变化，最深节点处的特征状态模棱两可，但强烈支持IGE形式作为南美辐射的祖先。特万特佩克地峡以南不存在祖先的DEN生态形态；它似乎保留在北部地区，并且没有表现出显着的平行进化[46]（DEN：P=0.064）。瓦哈卡州南部也不存在非常圆形的叶子，并且有明显的趋势：边缘齿较少，埃隆门叶较多，而南美辐射区的叶子稍小（补充图5）。IGE形式是最常见的（这里研究了16/40个物种；补充表1），也许是特万特佩克地峡以南的祖先形式，更肯定的是进入南美洲的谱系（扩展数据图6）。我们推测具有IGE叶子的物种可能在不同地区之间传播，而SGE和LPT形式则在原地反复进化。这与我们的观察结果一致，即与LPT和SGE物种相比，IGE物种通常具有更大的地理范围并栖息在较低的海拔地区，而LPT和SGE物种通常在较高海拔处具有较小的范围（见下文和扩展数据图3）。

混合、网络分析和生殖隔离

适应性辐射的研究越来越多地揭示了渐渗杂交在此过程中的重要作用（例如，达尔文雀[47]、丽鱼科鱼[48]和Heliconius蝴蝶[49]）。这，再加上我们对涉及几种东方鲽属物种的局部杂交群的现场观察和分析，促使我们探索杂交在这种情况下可能发挥的作用。我们使用D统计（ABBABABA测试[50]；方法）来检查四分类单元子树之间的SNP模式，重点是对来自具有相似叶子形状的邻近地理区域的物种进行测试（图3a）。对与我们推断的系统发育相匹配的树木进行的测试几乎没有显示混合的证据，除了V.sulcatum（瓦哈卡州），它似乎与墨西哥东部分支混合（图3b和扩展数据图7）。从基因树推断的系统发育网络[51]（方法）同样将V.sulcatum识别为罕见的区域间混合案例（图3c和补充图10）。我们还研究了另一种假设，其中具有相似叶子形状的物种被认为具有最近的共同祖先。在这一假设下，子树表现出显着的不一致（图3d），来自同一地区的物种之间存在过多的等位基因共享。这意味着要么这个替代假设是错误的，要么同居物种之间存在显着的基因流动。来自同一区域的物种子树的统计数据清楚地反驳了后者，表明区域内混合通常很少见（图3e和扩展数据图7）。因此，我们拒绝复制辐射的替代方案：不同地区具有相似叶子形状的物种不会混合，并且似乎没有共享最近的祖先，并且区域内的物种几乎没有显示出混合的迹象，这可能会混淆我们的系统发育分析。

图3 混合物和网络分析。a，选定的ABBA-BABA测试，使用北美东部的V.dentatum作为外类群，以及由来自同一特有地区的两个物种组成的内类群，具有对比的叶子形状，以及来自不同地区的具有任一形式的物种（方法）。背景颜色对应于图1中的区域，叶子轮廓颜色对应于图2中的生态形态；框中的名称对应于图1和2中的物种名称。1和2（另见补充表1和2）b，来自不同地区的物种之间的混合很少见。每个测试显示500个bootstrap重复的D统计量，如果测试偏离零且Z分数>5，则颜色为深色。c，系统发育网络分析显示与图1和2中的物种树和区域的对应关系。1和2（补充图10）。只有V.sulcatum（瓦哈卡州；星号）显示出与其他地区物种的联系（扩展数据图7）。d，ABBA-BABA对假设的替代系统发育进行测试，其中具有相似叶子形状的物种共享最近的共同祖先，在所有测试中显示出显着的不一致。e，同一地区内物种之间的混合并不常见。

所有Oreinotinus物种的花和果实仅显示出微小的差异（例如，南美物种的内果皮凹槽减少[52]），并且我们已成功地将具有不同叶子形态的几个墨西哥物种的个体杂交[19]（所有这些物种都是已知的四倍体2n=36参考文献[22]）。尽管杂交是可能的，但共生物种（具有相邻或重叠的地理范围）的开花时间差异似乎维持了田间的生殖隔离[22]，就像它们在其他地方的荚莲属植物中所做的那样[53,54]。然而，开花时间有时会在栖息地和光照条件已被人类活动改变的接触区重叠，并且可能会发生局部杂交群，如恰帕斯州V.lautum(SGE)和V.jucundum(LPT)的记录[22]。然而，如上所示，我们在这些杂交群体之外几乎没有发现基因渗入的证据，并且除了V.sulcatum（见上文）外，没有证据表明涉及来自不同地区的物种的杂交（图3和补充图8）。

利基差异化

为了探索不同叶子形态的适应价值，我们对墨西哥恰帕斯中部高原上的V.hartwegii(IGE)、V.jucundum(LPT)和V.lautum(SGE)的环境进行了表征，这些物种的分布范围就在此处重叠（图4a）。我们使用安装在每个物种多个地点的便携式气象站（方法和图4b）监测了3年多的气候和光变量，并测量了树冠开放度（方法和图4d）。这些数据表明，与具有大柔毛叶子的V.jucundum相比，具有小无毛叶子(SGE)的V.lautum经历了更高的辐照度、更大的每日温度波动、偶尔的冰冻温度和更少的云量。（LPT；图4e，f）。V.hartwegii具有中等尺寸（IGE）的无毛叶子，通常生长在中央高原侧翼的海拔较低的地方，这些地方比V.lautum冬季降水更多，昼夜温度变化更小（图4c，e、f）。从恰帕斯高原地理参考事件中提取的气候数据与这些发现一致（图4b、c；和扩展数据图8），表明V.lautum占据比V.jucundum更干燥的地点，并且V.hartwegii生长在海拔较低，全年气温较高。尽管V.lautum和V.jucundum的分布范围在SanCristóbaldelasCasas山谷周围大体重叠（图4b），但这些结果得到了很好的支持，这可能是由于长期的人类干扰导致这两种种群的数量增加。物种接触并促进局部杂交[22]。

图4 墨西哥恰帕斯州不同叶形物种的生态分化。a，V.jucundum(LPT)、V.lautum(SGE)和V.hartwegii(IGE)的代表叶。V.jucundum（I：叶片和边缘上有柄星状毛的密集柔毛，显示一颗牙齿）和V.lautum（II：无毛，仅边缘有简单的毛，缺乏牙齿）的叶缘图像。b，生态位分析的收集地点和墨西哥恰帕斯中央高原的气候站位置。c，来自地理参考收集地点（方法）的环境数据显示，V.lautum(N=77)位于较干燥的地点，V.hartwegii(N=73)的海拔低于V.jucundum(N=82)。这三个恰帕斯物种的所有CHELSA气候变量均显示在扩展数据图8中。箱线图元素：中心线、中值；框限、上四分位数和下四分位数；晶须跨越1.5倍四分位距。使用ggridgesrpackage94中的geom_密度_ridges函数绘制密度脊线图。每个密度脊内的垂直线代表该区域的平均值。N=181个生物学独立样本（59个V.hartwegii样本、65个V.jucundum样本、57个V.lautum样本）。d，使用鱼眼镜头摄影估计的树冠开放度（方法）表明，V.jucundum(N=20)比V.lautum(N=20)和V.hartwegii(N=10)占据更多的封闭森林；***p<0.001，箱线图元素如c中所示。e,气候站数据显示V.jucundum暴露在更持续的雾中，尤其是在旱季（2月至5月）；每个月的彩色条：高于和低于平均值（点）的一个标准差。f,气候站数据显示V.lautum经历了更高的每日和季节性温度波动；V.jucundum地点的温度全天和全年都更加稳定；彩色条如e所示。图片来源：a中的叶缘图像，J.Negvesky，KeyenceCorp.

尽管我们无法像恰帕斯州一样详细地比较其他地方性地区的生态形态生态位，但我们对整个Oreinotinus范围内的地理参考收集地点的分析（扩展数据图3）为以下观点提供了支持：假设叶子生态形态分类为类似于我们在恰帕斯州描述的气候生态位。尽管11个特有地区之间存在主要纬度和海拔差异的混杂影响（补充图11），但整个范围内的IGE物种与V.hartwegii相似，占据普遍较低的海拔并在整个地区经历较高的温度和降水。年，极端的昼夜温度范围和季节性较小（扩展数据图9和补充图12）。同样，正如我们对V.jucundum和V.lautum的比较一样，SGE物种与Oreinotinus范围内的LPT物种不同，全年降水量较少（无论是在温暖湿润的季节还是凉爽干燥的季节），并且季节性和干旱性较大。昼夜温度范围（扩展数据图10）。比较各个地区的生态形态生态位，结果再次与我们对恰帕斯州三个物种的发现大致一致；当我们发现所有三种形式出现的区域中不同叶子形式之间存在显着差异时，这些通常（但并不总是）符合我们的预期（补充图13、14和15）。

气候生态位的差异提出了一些关于SGE和LPT生态形态起源的适应性假设。V.lautum和其他SGE物种的小而无毛的叶子会导致叶子边界层更薄，从而可以更密切地跟踪叶子和空气温度。这可以防止在温暖的晴天过热，也可以防止温度偶尔低于冰点时过冷[38]。V.jucundum的大而短柔毛的叶子，可能还有其他LPT物种，与光线较低、经常阴天的环境有关，大多数日子里水会凝结在叶子表面。我们假设较大的叶子尺寸有助于光捕获[37]，而密集的背面毛状体覆盖通过排斥叶子表面的水来帮助气体交换[41]。我们不确定叶齿在Oreinotinus辐射中的功能作用，但我们注意到墨西哥瓦哈卡以南缺乏DEN生态形态，并且牙齿密度下降，甚至在特万特佩克地峡以南的LPT生态形态中也是如此。尤其是在南美洲（扩展数据图6和补充图5）。我们怀疑边缘牙齿的分布可能在很大程度上反映了北美洲温带森林中Oreinotinus谱系的祖先。LPT生态形态中牙齿的减少以及SGE和IGE形态中牙齿的丧失可能反映了酚类的变化以及休眠芽中叶子发育的减少，以适应较少的季节性环境[45]。尽管需要对整个Oreinotinus范围进行更详细的比较，但我们的结果表明，叶子生态形态适应了特定的略有不同但通常相邻的环境条件。当然，叶子是整个植物的一部分，其他可能相关的相关性状（例如植物大小和木材解剖结构）的差异也可能有助于生态形态在不同环境中的适应性。

结论

总之，我们记录了新热带地区不连续山区的一组叶子生态形态复制进化的案例。我们的例子已经在大陆范围内发生，但其情况却反映了岛屿群岛。而且，与一些岛屿系统一样，随着Oreinotinus向南扩散，我们的云林区域在不同时间被占据，这为研究不同时间阶段的多样化提供了机会。

Orienotinus的快速多样化显示出非适应性和适应性辐射的元素55。我们设想，在早期的非适应阶段，随着谱系向南传播，异域分离产生的物种在很大程度上是彼此的生态替代。然而，在此过程的后期，随着分离区域内发生物种形成，叶子形状出现了反复的适应性变化。

关于叶子性状的发育及这些性状与相关环境变量的具体功能如何，仍然存在许多问题。然而，这里报告的分析坚定地证实了植物中重复辐射的情况与动物中的辐射相媲美，我们预测这同样将为物种形成和功能多样化提供深入的见解。

方法

RAD-seq数据

叶子组织是从植物标本室样本或新采集的植物中收集的（补充表2和3），尽可能包括来自不同地理位置的多个样本。使用QiagenDNeasy植物提取试剂盒提取DNA。RADseq数据由Floragenex通过用PstI限制性内切酶消化基因组DNA，然后进行超声处理和400个碱基对(bp)的大小选择来生成。将样品与10bp条形码连接以进行多重分析。本研究中使用的180个样本（补充表3）与其他荚莲属植物样本合并，并在IlluminaHiSeq2500或4000上进行测序，以产生100bp单端读数。基因组数据被分解为样本并使用ipyradv.0.9.65进行组装。所有进一步的分析和组装统计数据仅适用于本研究中使用的180个样本。这些样本每个样本恢复了373万±326万（平均值±标准差(s.d.)）读数。使用ipyrad中基于参考的组装方法将基因组读数组装成直系同源基因座。在映射到V.lautum的参考基因组草案之前，使用默认设置来修剪和过滤读数（见下文）。映射到多个基因组位置的读取作为旁系同源物被丢弃。样本中映射读数的比例差异很大（平均值=76.9%，s.d.=18.4%），但与物种身份没有强烈对应；DNA提取质量的差异可能解释了这种差异。映射读数簇之间的覆盖率相对均匀，因此样本中的簇总数（平均值=76,317，s.d.=23,849）与通过最小深度阈值6的数量相似（平均值=68,530，s.d.=21,876）。当调用共有等位基因时，我们允许每个样本最多有4个等位基因；迄今为止统计的所有Oreinotinus物种均为2n=36的四倍体，但并非所有Oreinotinus物种的倍性都是已知的[27]。最终组装的数据集包含201,009个基因座，代表非重叠基因组区域，其中至少4个样本的数据映射到参考基因组并通过了所有过滤。每个样本平均存在60,246个位点(s.d.=18,584)。该数据集代表了RADseq数据最大但最稀疏的集合。我们没有使用不同的参数设置编译数据集的多个程序集以允许不同比例的缺失数据，而是仅创建这个最大的程序集并使用ipyradanalysis工具包[56]执行下游分析，该工具包允许对位点、基因组窗口或SNP进行过滤和二次采样适用于特定下游分析工具的多种文件格式。这些过滤选项在下面的系统发育推断、PCA和ABBABABA部分中进行了描述。

参考基因组组装

快速冷冻的幼叶组织是从墨西哥恰帕斯州特奥皮斯卡镇附近的野生群体样本中培养的V.lautum个体（YAL1123）中收集的。该种群的凭证样本存放在耶鲁大学植物标本室(PWS3105)。组织被送往DovetailGenomics进行高分子量DNA提取和测序。制备了5个Illumina文库并对其进行测序，以生成配对末端150bp读数。使用trimmomatic[57]进行接头和质量修剪，使用ILLUMINACLIP模式去除测序接头，并从读数的前端和尾部去除质量得分<20的碱基。配对读取具有从322到568bp不等的可变插入大小，总共有31.5亿个读取对，在接头和质量修剪后代表917Gb的序列数据。

使用Meraculous2软件[58]在二倍体模式下从短读长数据组装出从头基因组草案，其中kmer大小设置为73，最小kmer频率为12。Meraculous是真核基因组的全基因组组装程序，使用混合kmer/readbased方法进行组装当存在变异时，将基因组转化为非冗余单倍体或双倍体。重叠群的顺序和方向以及它们之间间隙的闭合是通过将配对末端读段映射到最初构建的重叠群来执行的。使用GenomeScope2.0[59]根据鸟枪序列数据中的kmer频率估计V.lautum的基因组大小为6.293Gb。从头基因组组装产生了542,881个重叠群，长度为3.0395Gb。这估计占总基因组大小的48%和非重复基因组大小的76%。来自短读数据的支架将其减少至482,845个支架，其中N50为11.5Kb，L50为70,032个支架。

为了进一步搭建从头组装的支架，DovetailGenomics制备了三个长程配偶对芝加哥文库，并进行测序以生成2x150bp读数。芝加哥的三个文库的插入长度高达300Kb，总共有12.5亿个读对。DovetailGenomics使用从头鸟枪组装和芝加哥数据作为HiRise（版本Threepass8cd24cd4b80d）的输入进行支架分析，HiRise是专门为使用邻近连接数据支架基因组组装而设计的软件管道[60]。最后，为长程支架准备了两个HiC文库，产生额外的2.12亿个配对末端读取，跨越10-10kb插入大小，估计可提供23,864.92倍的基因组物理覆盖率。使用改进的SNAP读取映射器(http://snap.cs.berkeley.edu)将DovetailHiC文库序列与芝加哥支架输入组件进行比对。HiRise分析了草稿支架内映射的DovetailHiC读段对的分离，以生成读段对之间基因组距离的似然模型，该模型用于识别和打破假定的错误连接，对预期连接进行评分并使连接高于阈值。使用HiC的脚手架进行了79,674个连接，将脚手架N50提高到7.3Mb，将N90提高到92Mb。一半的基因组存在于最大的121个支架(L50)中。该基因组草案的注释以及与其他已发表的基因组的比较将在其他地方发表。

个体水平树推理

我们根据串联序列重建了最大似然(ML)系统发育，以生成“个体样本级别”树，其中包括来自完整数据集的180个样本（补充表3）。选择这些样本是为了排除任何假定的杂交种。根据我们过去和正在进行的对普埃布拉、瓦哈卡和恰帕斯州几种荚莲属植物的高度本地化杂交群的研究[22]，我们能够通过叶子、树枝和花序性状的不寻常组合准确地识别可能的杂交植物。所有来自混合群的标本都被省略，在距这些种群一定距离处采集的几种植物也被省略。使用ipyradanalysis工具包中的ipa.window_extracter模块生成串联序列比对[56]。为了计算速度，我们仅从10个最大的支架中提取数据，并过滤位点以仅维护所有样本中至少25%共享的序列，并排除存在数据少于10%的任何样本。过滤后的矩阵长度为1.8Mb，包含109,825个SNP和50.7%的缺失细胞。这种比对在GTRCAT进化模型下的RAxML[61]中使用，以根据100个引导重复的支持值推断快速爬山算法下的最佳树。该树的生根参考了来自北美东部的V.dentatatum样本[24,25]。扩展数据图1显示，除了补充说明1中讨论的五个实例之外，来自相同形态物种的多个种群的种质在所有情况下都形成了普遍得到良好支持的进化枝。

物种水平的Oreinotinus系统发育

为了构建物种级系统发育，我们从41个物种级谱系中各选择一个代表性标本（补充表1和2），然后使用ipyradanalysis[56]中的ipa.window_extracter模块提取100个最大的支架。在连接所有支架之前，对它们进行过滤，仅选择所有物种中至少25%共享的位点。生成的矩阵为7.6Mb，包含161,791个SNP和48%的缺失数据。我们使用GTRCAT在此矩阵上运行RAxML[61]，以在快速爬山算法下推断出最佳树，并具有100个引导重复的支持值。我们使用Toytree[62]绘制生成的树（图2b）。这种串联拓扑与使用接下来描述的多物种合并方法推断的树拓扑非常匹配。

使用ipa[56]中包含的ipa.treeslider，我们在643个2Mb的非重叠窗口中遍历了数据中最大的100个脚手架。我们使用共识还原方法合并每个物种的所有标本，最终为41个物种中的每一个物种提供一个代表（包括2个V.tinoides种质；见上文）。我们使用RAxML[61]重建每个窗口的树。对于多物种合并分析，我们仅选择了包含超过300个SNP的356棵树。这些树被连接起来并用作ASTRALIIIv.5.7.1[63]的输入（扩展数据图2）。

标准贝叶斯散度时间方法在应用于RADseq数据集时遇到统计和计算挑战。特别是，大量短匿名RAD基因座不容易组合到系统发育分区方案中。为了规避这些问题，我们使用MEGAX[65]中的RelTime[64]对物种级串联树进行了时间校准（图1a）。RelTime根据用户提供的约束，将分子分支长度重新分配为地质时间和进化速率的分支特定组成部分。对于我们的RelTime分析，我们将Oreinotinus植根于V.dentatum（北美东部），并将分支之间的分子速率变化限制在<20倍的差异内。我们还根据之前获得的Oreinotinus冠年龄的95%最高后验密度(HPD95)，将Oreinotinus可能的冠年龄限制在6.66Ma和14.82Ma之间[22]。我们对Oreinotinus的RelTime节点年龄估计与之前使用基于化石的贝叶斯测年策略获得的分支节点年龄估计高度一致[24]。使用补充图1和补充注释2中描述的测试来评估这种一致性。

Oreinotinus地图和特有地区

我们将我们自己的采集地点与全球生物多样性信息设施(GBIF)中提供的保存标本所附的所有Oreinotinus地点结合起来（扩展数据图3）。我们通过搜索和下载已识别物种的地点以及已知的同义词（例如，“rhombifolium”以及“tilaefolium”）和潜在的拼写错误（例如“tilliafolium”）来过滤这些标本记录。我们使用R背包坐标清理器[66]进一步过滤GBIF数据，以删除错误概率较高的点（例如，经纬度相等的地点、海洋中的点、坐标不确定度大于1km的地点）。我们还删除了在相同纬度和经度多次记录同一物种的重复点。最后，我们查阅了Oreinotinus物种的专家范围地图和描述，以确保为每个物种保留的地点与任何已知的物种范围一致。在识别不确定的情况下，我们检查了GBIF中的图像记录，以便根据我们当前的分类法正确分配标本（补充表1和2）。

我们将3,034个标本记录的完整数据集输入ArcGISPro，绘制点并将最终的物种范围地图上传到耶鲁大学ArcGIS在线存储库(https://arcg.is/1OLDXD0)。尽管我们的采样对于可用的数据库和馆藏来说是彻底的，但它不太可能覆盖Oreinotinus物种的全部范围。根据我们的生物地理学分析和某些地区存在连续山脉，特定特有地区（如秘鲁北部和中部）内的明显分离可能是采集不足的人为现象，而不是在这些地区的适当栖息地中真正缺乏荚莲属植物。差距。然而，在不连续山区之间的低洼地区，例如特万特佩克地峡或巴拿马地峡，缺乏荚蒾属植物的收集，这代表了物种范围的真正差距以及这些植物占据的云林栖息地之间传播的真正障碍。

为了界定最初基于地形图和我们自己的实地研究的特有地理区域，我们使用在线软件InfomapBioregions67（补充图2）分析了全范围Oreinotinus的位置数据。InfomapBioregions实施二分网络和聚类算法来阐明数据中的基础结构，根据焦点类群的分布和物种丰富度将地理空间划分为生物区域。在准备用于此分析的数据集时，我们在每1km2网格单元内仅为每个物种保留一个随机选择的点，以最大限度地减少采样偏差和空间自相关的影响。该数据集和ASTRAL物种树已加载到软件中。使用自适应分辨率方法将样本发生记录分箱到单元中，使得每个单元不大于4×4°且不小于1×1°，并且每个单元包含不超过100条记录且不少于10条记录。这些参数考虑到我们数据集的规模（3,034个物种发生记录），值（软件提供的默认值）被认为最有可能减少过度拟合和欠拟合。

这种聚类方法确定了十个生物区域，每个区域都有特有物种，并且在大多数情况下在我们的ASTRAL树中形成进化枝（补充图2）。只有四种物种出现在超过一个的这些区域：V.microphyllum、V.obtusatum、V.tinoides和V.toronis（补充表1和补充图3）。其中，我们注意到，基于两个不同分支中种质的放置，V.tinoides可以被认为是两个不同的物种，位于两个不同的区域（图1a和2b，扩展数据图1和2以及补充说明1）)：V.tinoides(1)种质与来自哥伦比亚西部的物种有关，V.tinoides(2)种质与来自哥伦比亚东部的物种有关。然而，由于我们无法根据形态特征或生态变量将这两个分支的种质分开，因此我们保留了广义上的V.tinoides。这一分类问题的解决需要在整个范围内进行更广泛的采样，以及额外的形态和生态分析。

我们认为唯一在InfomapBioregions分析中未恢复的地方性地区是瓦哈卡州（补充图2中标记为区域3），该地区聚集在墨西哥东部。我们将瓦哈卡州列为11个特有地区之一，因为有6种荚莲属植物物种是这个小地区的特有种（V.acutifolium、V.fuscum、V.membranaceum、新种1、新种2和V.sulcatum），比任何其他领域都多。该地区也被认为是其他山地植物群的特有地区，并且在地质和植被分析中与墨西哥东部和中部分开（例如，参考文献[31]）。具体来说，我们注意到瓦哈卡州瓦特拉以南的这些地区之间的划分，大致以圣多明戈河排水系统（靠近圣巴托洛梅阿亚特拉）为标志。InfomapBioregions未能将瓦哈卡州识别为一个单独的区域，可能是由于该地荚蒾属植物的采样不足（该地区每个物种的出现记录最少）以及每种地方病的已知范围极其狭窄我们在该地区认识的物种。

Oreinotinus历史生物地理学

我们使用DEC方法重建了Oreinotinus的祖先物种范围[33]（图1a）。DEC通过推断的扩散、（局部）灭绝和分支发育事件序列，模拟物种如何在系统发育分支的一组离散区域中进化。DEC模型需要输入时间校准的物种水平系统发育和感兴趣物种的离散范围数据（即离散区域的居住集合）。对于系统发育，我们使用了上面描述的标注日期的RelTime树（图1a）。使用该项目中的新地理坐标、策划的GBIF坐标和专家范围地图（见上文）来组装离散范围数据。

我们在RevBayes[68]中设计了一个系统发育模型，在DEC模型下重建了Oreinotinus的历史生物地理学[33,69]。我们假设系统发育的拓扑和分歧时间与ML树相同。我们假设所有扩散率都是相等的，先验分布为指数（10），并且所有灭绝率都相等，先验分布为指数（10）。区域内（“同域”）分支发生事件以先验概率u~Uniform（0,1）发生，区域间（“异域”）分支发生事件以概率1?u发生。我们运行马尔可夫链蒙特卡罗(MCMC)分析进行3,000次RevBayes迭代，每次迭代10次移动。所有参数的有效样本量均>200。在MCMC期间对祖先范围进行了采样，然后根据物种水平时间校准的系统发育参考树进行总结和绘制。系统发育的不确定性并没有影响我们对主要祖先范围估计的主要特征（补充图3）。

SNP数据的PC和UMAP分析

SNP是使用ipyradanalysis[56]中的ipa.pca模块从ipyrad生成的HDF5数据库文件中提取的，并在每个不同的分析中单独过滤，以最大限度地减少每次运行中包含的子采样分类群集合中的缺失数据。正文中介绍的分析（图1c）使用过滤器设置仅保留样本子集中最小覆盖率为75%(mincov=0.75)的SNP，以及每个样本中最小覆盖率为50%的SNP。分析中的外接区域(minmap=0.5)，或者在整组样本的情况下为1(minmap=1)，并且要求次要等位基因频率大于2%(minmaf=0.02)。由于缺失数据是RADseq数据的常见特征，但不适应PCA等降维方法，因此我们使用ipa.pca中的“样本”插补方法在过滤后插补缺失值。根据样本分配到的群体（组）中其他个体中缺失位点的派生等位基因的频率，对每个缺失基因型的两个等位基因进行随机采样。在我们的主要分析中，每个样本都被分配到与本研究中定义的地方病地理区域相对应的11个人群中的一个。为了减少因插补中将样本先验分配到总体组而引起的潜在偏差，我们还使用kmeans聚类方法将样本分配到组进行分析。该方法首先对高度过滤的SNP集执行PCA，允许很少的丢失数据（例如，mincov=0.90），然后使用kmeans聚类根据样本在多维PC空间中的距离将样本分配到k组。然后降低过滤SNP的阈值，允许数据集中存在额外的SNP，然后使用“样本”方法再次估算缺失值，但现在使用基于kmeans的群体分配。迭代地重复此操作，允许包含和估算越来越多的数据，直到达到目标mincov设置（此处mincov=0.75）。

通过ipa.pca模块提取的过滤和估算的SNP，我们对数据运行UMAP[70]或PCA[71]，这是ipa.pca从scikitlearn[72]实现的。前者是一种非线性降维方法，通过捕获局部和全局结构，在二维可视化高维数据方面通常比PCA表现更好。UMAP和PCA均针对完整数据集以及仅关注较小区域（例如墨西哥、中美洲和加勒比海或南美洲）的选定样本的数据子集进行。为了减少连锁效应，每个RAD位点仅对单个SNP进行二次采样。对于图1中所示的PCA和UMAP图，“所有区域”分析包括分类在11个先前定义的区域中的178/180个样本（排除外群）。后过滤数据集有来自1,843个不同RAD位点的5,497个SNP，其中21%的数据是估算的。“墨西哥和中美洲”分析包括116个样本，其中包含来自823个连锁块的2,931个后过滤SNP，以及21%的缺失数据。“南美洲”分析包括62个样本，其中来自11,006个连锁块的37,737个后过滤SNP，以及19%的缺失数据。扩展数据图4中提供了其他PCA和UMAP分析（另见补充说明4）；这些证明了对SNP进行二次采样、估算缺失数据和先验分配群体的效果有限。

叶形态分析

收集了来自各种来源的所有Oreinotinus物种的数字化叶子标本，包括植物标本和我们在现场拍摄的标准化图像。尽管我们获得了V.hondurense（洪都拉斯）、V.venustum（哥斯达黎加）和V.incarum（秘鲁）的形态测量数据，但这些数据被排除在我们的统计分析之外，因为我们无法获得足够质量的DNA来将它们纳入我们的分析中。RADseq分析。V.hirsutum和V.membranaceum被纳入我们的系统发育分析中，但被排除在我们的形态测量研究之外，因为我们能够获得少于五种植物的叶子测量值，这些植物很难代表其地理范围内的变异。显示物种之间杂交的任何证据的样本被省略（见上文）。鉴于有记录的荚莲属植物[73]的季节性异胚性，只要可能，叶子测量仅从位于花序正下方的叶子进行。根据其轮廓的无障碍视图，选择每个样本的一片叶子进行测量。对于标本较少的物种，我们使用了单个个体的几片叶子。最终数据集由代表647种植物的657个叶子组成，每个分类单元平均N=15个叶子（范围=7-29）（补充表5）。

在插件LeafJ[75]的帮助下，在ImageJ[74]中进行了数字测量。为了正确校准测量结果，对于每个图像，使用图像帧中的标尺或图像中的其他已知测量值确定像素/厘米比。由于LeafJ的输入要求是没有背景的叶子，因此在照片编辑程序的帮助下，从样本图像（保持像素比）中套索出选定的叶子。LeafJ还需要叶柄来定向自动叶片测量；在少数情况下，所选的叶子图像没有可见的叶柄，在叶子的基部插入一个叶柄以供LeafJ使用，并且LeafJ的叶柄长度测量值被丢弃。LeafJ提供叶片长度、宽度、面积和周长的自动测量。长宽比由叶片长度/叶片宽度计算。计算边缘齿的总数并除以总刀片周长以获得齿密度。使用Python库scikitlearn[72]及其模块preprocessing.StandardScaler，我们通过scale[76]对变量进行标准化以减少偏差，将所有数据转换为平均值=0和方差=1。

由于无法从我们的数字图像中准确测量毛状体密度，因此我们使用了两个分类变量。一性状有四种状态，反映了叶背面柔毛的疏密程度：（1）主脉无毛或有少量毛；（2）无毛或有少量毛。(2)叶板上疏生短柔毛；(3)密被短柔毛，但毛状体下方可见叶板，因此表面通常呈灰色或棕色；(4)浓密的短柔毛，有几层缠结的毛状体，完全遮盖下面的叶片，因此呈白色。第二个双状态特征反映了产生的毛状体类型的差异：（1）简单或二裂或很少小的无柄星状毛状体，具有很少的射线和（2）多细胞有柄星状毛状体，具有多个射线。即使大部分无毛的形式也可以被评分为这个特征，因为它们在叶缘、或在主脉的基部、或在叶柄上或在主要次脉的腋中的小窝中产生一些毛状体。

由于我们的生态形态具有连续变量和分类变量混合的特征，因此我们无法使用表面方法来识别叶子形状和收敛性[77]。相反，我们使用scikitlearn[72]库中的manifold.MDS和cluster.KMeans模块进行NMDS分析。我们使用肘法来确定在NMDS中表示我们的数据的最佳组件数量；这需要多次迭代测试，改变组件的数量并确定测试不会返回明显更好结果的点（曲线的弯头）（扩展数据图5）。在这种情况下，我们使用公制应力（缩减维度中的距离差）来找到最佳组件数量。使用相同的肘部方法，通过使用度量惯性（样本到最近聚类中心的距离之和）来衡量优化程度，从而获得聚类中的最佳k数。降维和聚类这两项分析都是使用具有物种平均值的矩阵（图2a和扩展数据图5）以及包含600多个个体种质信息的矩阵（补充表5和补充图4）来完成的。

k=3的聚类确定了一个簇，其中包括我们的SGE和IGE生态形态（扩展数据图5）。我们通过使用R中的stat_compare_means[78]函数在ggpubr包中实现的Wilcoxon测试来比较IGE和SGE形式的平均值，进一步探索了该簇中叶面积的分布。如扩展数据图5c所示，这恢复了显着的结果。IGE和SGE形式之间叶面积的差异。

我们还使用三个连续变量进行PCA：叶片面积、长宽比和齿密度。使用Python库scikitlearn[72]及其模块preprocessing.StandardScaler，我们通过scale[76]标准化变量以减少偏差，将所有数据转换为平均值=0和方差=1。我们使用上述模块decomposition.PCA计算所有主成分轴图书馆。为了在分析中反映毛状体信息，我们使用数码显微镜手动计数近轴表面标准扇区上0.3或0.5cm圆形孔径中的毛状体，并计算毛状体cm?2150个来自耶鲁大学植物标本馆的标本，选自涵盖整个区域的34个物种。青春期的光谱。由此，我们获得了四种毛发密度状态的平均毛状体密度，如下：1=4.97、2=107.07、3=973.72和4=4466.34毛状体cm?2。该分析的结果与使用NMDS获得的结果类似，如补充图7a所示。该分析中的物种PC分数用于并行进化分析（见下文）。

使用时间校准的物种水平Oreinotinus系统发育，我们使用简约和随机映射方法对四态叶形特征进行了祖先状态重建（扩展数据图6）。我们基于ML估计的“所有速率不同”字符转换矩阵模拟了1,000个随机映射，具有相等的根节点先验概率。模拟结果总结为饼图（扩展数据图6）。与简约性类似，并且由于高水平的同质性，沿着主干的祖先状态估计是模棱两可的，在这种情况下包括南美辐射的祖先。我们还对三个连续变量进行了ML重建（补充图5），并计算了长宽比、牙齿密度和叶片面积的记录值的系统发育独立对比，并实现了所有三个特征组合之间对比的线性模型（补充图5）。6).所有三个性状都在树上表现出相关的进化变化：叶面积和牙齿密度呈正相关（补充图6a），牙齿密度和长宽比（补充图6b）以及叶片面积和长宽比（补充图6b）。6c)呈负相关。所有分析均使用phytools[79]和castor[80]软件包在R中进行。

为了进一步探索并行性/收敛的程度，我们使用R[46,81]的convevol包来评估四叶生态形态收敛进化的重要性。我们执行了函数convnumsig，它使用来自PCA分析的前两个主成分的参数（包括半定量的柔毛特征）来模拟布朗运动模型下沿物种级别树的进化（见上文；补充图7）。对于每种叶类型，将模拟值与卷积度量进行比较，以确定收敛的显着性。该度量指的是谱系进入给定形态空间中的区域的次数。对于此分析，我们运行了1,000次模拟并使用了两个信息最丰富的主成分。补充图7显示了系统形态空间中的这些结果。

图2b中的树显示了每个物种的代表性叶子轮廓。该样本被定义为在主成分空间中最接近物种质心的欧几里德距离。

叶型和生物地理演化的后验预测分析

在11个特有区域中，9个区域包含2种或更多叶型的物种(N2=9)，5个区域包含3种或更多叶型的物种(N3=5)。我们使用贝叶斯后验预测测试了Oreinotinus中N2和N3的观测值是否超出零预期[82]。我们定义了一个简单的零模型，该模型将历史生物地理学的系统发育模型扩展为在具有指数（10）率先验的等四状态连续时间马尔可夫过程下模拟叶类型进化。根据设计，该零模型既不允许叶子类型影响物种范围进化，也不允许物种范围影响叶子类型进化。在推断出该零模型下所有生物地理和叶型进化参数的联合后验分布之后，同一推理模型模拟了后验参数估计的每个样本的一个数据集。我们从每个模拟数据集中删除了北美东部和V.dentatum，以便与我们在Oreinotinus中观察到的N2和N3值进行有效比较。最后，我们计算所有模拟数据集的N2和N3值，以生成区域叶类型变异的零分布，以便与Oreinotinus的这些值进行比较。

性状进化的区域率检验

我们测试了在地理上同域的Oreinotinus谱系中，叶子性状是否进化得更快。我们从11个区域的Oreinotinus RelTime系统发育中提取了11个具有(n1,n2,...n11)类群的亚系统发育，然后估计了每个性状（对数叶片面积、对数齿）的所有亚系统发育中的性状进化布朗率密度、纵横比）使用机器学习。然后，我们类似地估计了100个重复数据集的性状进化布朗率，每个数据集都有11个随机采样的亚系统发育，具有(n1,n2,...n11)分类单元。使用区域亚系统发生相对于随机亚系统发生的更高比率的发现支持了地理同源加速性状进化的情况（补充图9）。

D-统计/ABBA-BABA测试。我们使用全基因组SNP采样来测试邻近区域物种之间的混合以及区域内物种之间的基因流动（图3、扩展数据图7和补充表4）。这是使用在四分类单元不平衡子树[(((P1,P2),P3),P4)]上设置的一系列Dstatistic(ABBABABA)测试[50]完成的，其中P3分类单元预计与两个姐妹中的任何一个共享派生等位基因物种，P1或P2，具有相同的概率。P3与这两个分类群中任何一个的等位基因共享过多（即不一致）被解释为混合的证据[50]。

不过，我们注意到，在来自更大系统发育背景的多个可能子树的背景下，在解释Dstatistics时应谨慎，因为它们可能因潜在渐渗供体之间的共同祖先而导致较高的假阳性率[83]。

我们在ipyradanalysis[56]的ipa.baba模块中实现了Dstatistic计算，该模块是专门为分析RADseq数据集而设计的。在此工具中，从数据库中提取并过滤每个子树中样本之间共享的所有基因座，以应用最小样本覆盖阈值。当分析中多个样本代表一个分类单元时，使用等位基因频率计算匹配ABBA和BABA的位点模式。我们要求每次测试每个分类单元至少覆盖一个样本，但大多数分类单元由多个样本代表。为了评估其显着性，我们对每个测试进行了500次引导重复，其中RAD位点通过替换进行重采样。然后将Zscore计算为D偏离零的引导标准差的数量。为了可视化，我们显示了500个bootstrap重复的散点图，并且当Zscore显着时使用Z>5作为截止值，颜色点颜色更深（图3）。JupyterNotebooks中提供了可复制的代码来复制我们的结果和数据：https://github.com/eatonlab/Oreinotinusphylogeny。每个测试的统计数据可在补充表4中找到。

我们首先建立了一系列15项测试来研究邻近地区物种之间的混合（图3a）。在这些测试中，P1和P2被选为来自同一地区但叶子形状不同的物种。P3被选为来自邻近地区的物种，其与P2分类群共享叶子形式。所有测试均使用V.dentatatum（来自北美东部的Oreinotinus的外群）作为P4外群分类单元。在这一系列测试中，我们只发现了一个显着结果，即V.sulcatum（瓦哈卡州）和V.tiliaefolium（墨西哥东部）之间的混合（图3b）。有关V.sulcatum中混合物的进一步研究，请参阅下文和扩展数据图7。这一系列测试平均每次测试包含131,024个SNP（s.d.=64,309），其中2.99%不一致（ABBA或BABA；s.d.=0.4%），平均每次测试包含1,983个ABBA位点和1,925个BABA位点。

还对“替代系统发育假说”进行了第二系列测试，其中分析了相同的四分类单元集，但更改了P1、P2和P3子树拓扑以代表来自邻近地区的两个具有相似叶子形状的物种的情况假设共享一个最近的共同祖先（即设置为P1和P2；图3c）。如果我们推断的系统发育假说是正确的，那么我们应该会看到过多的ABBA位点，其中来自同一地区的两个物种共享更多的共同等位基因。这一系列测试的SNP数量与上述相同，但不一致的比例更大（平均值=3.89%，s.d.=0.64%），导致平均D为0.22（s.d.=0.14），平均Z-score为29.25（s.d.=0.64%）。=21.94）。

为了测试同一区域内物种之间混合的证据，我们根据我们推断的Oreinotinus串联树，建立了一系列测试，对每个区域中的三个类群进行采样，匹配所需的不平衡拓扑形状（图3e）。这些测试并不是专门针对叶子形状而设置的，因此ABBA或BABA过量都被简单地解释为混合的证据。最后，我们使用Dstatistics调查了V.sulcatum中的混合物来源（扩展数据图7）。进行了一系列13项测试，将作为P3分类单元的V.sulcatum与墨西哥东部的2个对比P1和P2样本，或墨西哥东部的1个样本和墨西哥西部的1个样本进行比较。我们还以相反的方向进行了测试，以墨西哥东部和西部分类群作为P3，以V.sulcatum作为P2分类群，与远亲（来自恰帕斯州的V.jucundum）或近亲（来自瓦哈卡州的V.fuscum）进行对比。

网络分析

为了估计系统发育网络，我们使用ipa[56]中包含的ipa.treeslider模块，使用RAxML[61]为643个窗口中的178个个体生成了树（图3c和补充图10）。这些窗口是从我们整个数据集中100个最大的支架中提取的。每个窗口的大小为2Mb，没有重叠。我们只保留至少10个SNP的窗口和至少9个样本的覆盖范围。我们进一步过滤滑动窗口，仅保留那些具有超过300个SNP的窗口。使用共识还原将属于同一物种的所有样品还原为独特的代表性样品。总共恢复了357棵树并用作重建网络的输入。为此，我们使用MSCquartetspackage[85]中并入R[86]的NANUQ[84]，将alpha设置为1×10?5，将beta设置为0.95。我们使用SplitsTree[51]使用默认参数绘制最终网络。

V.jucundum、V.lautum和V.hartwegii的气候分析

我们评估了墨西哥恰帕斯中部高原地区代表三种不同叶子类型的三个物种的环境生态位空间：V.hartwegii(IGE)、V.jucundum(LPT)和V.lautum(SGE)（图4和扩展）数据图8)。我们通过两种方式来描述他们的环境利基。首先，我们通过将我们自己的采集地点与GBIF[87]中所有保存的标本记录相结合，为该地区每个物种收集了地理参考地点。然后，我们使用R背包坐标清理器[66]过滤收集点并映射其余位置。这产生了230个经过审查的地点，加上我们恰帕斯州气候站的另外5个地点（见下文）。我们从CHELSA（地球陆地表面区域高分辨率气候学）[88,89]中以1km2分辨率提取了所有经过审查的地点的19个标准生物气候变量。高程数据是使用航天飞机雷达地形测量任务[90,91]分辨率为90平方米的数字高程模型获得的。使用ArcPy脚本在ArcGISPro中提取每个地点点的每个数据层的栅格值，然后我们分析R中的ArcGIS输出，使用ttest比较每组物种和每个气候变量的成对平均值，并绘制气候变量ggplot[92]中每个物种的分布。在提取环境值之前，所有数据点和栅格图层都被投影到墨西哥IRTF2008UTM15N坐标系中，在该坐标系中，墨西哥中部的高程测量应经历最小的失真。

其次，为了更精细地调查当地环境变化，我们在恰帕斯州的两个V.jucundum(LPT)站点、两个V.lautum(SGE)站点和一个V.hartwegii(IGE)站点安装了5个便携式气候站(MeterEnvironment)站点（图4e，f）。气候站安装在健康、天然的单一品种荚蒾林的中央；V.jucundum和V.lautum站于2016年5月安装，V.hartwegii站于2018年1月添加。这些站不断记录数据，直到我们于2019年2月最后一次上传。每个气候站都包括一个气温传感器和一个叶子湿度传感器连接到数据记录器（Decagon/MeterGroupATMOS14、PHYTOS31、Em50数据记录器）的传感器。温度和叶湿度传感器安装在与荚莲属植物冠层高度相似的树干上，距地面约2-3m。每小时记录温度和叶子湿度测量值。我们分析了R中的站点数据。我们使用显着性水平为0.05的t检验比较站点之间每小时、每天和每月的温度和叶子湿度，以测试每个站点的气候测量值之间是否存在显着重叠。此外，对于每个气候站区域，我们将冠层覆盖率估计为冠层下方开放天空的比例，并将其用作光环境的代理（图4d）。对于每个地点，我们确定了所监测物种的三到五个个体，并为每个植物拍摄了两张鱼眼照片：一张照片位于个体以北1m处，一张照片位于个体以南1m处。照片是使用配备鱼眼镜头的数码单反相机拍摄的，使用参考文献中详细说明的方法[93]。图像被二值化，白色像素的百分比被用作开放树冠百分比的代表。我们使用R测试了站点之间树冠覆盖的显着差异，并使用ggplot[92]绘制了值。

Oreinotinus整个地理范围的气候分析

为了确定IGE、LPT和SGE形式是否与我们在恰帕斯州详细的三物种比较中一样存在普遍差异，我们比较了V.hartwegii、V.jucundum和V.lautum整个地理范围内的CHELSA变量（补充图12）Oreinotinus范围内的IGE、LPT和SGE物种（扩展数据图9和10）以及各个区域内的IGE、LPT和SGE物种（补充图13-15）。我们分析了整个Oreinotinus范围内3,034个精选样本的完整数据集和相关环境变量（见上文）。我们移除了V.venustum、V.hondurense和V.incarum，因为这些物种并未在树中进行采样。我们还删除了V.membranaceum和V.hirsutum，它们各自只有3个出现记录。使用R中实现的成对ttests并在ggplot中可视化，我们首先按特有现象区域（补充图11）比较环境条件，然后按所有区域的生态形态（扩展数据图9和10）进行比较。在评估了19个CHELSA气候变量中哪些在外型体之间表现出显着差异后，我们重点关注以下变量：年平均气温、平均日较差、温度季节性、温度年较差、最冷月最低温度、年平均降水量、降水季节性和海拔（扩展数据图9和10以及补充图12-15）。我们选择这些变量来包括可比研究中包含的标准气候生态位测量（年平均气温、年平均降水量、海拔），以及代表变化而不是平均值的所有指标（平均日差、温度季节性、温度年范围）、最冷月份的最低温度、降水季节性），认为这些对于确定荚莲属植物的分布可能特别重要。

期刊：Nature Ecology & Evolution

文章标题：Replicated radiation of a plant clade along a cloud forest archipelago

作者信息：Michael J Donoghue , Deren A R Eaton , Carlos A Maya-Lastra , Michael J Landis , Patrick W Sweeney , Mark E Olson , N Ivalú Cacho , Morgan K Moeglein , Jordan R Gardner, Nora M Heaphy, Matiss Castorena , Alí Segovia Rivas , Wendy L Clement , Erika J Edwards

原文链接：https://doi.org/10.1038/s41559-022-01823-x

文内图片及封面图片来源原文

相关推荐

取消回复欢迎你发表评论:

Google 黑客常用搜索语句一览原力计划

npx简介（npxvip是哪国的）

在 Android 模拟器上运行 ARM 应用（android模拟器原理）

GB28181,B接口协议之SIPRTSPRTPRTMP协议从入门到精通

安装使用Hoppscotch构建API请求访问与测试

手机实时提取SIM卡打电话的信令和声音-辅助外设与商用通话方案

Python自动化办公——后台截图（python 自动截图）

轻松转换!AppleNumbers到Excel的快捷教程

电脑端腾讯文档如何导出excel

用OpenCV测量图像中物体的大小（基于opencv的物体尺寸检测算法实现）