山欖科膠木屬基因組系統發育與生物地理創新

文章信息

摘要:膠木屬(Palaquium)目前是山欖科(Sapotaceae)中最大的屬。先前關於膠木屬及其所在的異膠木族(Isonandreae)內部類群關係的研究,基於有限的樣本和基因座開展,未能明確界定分類邊界,進而阻礙了對這一以馬來群島為分布中心的屬的演化理解。本研究利用高通量靶向捕獲 DNA 序列數據,在迄今最全面的近物種水平採樣中(涵蓋約 80% 的 120 個已確認膠木屬物種,以及異膠木族全部 7 個屬的代表類群)重建系統發育關係。分析證實,當前界定的膠木屬並非單系類群:存在一個與異膠木屬(Isonandra)親緣關係更近的亞洲分支,而澳蘭屬(Aulandra)則嵌套在膠木屬內部。增強的系統發育數據集為重建生物地理歷史提供了機會 —— 研究同時應用傳統的擴散 - 滅絕 - 成種模型(dispersal-extinction-cladogenesis models)和考慮未記錄滅絕事件的新建模框架。結果支持先前關於馬來群島自西向東 colonization 的發現,這與其他若干植物類群的模式相似。然而,膠木屬和異膠木族的多樣化時間重建結果比既往研究更為古老,揭示了 boreotropical 的替代信號,以及巽他古陸(Sundaland)內可能存在的祖先分布區,這與始新世化石記錄更為吻合。這些發現深化了我們對東南亞生物多樣性豐富且地質動態活躍地區生物地理格局的理解。

引言

東南亞以擁有極為豐富的植物多樣性而聞名,其中馬來群島地區(從馬來半島和婆羅洲延伸至華萊士線以東的澳大拉西亞群島)估計約有 5 萬種植物(Mittermeir 等,1999;Myers 等,2000;Middleton 等,2019)。如此豐富的生物多樣性吸引了大量生物地理學研究,植物分布常被歸因於該地區地質歷史的複雜性(Hall,2009;Morley,2018)。儘管如此,儘管構造模型日益詳細,該地區植物區系的起源及其生物地理格局仍未被完全理解。

山欖科(Sapotaceae,杜鵑花目)由約 70 個屬(Swenson 等,2023)和 1300 種泛熱帶灌木及喬木組成(POWO,2024),在馬來群島森林生境中較為常見。該科也被公認為分類學上的難題類群 —— 由於缺乏獨特的共衍征和明確的形態學劃分,屬間界限難以界定(Pennington,1991)。歷史上,該科的主要分類劃分基於花部特徵,如萼片輪數、雄蕊與花冠裂片數量的相對比例、花冠裂片附屬物以及是否存在退化雄蕊(Engler,1890;Dubard,1909,1912;Lam,1939)。Pennington(1991)對該科的綜合形態學研究識別出 5 個族,但後續分子研究發現這些族並非單系群(Swenson & Anderberg,2005;Smedmark 等,2006),目前該科被劃分為 3 個亞科:肉實樹亞科(Sarcospermatoideae)、山欖亞科(Sapotoideae)和金葉樹亞科(Chrysophylloideae)。隨後,Gautier 等(2013)和 Christe 等(2021)確認山欖亞科下的 4 個族為單系群:異膠木族(Isonandreae)、山欖族(Sapoteae)、鐵線子族(Sideroxyleae)和 Tseboneae 族。

本文關注的以馬來群島為中心的異膠木族,最早由 Hartog(1878)基於可育雄蕊和花冠裂片無附屬物的特徵描述。自 Pennington(1991)以來,異膠木族的界定未發生改變,包括以下屬:Aulandra H.J.Lam(最近被併入 Palaquium Blanco;Phang 等,2025)、Burckella Pierre、Diploknema Pierre、Isonandra Wight、Madhuca Buch.-Ham.ex J.F.Gmel.、Palaquium 和 Payena A.DC.。由於這些屬的分布範圍從印度次大陸經印度支那和馬來群島延伸至澳大利亞及太平洋島嶼,異膠木族成為研究東南亞生物地理格局及可能性的理想類群 —— 該區域以豐富的生物多樣性和高森林砍伐率為特徵(Sodhi 等,2010;Estoque 等,2019)。此外,異膠木族主要分支內部的系統發育關係仍難以解析且缺乏深入理解(Richardson 等,2014)。

儘管該科的關鍵傳粉綜合征被認為是蟲媒傳粉,Pennington(2004)推測,異膠木族中雄蕊數量增加(相對於花冠裂片)可能與蝙蝠傳粉相關。這一假設在 Madhuca 和 Palaquium 物種中觀察到的蝙蝠傳粉綜合征和傳粉行為中得到佐證(Mahandran 等,2018;Phang,2023)。Mahandran 等(2018)發現印度的 Madhuca latifolia(Rodb.)J.F.Macbr. 主要依賴蝙蝠完成傳粉和種子傳播,至少有三種蝙蝠(包括哺乳期雌性蝙蝠)在同一覓食樹中競爭食物資源。蝙蝠 - 果實綜合征的特徵是肉質、有香味但視覺上不顯眼的綠色果實(Marshall,1983;Hodgkison 等,2013),這在異膠木族中廣泛存在的綠色漿果上得以體現。

已有多項研究涉及東南亞山欖科的生物地理分析。金葉樹亞科(Chrysophylloideae)在白堊紀晚期首先在非洲分化(Bartish 等,2011)。廣泛分布於太平洋的 Planchonella Pierre 屬(金葉樹亞科內)被發現起源於薩胡爾陸架,並在中新世通過反向擴散輻射至東南亞(Swenson 等,2019)。泛熱帶的 Mimusops L. 屬和 Manilkara Adans. 屬也被證實存在長距離擴散 —— 其起源被推斷為漸新世晚期的非洲,隨後在中新世擴散至亞洲(Armstrong 等,2014)。在巽他陸架和薩胡爾陸架匯聚期間,這些類群自西向東跨越華萊士線遷移(Armstrong 等,2014)。自西向東的遷移模式也與異膠木族的研究結果一致:異膠木族的巽他陸架支系被發現源自非洲,隨後在漸新世晚期擴散至澳大拉西亞和印度次大陸,並在更新世期間經歷 speciation 爆發(Richardson 等,2014)。該族的估計干群年齡(48.3–32.6 百萬年)暗示了勞亞大陸遷移的可能性,儘管較年輕的冠群年齡表明其在漸新世期間分化(Richardson 等,2014)。由於始新世之後 boreotropical 路線的斷裂,缺乏直接遷移路徑,這意味著地理分隔只能用跨洋擴散來解釋。

由於山欖科花粉類型在形態上存在重疊(如異膠木族與 Pennington 定義的 Mimusopeae 族的花粉;Harley,1991;Mimusopeae 現歸入山欖族,見 Swenson & Anderberg,2005),化石花粉在系統發育定年中的應用需謹慎。然而,近期研究利用掃描電子顯微鏡(其解析度超越傳統光學顯微鏡,尤其是覆蓋層特徵)已能可靠地區分具有混合親緣關係的花粉(異膠木族 / 山欖族)與可明確歸屬於異膠木族的花粉(Hofmann,2018;Huang 等,2021)。與異膠木族冠群類群(Palaquium leiocarpum Boerl. 和 P. philippense(Perr.)C.B.Rob.)密切相關的化石花粉已在歐洲晚古新世(56 百萬年前;Hofmann,2018)和緬甸地塊晚始新世至晚漸新世期間被發現(Huang 等,2021)。儘管這些時期似乎與 Armstrong 等(2014)估計的年齡一致,但其在歐洲和東南亞的存在暗示了歐亞起源,可能與 Richardson 等(2014)和 Armstrong 等(2014)假設的非洲起源不一致。

以往針對馬來群島山欖科的生物地理研究基於從有限分類單元採樣和少量核基因或質體基因座重建的系統發育(Richardson 等,2014:基於 ITS 的研究;Armstrong 等,2014:使用 ITS、rpl32-trnL、rps16-trnK 和 trnS-trnFM 標記)。高通量 DNA 測序方法(如靶向捕獲)已被證明能提高系統發育解析度(Koenen 等,2020;Pezzini 等,2023),可能增強對馬來群島山欖科類群生物地理學的理解。近期研究已證實,利用科特異性探針組可闡明東南亞異膠木族代表類群及其近緣種的關係(Christe 等,2021;Phang 等,2023)。

推斷物種生物地理歷史的最常用模型未考慮譜系滅絕,因為僅基於現存譜系的系統發育位置來估計 speciation 事件(Ronquist,1997;Ree & Smith,2008)。然而,近期研究已在祖先分布區重建方法中納入譜系滅絕的可能性(Herrera-Alsina 等,2022)。這些新模型提高了推斷生物地理歷史的準確性,並允許與化石記錄更緊密地吻合。例如,對滅絕物種的建模得出蜂鳥的祖先分布區為北美洲,這與化石記錄顯示的勞亞大陸起源一致,而不是現有 「無滅絕」 方法得出的南美洲起源(Herrera-Alsina 等,2022)。調和東南亞多個類群的生物地理起源與地質歷史的進一步研究正在進行中,已有證據表明,多樣類群 colonised 該區域的時間比以往 「無滅絕」 方法所暗示的早得多(Herrera-Alsina 等,2024)。

在本研究中,我們對物種豐富的馬來群島屬 —— 膠木屬(Palaquium,約 120 種,POWO,2024)及其異膠木族(Isonandreae)中所有近緣屬的代表類群開展了廣泛採樣,這些類群的分布範圍從印度延伸至澳大拉西亞,旨在解析系統發育關係並重建其歷史生物地理。膠木屬是山欖科(Sapotaceae)中最大的屬(Swenson 等,2023;POWO,2024;緊隨其後的是約 114 種的 Madhuca 屬),且包含許多地理分布受限的物種,這些物種表現出低水平的擴散能力和基因流(Phang 等,2024)。因此,該屬是結合地質歷史探究深時成種事件和生物地理信號的合適研究對象(Thomas 等,2012;Hughes 等,2015)。我們旨在通過靶向捕獲、分子鐘定年以及應用無滅絕和含滅絕模型的方法重建該屬的生物地理歷史,以解析膠木屬的時空多樣化模式。具體而言,我們研究以下問題:

(i)基於增強數據集的高通量測序方法是否支持異膠木族及其包含膠木屬在內的組成屬的單系性;

(ii)下一代 DNA 序列數據是否支持基於有限基因座推斷的既往生物地理模式(Richardson 等,2014),即膠木屬和異膠木族在馬來群島的定殖模式為自西向東,與其他若干植物類群中記錄的擴散模式相似(Crayn 等,2015;Atkins 等,2020);

(iii)使用考慮滅絕事件的新建模框架(Herrera-Alsina 等,2022)是否支持既往推斷的膠木屬(巽他古陸)和異膠木族(非洲)的祖先分布區(Richardson 等,2014;Armstrong 等,2014);

(iv)始新世時期特徵明確的異膠木族化石(Hofmann,2018)是否暗示 boreotropical 歷史已留下系統地理信號。

材料與方法

分類單元採樣

本研究將 Phang 等人(2023)彙編的數據集擴展至接近完整的膠木屬(Palaquium)物種水平採樣,涵蓋 120 個已確認物種中的 95 種(POWO,2024),包括 1 個變種及多個物種的多個個體(17 個物種取 2 個個體,1 個物種取 3 個個體,1 個變種取 3 個個體)。同時採樣了所有與膠木屬同義的屬名模式種(POWO,2024)[即 Croixia Pierre、Dichopsis Thwaites 和 Galactoxylon Pierre,除 Treubella Pierre 外(該屬未指定模式種)]。此外,納入了 25 個外類群分類單元,包括異膠木族(Isonandreae)所有 7 個屬的代表,以及金葉樹亞科(Chrysophylloideae)和山欖亞科(Sapotoideae)中其他主要族 [山欖族(Sapoteae)、鐵線子族(Sideroxyleae)和 Tseboneae 族] 的代表(Pennington,1991;Swenson & Anderberg,2005;Gautier 等,2013)。在異膠木族內,對 Aulandra 屬和 Diploknema 屬的採樣包含模式種。145 個樣本中,137 個來自保存在 K 和 E 標本館的臘葉標本或硅膠乾燥材料(標本館縮寫遵循 Thiers,持續更新),8 個外類群分類單元從 NCBI 序列讀取存檔(Sequence Read Archive)的原始序列數據中下載。膠木屬物種的 21 份模式標本材料中,19 份來自 K 標本館,2 份來自 E 標本館(表 S1:標本信息)。

DNA 提取、文庫構建與靶向捕獲

基因組 DNA 採用 CTAB 法提取(Doyle & Doyle,1987),但 30 份歷史 DNA(hDNA)樣本 [包括模式標本和超過 100 年的臘葉標本材料(平均年齡約 115 年)] 的提取遵循 Latorre 等(2020)的基本方案 1 及 Ferrari 等(2023)的注意事項,主要在避免污染的 hDNA 實驗室內使用含 N - 苯甲醯硫代唑溴化物(PTB)和二硫蘇糖醇(DTT)的提取緩衝液。

文庫構建和靶向捕獲遵循 Phang 等(2023)記錄的方法,使用山欖科特異性探針(Christe 等,2021)。每個樣本使用 90–400 ng DNA 進行雙索引文庫構建,採用 NEBNext Multiplex Oligos for Illumina 和 NEBNext Ultra II DNA 文庫製備試劑盒(New England Biolabs,美國馬薩諸塞州),按製造商說明書 v6.1 操作,用量為推薦值的一半(Hale 等,2020);約 57% 的樣本達到 400 ng,hDNA 樣本為 90 ng。非 hDNA 樣本通常通過 10 輪 PCR 擴增,hDNA 樣本則通過 12–15 輪 PCR 擴增。使用 Qubit 熒光計(Life Technologies Corporation,美國加州卡爾斯巴德)和 Tapestation 4200 系統(Agilent Technologies,美國加州)進行質量檢測和文庫定量。文庫大小平均為 330 bp(非 hDNA 樣本)和 230 bp(hDNA 樣本)。靶向捕獲使用靶向 792 個核基因的定製探針組(Christe 等,2021),採用 MyBaits 協議 v.5.01(Arbor Biosciences)。根據樣本類型(硅膠乾燥、臘葉標本、hDNA)及文庫濃度進一步分組,製備等摩爾混合池。混合文庫由 NovogeneAIT Genomics(新加坡)在 Illumina Novaseq 6000 平台上測序。

質量過濾與系統發育推斷 / 重建

系統發育推斷前的數據處理遵循 Phang 等(2023)的相同設置和閾值,使用 FastQC v.0.11.9 軟體檢查讀段質量,Trimmomatic v.0.39(Bolger 等,2014)去除接頭序列,CutAdapt v.2.3(Martin,2011)去除引物和 poly A 尾,Bowtie2 v.2-2.3.5(Langmead & Salzberg,2012)將讀段映射到探針序列,Samtools v.1.9 對序列比對進行排序,MAFFT v.7.307(Katoh & Standley,2013)進行序列比對,AMAS v.1.0(Borowiec,2016)獲取比對匯總統計。為解決旁系同源問題,採用 Yang & Smith(2014)的 「單系外類群」(MO)方法推斷直系同源基因,將 MO 演算法應用於 Jackson 等(2023)中容器化 HybPiper(Johnson 等,2016)-RBGV 流程標記的旁系同源輸出文件。使用 IQTREE v.2.0(Nguyen 等,2015)基於所有比對串聯的超級矩陣,在 GTR+G 模型下生成最大似然(ML)物種樹(1000 次超快速自展重複)。同時使用 Pargenes v.1.1.2 獲取每個基因座的 ML 樹,並通過 ASTRAL-III(Zhang 等,2018)估計具有後驗概率和四重支持的物種樹。在 phyx v.1.3(Brown 等,2017)中以 Planchonella 屬作為其餘樣本的姐妹群對物種樹進行重根。由於 Planchonella 與 Donella 的拓撲關係不明確,且金葉樹亞科(Chrysophylloideae)的屬級界定仍在分類學研究中(Swenson 等,2023)—— 該亞科已被證明存在非單系群及多次屬級多系性證據(Swenson & Anderberg,2005;Swenson 等,2008;Serrano 等,2021),因此根的位置需謹慎對待。樹圖使用 FigTree v.1.4(http://tree.bio.ed.ac.uk/software/figtree)可視化,在 Rstudio v.4.1.3(R core team,2022)中使用 ape v.5.6-2(Paradis & Schliep,2019)、phytools v.1.0-3(Revell,2012)和 dendextend v.1.16.0(Galili,2015)包繪製纏結圖。對於祖先分布區重建,系統發育分析中每個物種保留一個樣本(除非物種非單系,即同一物種的樣本出現在不同分支中時)。

分歧時間估計

使用 treePL 程序中實現的懲罰似然法(Sanderson,2002)獲得校準的超度量系統發育樹,該方法適用於大型數據集並能產生與貝葉斯法相當的分歧時間(Smith & O'Meara,2012;Zuntini 等,2024)。該方法應用於通過 IQTREE v.2.0 對所有基因進行串聯分區系統發育分析得到的最大似然樹,每個分區分配 GTR+G 模型。使用先前研究的多個校準點:與 Serrano 等(2021)的方法類似,我們將整個樣本集冠節點的最大年齡 102 Ma 應用於系統發育樹的冠根節點,該值源自杜鵑花目(Ericales)的定年系統發育樹(Rose 等,2018)。儘管鑒於金葉樹亞科存在屬級多系性證據(Swenson & Anderberg,2005;Swenson 等,2008),我們的有根系統發育樹中最早的分支是否為該科最早分化的支系仍存在不確定性,但它無疑代表了最早分化的譜系之一(Bartish 等,2011;Swenson 等,2014)。來自委內瑞拉西部馬拉開波盆地古新世 - 始新世過渡期(約 56 Ma)的微化石Psilatricolporites maculosus—— 金葉樹亞科最早報道的化石之一(Lorente,1986;Rull,2000),用於約束 Planchonella 樣本與其姐妹分支分化的最小年齡。來自英國早始新世(56–47.8 Ma,Gruas-Cavagnetto,1976)的鐵線子族(Sideroxyleae)花粉用於約束 Sideroxylum 樣本與其姐妹分支(含膠木屬)分化的最小年齡。來自懷特島的中始新世Tetracolporpollenites花粉粒(與 Pennington(1991)定義的 Mimusopeae 族中的Tieghemella heckelii(A.Chev.)Pierre ex Heine 極為相似)用於將 Mimusops 樣本與其姐妹分支的分化最小年齡約束為 37.2 Ma(Harley,1991;Armstrong 等,2014)。除這些既往校準點外,始新世早中期產地中與膠木屬高度相似的花粉(Hofmann,2018)被用於為異膠木族冠節點分配 41.2 Ma 的最小年齡(化石校準點見圖 S4)。隨後使用 treePL 中的 prime 選項確定最佳優化參數,並選擇最合適的平滑參數 1。

祖先分布區重建

利用時間校準樹,使用 R 包 BioGeoBEARS v1.1(Matzke,2013;R core 團隊,2022)中的可用模型估計祖先分布區概率,其中 DEC 模型通過狹義地理隔離支持成種事件,DIVALIKE 模型通過廣泛地理隔離支持成種,BAYAREALIKE 模型通過區域內成種支持成種,+J 參數考慮新成種事件中向祖先分布區外的區域 「跳躍」 的可能性。應用赤池信息準則(AIC;Akaike,1974)推斷最佳擬合模型。基於現存分布、特有分布區和地質歷史,將研究區域編碼為六個區域,該分類基於 Richardson 等(2014)和 Armstrong 等(2014)提出的方案,以便與本研究直接對比。巽他古陸(Sundaland)和澳大拉西亞(Australasia)在馬來植物區(van Welzen 等,2005)內被編碼為獨立狀態,具體編碼如下:A—— 巽他古陸(包括克拉地峽以南的馬來半島及華萊士線以西的島嶼),B—— 澳大拉西亞(包括華萊士線以東的島嶼),C—— 菲律賓,D—— 南亞(由印度次大陸邊緣定義,含斯里蘭卡),E—— 東亞(克拉地峽以北),F—— 非洲(含馬達加斯加)。隨後通過交叉引用膠木屬的既往研究(van Royen,1960)和世界在線植物資料庫(POWO,2024)中的分布信息,將物種分配至相應區域。

由於 BioGeoBEARS 未考慮譜系滅絕,本研究通過 R 包 LEMAD v.2.1.1(祖先分布的譜系滅絕模型;Herrera-Alsina 等,2022)探索含滅絕模型的影響。該模型是基於 SSE(狀態 - 成種 - 滅絕模型)的分析,整合了 DEC 和 DIVA 模型中的成種假設。在假設兩種不同滅絕率的情況下,擬合含 DEC 成種事件的 LEMAD 模型,並使用 AIC 分數比較。首先,通過擬合生滅過程(R 包 DDD v.5.2.2 中的 bd_ml 函數;Etienne 等,2012)估計滅絕率,隨後假設該速率的兩倍作為更高的滅絕率。由於 LEMAD 無法區分滅絕譜系的缺失分支和採樣導致的缺失分支,因此通過指定分析中包含的已知現存物種百分比,校正不完整系統發育樹的滅絕估計:刪除膠木屬主支以外的所有外類群,設定膠木屬已知物種比例為 0.9,非洲類群為 0.1,並對 LEMAD 中使用的截斷數據集重複 BioGeoBEARS 分析。排除這些類群的原因有二:其一,任何進化多樣化分析的結論僅適用於單系系統發育樹,因包含多個外類群的樹分支模式與作為速率估計基礎的生滅進化過程差異顯著;其二,納入多個外類群會混淆滅絕分支的建模 —— 焦點分支與所有外類群之間存在大量未納入樹中的譜系,這些缺失分支會被誤判為滅絕物種,從而歪曲該分支的成種 - 滅絕動態。儘管本研究樹中存在因採樣導致的缺失分支,但 LEMAD 將採樣與滅絕分開處理,這些分支不視為滅絕譜系;實際上,分析中納入了採樣比例(即因採樣導致的缺失分支數量),顯著改善了速率估計(Mynard 等,2023)。

結果

系統發育分析

經清理的串聯超級矩陣在去除低質量讀段、重複序列並處理旁系同源後,包含 145 個樣本和 738 個基因座,總比對長度 835,913 bp,簡約信息位點 166,674 個,缺失數據占 12.6%(表 S3)。串聯數據集的最大似然分析生成的系統發育樹顯示,所有族的主幹分支支持率完全(bs=100)且各分支(或相關單種分支)支持率高(圖 1),儘管膠木屬內部分支支持率較低(圖 S1)。使用 ASTRAL 重建的系統發育樹中,除異膠木族(Isonandreae)內屬的位置(尤其是與異膠木屬Isonandra的關係)以及膠木屬內少數低支持率物種末梢存在軟性不一致外,族級拓撲結構與最大似然法結果一致且支持率強(圖 S2, S3)。外類群選用金葉樹亞科(Chrysophylloideae,以Planchonella和Donella Pierre ex Baill.為代表)。在山欖亞科(Sapotoideae)中,最早分化的族為鐵線子族(Sideroxyleae,Sideroxylon L.),隨後依次為 Gluemeae(Neolemonniera Heine)、Tseboneae(Tsebona Capuron),以及互為姐妹群的山欖族(Sapoteae,Mimusops)和異膠木族。異膠木族的單系性獲完全支持。膠木屬為非單系群,其分支既嵌套於異膠木屬內,又與異膠木屬形成姐妹群,且澳蘭屬(Aulandra)嵌套於膠木屬主支中(圖 1)。膠木屬主支包含 90% 以上的採樣物種及Aulandra屬。異膠木屬亦為非單系群,Palaquium annamense Lecomte 嵌套於異膠木屬分支(含該屬 10 個物種中的 2 種及 1 個變種),並與含 9 個膠木屬物種的衛星分支互為姐妹群。與異膠木屬、澳蘭屬和膠木屬不同,異膠木族的其他屬(Burckella、Diploknema、Madhuca和Payena)表現為單系群,但需注意採樣有限且未包含部分屬的模式種(Burckella和Payena分別僅採樣 13 種和 20 種中的 2 種;Diploknema採樣 7 種中的 3 種;Madhuca採樣 118 種中的 4 種)。在 ASTRAL 重建中,異膠木屬和膠木屬衛星分支與膠木屬主支互為姐妹群,表明若包含異膠木屬,膠木屬將呈單系性(圖 1)。

分歧時間與祖先分布區重建

對全採樣系統發育樹分析顯示,包含Mimusops和異膠木族的節點年齡估計為 55.0 Ma(節點 I),非洲為最可能的祖先分布區(似然值 86.9%)(圖 2)。異膠木族冠群年齡估計為 47.7 Ma(節點 II),巽他古陸(Sundaland)為最可能起源地(96.9%)。膠木屬主支和衛星分支(圖 2 中節點 IV 及星號)的年齡分別為 45.3 Ma 和 32.4 Ma(中始新世至早漸新世),均起源於巽他古陸。膠木屬主支、亞支及Burckella屬中,澳大拉西亞支系均嵌套於巽他古陸支系內,證實中新世期間(20.3–7.0 Ma;18.6–11 Ma;節點 V–VII)自西向東的擴散模式。膠木屬、Madhuca和異膠木屬的南亞支系也源於巽他古陸(38.8–7.25 Ma),最初起源於始新世 - 漸新世並持續分化至中新世。菲律賓特有分支嵌套於巽他古陸支系內,在中中新世快速分化。Palaquium lobbianum Burck/P. brassii H.J.Lam 和Burckella的祖先分布區以 100% 似然值推斷為澳大拉西亞(節點 V),並嵌套於巽他古陸支系中,明確顯示從巽他古陸到澳大拉西亞的遷移。所有可比節點的年齡均顯著大於 Richardson 等(2014)的平均估計值(表 1,圖 2,圖 S4)。

生物地理分析

在 BioGeoBEARS 的物種水平祖先分布區重建中保留了 145 個末梢(包括 19 個非單系物種的 40 個樣本,這些物種出現在不同分支中,需進一步分類學研究以驗證鑒定結果或物種單系性)。通過擴散和奠基者事件成種實現地理分布演化的 DEC+J 模型獲得最高似然值(LnL = -209.727),對數據擬合最佳,儘管其他模型的似然值和祖先分布區重建結果差異不大(表 S2)。

針對膠木屬主支的 LEMAD 分析中,進一步剔除外類群(包括與異膠木屬接近的膠木屬衛星分支),保留 118 個末梢,基於 DEC 模型(根據 BioGeoBEARS 最佳擬合結果)進行模擬。使用較低滅絕率 0.025 時的 AIC 對數似然值(-626.07)高於滅絕率 0.05 時的結果(-635.12)。在此模型下,包含Mimusops和膠木屬的節點祖先分布區不確定,冠群佔據多個區域(巽他古陸、菲律賓、澳大拉西亞、南亞和非洲)的概率約為 60%。對於膠木屬冠節點,祖先分布區推斷為巽他古陸、菲律賓、澳大拉西亞和南亞(低滅絕率下概率約 55%,高滅絕率下 54%),這增加了祖先分布區重建的不確定性。對該縮減數據集重複 BioGeoBEARS 分析,得出與之前相似的結果,即Mimusops/ 膠木屬的最可能祖先分布區為非洲,膠木屬為巽他古陸(圖 3)。

討論

在本研究中,下一代測序方法和近乎完整的物種水平採樣為膠木屬(Palaquium)提供了前所未有的系統發育解析度,而定年分析則呈現了山欖科(Sapotaceae)這一重要屬最完整的生物地理描述和演化時間線。

山欖科內的族間關係與近期研究(Boluda 等,2022)結果一致,且 Gautier 等(2013)和 Phang 等(2023)已證實膠木屬為非單系群,澳蘭屬(Aulandra)嵌套其中。本研究通過擴展採樣有力地驗證了這些結論,此外還發現一個與異膠木屬(Isonandra)互為姐妹群的膠木屬衛星分支(圖 1)。膠木屬並系性的系統發育證據表明,繼近期Aulandra併入膠木屬(Phang 等,2025)後,需進一步開展工作以解決異膠木族內的屬級分類學問題,並對與異膠木屬互為姐妹群的膠木屬衛星分支,以及嵌套在異膠木屬中的Palaquium annamense進行額外形態學評估 —— 這可能反映了 ASTRAL 和最大似然系統發育重建之間拓撲差異所暗示的不完全譜系分選問題。既往研究認為膠木屬與異膠木屬親緣關係密切:例如許多膠木屬物種最初被歸入異膠木屬,儘管當前形態學界定的基本依據是膠木屬具兩輪三萼片和六基數花冠裂片,而異膠木屬具兩輪二萼片和四基數花冠裂片,但膠木屬中存在不一致現象,如P. ridleyi King 和 Gamble 及P. multiflorum Pierre ex Dubard 的花冠裂片基數為 4–7(Jeuken,1952;van Royen,1960)。基數變異在其他山欖科屬中也有記錄:如Labourdonnaisia Bojer(山欖族)的花冠裂片基數為 6、7–8、12 甚至 18(Randriarisoa 等,2022)。

本研究與既往研究的主要差異涉及異膠木族內節點年齡和相關分化時間的估計,以及考慮譜系滅絕可能性的生物地理模型所突顯的祖先分布區不確定性增加。儘管中始新世異膠木族化石花粉的出現與 Richardson 等(2014)估計的干群 / 冠群年齡(40.5/36.5 Ma)一致,但歐洲 56 Ma 前就已存在與異膠木族冠群類群(膠木屬和Madhuca)相似的花粉(Hofmann,2018),這早於上述估計,而與 Armstrong 等(2014)估計的Mimusops/ 異膠木族節點年齡(58–48 Ma)及本研究結果(55/47.7 Ma;節點 I 和 II;表 1;圖 2)更為吻合。緬甸地塊豐富的異膠木族和Mimusops型花粉也強烈表明,東南亞自早始新世起已開始分化(Huang 等,2021)。

膠木屬的起源與區域分化

本研究發現,膠木屬與異膠木族其他屬共同起源於約 48 Ma 的巽他古陸(Sundaland,節點 II),並在約 45 Ma(節點 III 和 IV)的始新世開始分化,當時全球溫度足夠高,支持暖熱植被的繁盛。

異膠木族在非洲無現存物種,但其與幾乎全為古熱帶分布(以非洲為中心,Manilkara除外)的山欖族(Sapoteae)互為姐妹群(見 Gautier 等,2013 的相同外類群拓撲)。若族間分化發生在始新世,這種地理間斷可通過該時期無霜的氣候條件和中緯度走廊的擴散來解釋,這可能促進了現今局限於低緯度的類群的泛北熱帶遷移(Lavin & Luckow,1993;Zachos 等,2001;Couvreur 等,2011),這也是熱帶非洲和亞洲姐妹類群洲際間斷的主要解釋。事實上,Armstrong 等(2014)和本研究的化石證據及定年結果支持山欖族可能曾存在於泛北熱帶地區。儘管因外類群採樣有限(也鑒於單型屬如塞席爾的Northia Hook.f.的位置未解決 —— 其具主要的二列萼片創新,位於Mimusops和異膠木屬附近;Anderberg & Swenson,2003;Gautier 等,2013),尚無法得出確切結論,但包括膠木屬在內的異膠木族類群的泛北熱帶遷移和分化,可通過古近紀北半球熱帶地區(包括已演化為歐亞大陸的勞亞大陸部分;Bansal 等,2022)的可靠化石證據得以驗證(Armstrong 等,2014;Hofmann,2018)。

討論

至 8000 萬年前歐亞大陸與岡瓦納斷裂帶匯聚時,巽他古陸(Sundaland)的大部分陸地已形成(Hall,2009),為馬來群島(Malesia)豐富的生境系列奠定了基礎。該區域作為複雜的熱帶地質區(Hall,2017),現位於歐亞、菲律賓海、太平洋和印澳四大板塊及若干小板塊的交界處(Tsikouras 等,2021)。在始新世中期異膠木族 / 膠木屬分化期間(49–45 Ma),巽他古陸大部分區域高于海平面,而漸新世變暖進一步促進了這一重要植物多樣性熱點地區的快速演化,有利於常綠森林的擴張(Hall,2009)。隨後從中新世開始,物種從巽他古陸自西向東擴散至澳大拉西亞和菲律賓。這種植物地理聚類與始新世中期以來由亞洲大陸、婆羅洲、菲律賓和新幾內亞組成的連續島弧的歷史連通性一致(Hall,2009;Zahirovic 等,2016;Joyce 等,2020)。事實上,在適宜的氣候條件和地質時間尺度下,通過島嶼跳躍或陸塊間歇連接的短距離水上擴散,可能藉助漂筏碎片的古運輸得以實現(Hall,2001;Siler 等,2012)。膠木屬中某些最年輕的類群(如P. fidjiense Pierre ex Dubard、P. vitilevuense Gilly ex P.Royen、P. stehlinii Christoph.)在這一複雜構造帶的出現,與斐濟在晚中新世(14–5 Ma;Johnson,1991)最早露出陸地的時間一致。

Richardson 等(2014)的若干發現與本研究的系統發育證據一致,強化了東南亞在異膠木族演化中的重要性,具體包括:異膠木族在巽他陸架的早期分化、印度次大陸支系源自巽他支系(與始新世中期印度 - 亞洲碰撞時間吻合;Briggs,2003),以及澳大拉西亞支系嵌套於巽他支系中所體現的跨華萊士線自西向東遷移的主導模式。

從中始新世的泛北熱帶起源開始,膠木屬和其他山欖科類群生存於濕度高、具茂密封閉冠層的氣候中,類似現代雨林(Morley,2018)。漸新世暖濕氣候下亞洲與印度持續碰撞,使印度次大陸與東南亞勞亞大陸段在相似緯度共享連通性(Morley,2003),為膠木屬向南亞擴散提供了機會。中新世 - 更新世期間,通過馬來群島與亞洲大陸間連續森林覆蓋的陸地擴散仍具可能性;此外,自西向東擴散與海平面波動及中新世導致巽他 - 薩胡爾陸架匯聚的構造事件一致(Hall,2009)。許多其他具雨林支系的植物科遵循從泛北熱帶地區經巽他古陸遷入東南亞的遷移模式,如番荔枝科和棕櫚科類群分子系統發育中非洲 - 亞洲的分化,反映了古新世 - 始新世極熱事件期間暖熱植被帶因氣候導致的斷裂(Richardson 等,2004;Couvreur 等,2011;Baker & Couvreur,2013)。

儘管本研究對非洲類群的採樣有限,Mimusops/ 異膠木族的分化仍需謹慎解讀,但歐洲和東南亞發現的早始新世異膠木族和Mimusops型花粉化石證據(Hofmann,2018;Huang 等,2021)並不明確支持既往研究(Richardson 等,2014;Armstrong 等,2014)或本研究 BioGeoBEARS 結果所假設的非洲起源。與化石記錄最吻合的是 LEMAD 中考慮滅絕譜系可能分布的含滅絕重建,其估計異膠木族的祖先分布區模稜兩可且不確定。儘管歐洲的化石記錄仍有可能源於次級擴散,但結果提出了一種可能性:Mimusops和異膠木族在涵蓋東南亞和非洲的更大區域內演化,這解釋了白堊紀晚期(80 Ma;Hall,2009)巽他古陸與勞亞大陸的整合。

節點年齡的估計也需謹慎評估,原因包括方法學的可變性(如可變先驗的應用)和非洲始新世前、古新世化石的持續缺失。Richardson 等(2014)與 Armstrong 等(2014)的節點年齡差異部分源於數據集和方法的不同(Hofmann,2018)。值得注意的是,Richardson 等(2014)僅使用鐵線子族干群節點(52.2 Ma)的一個化石約束,而 Armstrong 等(2014)除此以外還納入了山欖族冠群約束(42.9 Ma)。本研究額外整合了金葉樹亞科(56 Ma;Swenson 等,2014 和 Serrano 等,2021 使用)和近期特徵明確的異膠木族型花粉(41.2 Ma;Hofmann,2018)的約束。Richardson 等(2014)和 Armstrong 等(2014)均使用 BEAST 軟體基於 ITS 數據集評估分歧時間,但前者應用 Yule 樹先驗,後者使用生滅過程。鑒於 Armstrong 等(2014)基於貝葉斯定年的Mimusops/ 異膠木族分化年齡估計(58–48 Ma)與本研究使用 treePL 最大似然法的結果(55 Ma)吻合,可推測山欖族和異膠木族內增強的校準點有助於糾正 Yule 模型應用中未考慮滅絕的偏差(Condamine 等,2015)。因此,儘管 treePL 等懲罰似然法有時會得出更古老的年齡(Boluda 等,2022),本研究的節點年齡仍被視為合理估計。

與異膠木族物候相關的擴散因素和動物傳播支系的演化也值得關注。在促進熱帶森林擴張的中中新世氣候條件下,Crayn 等(2015)指出,巽他和薩胡爾陸架上的遷移必然在不同地點包含水障或植被墊腳石,這有利於水或脊椎動物作為擴散媒介,而這種種子擴散方式與動物傳播支系的定殖成功相關。值得注意的是,本研究中菲律賓和南亞特有支系嵌套於巽他起源支系的模式,也可見於犬吻果蝠(狐蝠科犬吻果蝠亞科;Almeida 等,2009),其已被觀察到在膠木屬中表現出傳粉行為和種子擴散(Hodgkison 等,2004;Phang,2023)。儘管犬吻果蝠亞科未在澳大拉西亞分布,但狐蝠科的另一果蝠支系Pteropus分布於華萊士線兩側,並被發現從華萊士區(本研究中建模為巽他古陸的一部分)分化而來。的確,有獨立證據支持狐蝠科的東南亞起源(最古老化石可追溯至始新世 / 漸新世;Ducrocq 等,1993;Hassanin 等,2020),該食果蝠類群在冠群階段經歷快速分化(估計範圍為 40.2–24.8 Ma:Shi & Rabosky,2015;Almeida 等,2021),與膠木屬在亞洲分布區的被子植物擴張和物種分化時間吻合。這支持了巽他陸架是膠木屬和犬吻果蝠演化事件核心驅動力的假設,這反映在地理隔離和連續擴張的支序模式中 —— 向東至菲律賓和澳大拉西亞,向北至南亞。

結論

本研究採用靶向捕獲方法,揭示了膠木屬(Palaquium,目前山欖科中最大的屬)迄今最全面且解析度最高的系統發育樹。系統基因組學關係表明,當前界定的膠木屬並非單系群 —— 存在一個與異膠木屬(Isonandreae)親緣關係更近的亞洲分支,而澳蘭屬(Aulandra)嵌套於膠木屬內部。生物地理重建顯示,膠木屬及異膠木族相關屬的多樣化時間早於既往研究,且應用明確考慮滅絕事件的新建模方法,揭示了泛北熱帶替代信號及巽他古陸內的祖先分布區可能性,這與始新世化石記錄更為吻合。

本研究呈現的系統發育和植物地理結果,為探究與膠木屬近緣的其他屬的多樣化模式提供了框架,並增進了我們對塑造東南亞顯著物種多樣性的演化過程的理解。未來研究若能將異膠木族類群的成種事件與其假定的傳粉者和擴散媒介相聯繫,將有助於深入理解影響 speciation 的各種生態因素,尤其是對於像膠木屬這樣以低密度分布於破碎生境中、易受蝙蝠 - 花朵協同演化影響的植物類群(Fleming 等,2009)。

A. Phang, M.A. Niissalo, L. Herrera-Alsina, F.F. Pezzini, R. Hollands, D.F.R.P. Burslem, M. Ruhsam, D.J. Middleton, P. Wilkie, G.S. Khew

Novel phylogenomic and biogeographic insights into Palaquium and tribe Isonandreae (Sapotaceae)

https://doi.org/10.1016/j.ympev.2025.108403

Molecular Phylogenetics and Evolution YMPEV 108403

文內圖片及封面圖片來源原文