近日,中國科學院南海海洋研究所林強研究員團隊在海洋生物物種分布模型構(gòu)建中如何選擇交叉驗證方法取得新的研究進展,相關(guān)成果“Cross-validation matters in species distribution models: A case study with goatfish species”于2024年9月17日在線發(fā)表在國際頂尖生態(tài)學期刊Ecography上。聯(lián)合培養(yǎng)研究生黃紅偉、研究員張志新為本文共同第一作者,研究員林強和張志新為本文共同通訊作者。
在全球生物多樣性持續(xù)喪失的背景下,準確評估生物多樣性的空間分布模式對于制定有效的保護和管理策略至關(guān)重要。物種分布模型(SDMs)已成為評估生物多樣性的一種重要工具,它通過分析物種分布數(shù)據(jù)與生態(tài)因子之間的關(guān)系來預測目標物種的適宜棲息地分布。在模型構(gòu)建過程中,交叉驗證是評估模型預測性能的關(guān)鍵步驟。交叉驗證通過在不同數(shù)據(jù)集上反復訓練和驗證模型,幫助研究人員選擇最佳模型參數(shù)。雖然隨機交叉驗證方法是最常見的選擇,但最近一些研究者提出了空間交叉驗證方法,以解決隨機交叉驗證忽視空間自相關(guān)性的問題。
該研究通過隨機交叉驗證與空間交叉驗證方法,以海洋近海典型魚類—羊魚(Actinopteri: Syngnathiformes: Mullidae)為對象進行模型的參數(shù)優(yōu)化和性能評估。研究發(fā)現(xiàn),兩種交叉驗證方法在95%的物種中得出了不同的最佳模型參數(shù)組合,并且在預測當前和未來的棲息地分布方面存在顯著差異(圖1)。隨機交叉驗證方法在預測性能上可能存在過高估計的風險,而空間交叉驗證方法傾向于保守。
圖1 基于隨機交叉驗證和空間交叉驗證方法的模型預測能力和變量重要性
同步研究結(jié)果表明,盡管隨機交叉驗證和空間交叉驗證方法在物種分布預測上存在差異,但兩者均一致得出印度-澳大利亞群島是羊魚物種豐富度最高的地區(qū),并且最易受到氣候變化的影響(圖2)。
圖2 當前氣候下基于隨機交叉驗證和空間交叉驗證方法模型預測的空間及緯度分布格局
本研究首次系統(tǒng)性地比較了隨機交叉驗證與空間交叉驗證方法對SDMs結(jié)果的影響,揭示了選擇交叉驗證方法對SDMs預測性能和結(jié)果的重要影響,為生物多樣性評估研究提供了新的視角。
該研究工作得到了國家自然科學基金項目、國家重點研發(fā)計劃項目等的聯(lián)合資助。
相關(guān)論文信息:Hongwei Huang,Zhixin Zhang*,ákos Bede-Fazekas,Stefano Mammola,Jiqi Gu,Jinxin Zhou,Junmei Qu,& Qiang Lin*,2024: Cross-validation matters in species distribution models: a case study with goatfish species. Ecography. DOI: 10.1111/ecog.07354.
原文鏈接:https://nsojournals.onlinelibrary.wiley.com/doi/full/10.1111/ecog.07354
附件下載: