聖塔非研究所

摘要 物種出現的大規模生物資料庫或觀察到物種的地理參考位置是對當前和未來物種分佈進行建模的重要輸入

2024-03-12 · 已發表論文 · 更新 2026/03/18 下午05:33

摘要 物種出現的大規模生物資料庫或觀察到物種的地理參考位置是對當前和未來物種分佈進行建模的重要輸入。位置準確性通常透過確定觀測地理座標是否落在所宣布的政治分區的邊界內來評估。由於將政治部門名稱與正確的地理空間物件相符的難度,這種原本簡單的驗證變得複雜。多種語言中的拼字錯誤、縮寫、替代代碼和同義詞給名稱消歧帶來了艱鉅的挑戰。無法解析政治部門名稱會減少可用數據,對錯誤觀察的分析可能…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2024-03-12

摘要

物種出現的大規模生物資料庫或觀察到物種的地理參考位置是對當前和未來物種分佈進行建模的重要輸入。位置準確性通常透過確定觀測地理座標是否落在所宣布的政治分區的邊界內來評估。由於將政治部門名稱與正確的地理空間物件相符的難度,這種原本簡單的驗證變得複雜。多種語言中的拼字錯誤、縮寫、替代代碼和同義詞給名稱消歧帶來了艱鉅的挑戰。無法解析政治部門名稱會減少可用數據,對錯誤觀察的分析可能會導致有缺陷的結果。在這裡,我們介紹地理名稱解析服務 (GNRS),這是一個用於糾正、標準化和索引世界政治區劃名稱的應用程式。 GNRS 根據參考資料庫解析政治區劃名稱,該參考資料庫將 GeoNames 中的名稱和代碼與全球行政區域資料庫 (GADM) 中的地理空間物件識別碼結合。在從超過 2.7 億個物種事件中提取的政治區劃名稱進行的試驗解析中,只有 1.9%(僅佔事件總數的 6%)與原始形式的 GADM 政治區劃完全匹配。 GNRS 能夠完全或部分解析剩餘 378,568 個政治區劃名稱中的 92%,或完整生物多樣性發生資料集的 86%。在評估超過 2.39 億個物種事件的地理座標精度時,GNRS 解決了政治分歧,使得能夠檢測到更多數量級的錯誤和更多數量級的無錯誤事件。透過為重大數據品質障礙提供新穎的解決方案,GNRS 釋放了大量生物多樣性數據,用於定量生物多樣性研究。 GNRS 作為 Web 服務運行,可透過 API、R 套件和基於 Web 的圖形使用者介面進行存取。其模組化架構可以輕鬆整合到現有的資料驗證工作流程中。