聖塔非研究所

摘要 背景:生物多樣性數據的數位化導致多餘、模糊或不正確的分類單元名稱的廣泛應用,導致記錄不匹配和物種數

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:31

摘要 背景:生物多樣性數據的數位化導致多餘、模糊或不正確的分類單元名稱的廣泛應用,導致記錄不匹配和物種數量膨脹。拼字錯誤的名稱和錯誤的分類法的最終後果是錯誤的科學結論和錯誤的政策決策。缺乏糾正這個「名稱問題」的工具已成為整合不同資料來源和推動生物多樣性科學進步的根本障礙。結果:TNRS(或分類名稱解析服務)是一種線上應用程序,用於自動化和用戶監督的植物學名標準化。 TNRS 建…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

背景:生物多樣性數據的數位化導致多餘、模糊或不正確的分類單元名稱的廣泛應用,導致記錄不匹配和物種數量膨脹。拼字錯誤的名稱和錯誤的分類法的最終後果是錯誤的科學結論和錯誤的政策決策。缺乏糾正這個「名稱問題」的工具已成為整合不同資料來源和推動生物多樣性科學進步的根本障礙。結果:TNRS(或分類名稱解析服務)是一種線上應用程序,用於自動化和用戶監督的植物學名標準化。 TNRS 建置並擴展了現有的開源應用程序,用於名稱解析和模糊匹配。名稱根據多種參考分類法進行標準化,包括密蘇裡植物園的 Tropicos 資料庫。 TNRS 能夠在一次操作中處理數千個名稱,解析並修正拼字錯誤的名稱和權限,標準化變體拼寫,並將命名同義詞轉換為可接受的名稱。可以包含姓氏以提高匹配準確性並解決許多類型的同音異義詞。較高分類群的部分匹配與註釋、登錄號和形態種的提取相結合,使 TNRS 能夠在廣泛的活動和遺留資料集中實現分類標準化。結論:我們展示了 TNRS 如何解決多種形式的分類語義異質性、糾正拼字錯誤並消除虛假名稱。因此,TNRS 可以幫助整合不同的生物資料集。儘管 TNRS 的開發是為了幫助標準化植物名稱,但其底層演算法和設計可以擴展到所有生物體和命名代碼。 TNRS 可透過 上的 Web 介面進行訪問,並作為 RESTful Web 服務和應用程式介面進行存取。原始碼可在 取得。