聖塔非研究所

語言網路中的歧義

2026-03-18 · 工作論文 · 更新 2026/03/18 下午01:00

摘要 人類語言定義了最複雜的演化結果。這種複雜的交流形式的出現使人類能夠創建極其結構化的社會並在不同層面上管理符號,其中包括語義。所有語言層級都必須處理源自語言遞歸性質的天文組合潛力。這種遞歸性確實是一個關鍵的定義特徵。然而,並非所有單字的組合和頻率都相同。在打破較少使用和較多使用以及較少和較多意義承載單元之間的對稱性時,出現了通用縮放定律。這些法則對所有人類語言來說都是共同的…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #158
  • 日期:2026-03-18

摘要

人類語言定義了最複雜的演化結果。這種複雜的交流形式的出現使人類能夠創建極其結構化的社會並在不同層面上管理符號,其中包括語義。所有語言層級都必須處理源自語言遞歸性質的天文組合潛力。這種遞歸性確實是一個關鍵的定義特徵。然而,並非所有單字的組合和頻率都相同。在打破較少使用和較多使用以及較少和較多意義承載單元之間的對稱性時,出現了通用縮放定律。這些法則對所有人類語言來說都是共同的,它們出現在從單字庫到互動單字網路的不同階段。在語言網絡表現出的這些看似普遍的特徵中,歧義似乎是一個特別相關的組成部分。大多數語言處理計算方法都避免歧義,但它似乎是語言架構的關鍵要素。在這裡,我們回顧了來自語言網路架構和基於最省力論證的理論推理的證據。歧義被證明在提供語言效率的來源方面發揮著重要作用,並且很可能是網路成長不可避免的副產品。