聖塔非研究所

隨機文字呈現類似齊普夫定律的詞頻分佈

2026-03-18 · 工作論文 · 更新 2026/03/19 上午02:33

摘要 結果表明,隨機生成文本的詞頻分佈與在英語等自然語言中觀察到的齊普夫定律非常相似。單字的出現頻率幾乎是其等級的逆冪律函數,而該逆冪律的指數非常接近1,這很大程度上是由於單字長度到其等級的變換,將指數函數延伸為冪律函數。

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #1630
  • 日期:2026-03-18

摘要

結果表明,隨機生成文本的詞頻分佈與在英語等自然語言中觀察到的齊普夫定律非常相似。單字的出現頻率幾乎是其等級的逆冪律函數,而該逆冪律的指數非常接近1,這很大程度上是由於單字長度到其等級的變換,將指數函數延伸為冪律函數。