聖塔非研究所

摘要 《文本即資料》代表了社會科學、數位人文和資料科學中文本分析教學的重大進步,它為如何概念化和部署自然

2024-03-12 · 已發表論文 · 更新 2026/03/18 下午05:14

摘要 《文本即資料》代表了社會科學、數位人文和資料科學中文本分析教學的重大進步,它為如何概念化和部署自然語言處理技術提供了一個整合框架,以豐富文本中社會生活的描述性和因果分析。在這裡,我回顧了本書的成就,並強調了未採取的補充路徑,包括對變壓器等最新計算技術的討論,這些技術已經主導了自動語言理解,並且剛開始進入書中展示的仔細研究設計。這些新方法不僅強調文本是來自社會的訊號,而且強…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2024-03-12

摘要

《文本即資料》代表了社會科學、數位人文和資料科學中文本分析教學的重大進步,它為如何概念化和部署自然語言處理技術提供了一個整合框架,以豐富文本中社會生活的描述性和因果分析。在這裡,我回顧了本書的成就,並強調了未採取的補充路徑,包括對變壓器等最新計算技術的討論,這些技術已經主導了自動語言理解,並且剛開始進入書中展示的仔細研究設計。這些新方法不僅強調文本是來自社會的訊號,而且強調文本模型作為社會的模擬,這可以推動因果推理和實驗的未來進步。 《文本即數據》對文本發現、測量和推理的關注將我們引向了這個新領域,告誡我們不要忽視,而是要建立在社會科學解釋和理論的基礎上。