本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2024-03-12
摘要
《文本即資料》代表了社會科學、數位人文和資料科學中文本分析教學的重大進步,它為如何概念化和部署自然語言處理技術提供了一個整合框架,以豐富文本中社會生活的描述性和因果分析。在這裡,我回顧了本書的成就,並強調了未採取的補充路徑,包括對變壓器等最新計算技術的討論,這些技術已經主導了自動語言理解,並且剛開始進入書中展示的仔細研究設計。這些新方法不僅強調文本是來自社會的訊號,而且強調文本模型作為社會的模擬,這可以推動因果推理和實驗的未來進步。 《文本即數據》對文本發現、測量和推理的關注將我們引向了這個新領域,告誡我們不要忽視,而是要建立在社會科學解釋和理論的基礎上。