本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2024-03-12
摘要
美國的意識形態分歧在日常互動中日益凸顯。因此,人們對政治極化進行了大量研究,包括最近從計算角度進行的許多研究。透過檢測文本文檔中的政治偏見,人們可以嘗試辨別和描述其極性。直觀上,文本中的命名實體(即名詞和充當名詞的短語)和主題標籤通常攜帶有關政治觀點的訊息。例如,使用「支持墮胎」一詞的人可能是自由派,而使用「反對墮胎」一詞的人可能是保守派。在本文中,我們試圖揭示社群媒體文字資料中的政治極性,並透過為實體和主題標籤明確分配極性分數來量化這些極性。儘管這個想法很簡單,但很難以可靠的定量方式進行這樣的推論。主要挑戰包括已知標籤數量較少、政治觀點的連續範圍以及在單字嵌入向量中保留極性得分和極性中性語義。為了嘗試克服這些挑戰,我們提出了極性感知嵌入多任務學習(PEM)模型。該模型由(1)自我監督的上下文保護任務、(2)基於注意力的推文級極性推斷任務和(3)促進嵌入的極性組件與其語義組件之間的獨立性的對抗性學習任務組成。我們的實驗結果表明,我們的 PEM 模型可以成功學習極性感知嵌入,並且在推文層級和帳戶層級分類任務中表現良好。我們研究了各種應用,包括極性的空間和時間分佈的研究以及 Twitter 推文和 Parler 貼文之間的比較,從而證明了 PEM 模型的有效性。我們還討論了我們工作的重要局限性,並鼓勵在將 PEM 模型應用於現實場景時保持謹慎。