本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
预测流感病毒的出现和传播是一项重要的公共卫生挑战。及时准确地估计流感流行率,特别是需要住院治疗的重症病例,可以改进控制措施,减少传播和死亡率。在這裡,我們擴展了先前發布的流感預測機器學習方法,以整合多個不同的資料來源,包括傳統監測資料、電子健康記錄、網路搜尋流量和社群媒體活動。我們的分層框架使用多線性迴歸將多個資料來源的預測結合起來,並使用貪婪最佳化和前向選擇來順序選擇最具預測性的資料來源組合。我们表明,互补数据源的系统集成可以大大提高单一数据源的预测准确性。在預測第 48 週至第 20 週的疾病管制與預防中心 (CDC) 流感樣疾病報告 (ILINet) 時,預測變數的最佳組合包括公共衛生監測數據和市售電子病歷,但既不包括搜尋引擎數據,也不包括社群媒體數據。