摘要近年來，科學家、科學期刊、文章和研究結果的爆炸性增長 1 ,2 呈指數級增加了科學家在駕馭先驗知識｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

SFI 頁面

論文資訊

類型：已發表論文
日期：2022-09-02

摘要

近年來，科學家、科學期刊、文章和研究結果的爆炸性增長 1 ,2 呈指數級增加了科學家在駕馭先驗知識並對其進行集體推理以推動未來進步 3 ,4 方面所面臨的難度。已發表的研究結果的可重複性的不確定性加劇了這項挑戰 5 –8。一方面，大量數位檔案、機器讀取和提取工具的可用性，另一方面自動化高通量實驗，使我們能夠大規模評估這些挑戰，並發現加速科學進步的新機會9。在這裡，我們展示了一種貝葉斯演算，它能夠對穩健、可複製的科學主張進行積極預測，並從已發表的基因交互作用文獻中自動提取結果。我們將這些經過科學過濾的發現與透過大規模 LINCS L1000 高通量實驗測量的未經過濾的基因交互作用進行匹配，以識別和抵消偏差來源。我們的演算建立在易於提取的出版物元數據的基礎上，這些元數據涉及科學主張在先驗知識網絡中的位置，及其在機構、作者和社區中的廣泛支持，揭示了以科學為重點但在社會和機構上獨立的研究活動最有可能被複製。這與「跟隨領導者」（信任頂級期刊和頂級科學家）等替代策略的無效性形成鮮明對比，這些策略不能預測可靠的發現。這些研究結果所建議的政策違背了將生物醫學研究資金引入集中研究聯盟和機構而不是更廣泛地分散的常見做法。我們的結果表明，強有力的科學發現取決於共同焦點和獨立性之間的微妙平衡，並且可以透過計算利用這種複雜的模式來解碼偏見並預測已發表研究結果的可複製性。這些見解為科學家瀏覽研究文獻和尋求改進研究文獻的科學資助者提供了指導。此外，我們的專案模擬了一個完全由機器驅動的研究流程，從機器閱讀到評估，可以透過智慧演算法合併來增強科學搜索，推薦富有成效的研究假設，以加速累積的科學進步。