返回事件流

透過玩『戰艦』遊戲教導 AI 代理人問更好的問題

據媒體報導指出,麻省理工學院電腦科學與人工智慧實驗室(MIT CSAIL)和哈佛大學工程與應用科學學院(SEAS)的研究人員,利用經典桌遊『戰艦』來訓練人工智慧代理人提出更有效的問題。在他們的『協作戰艦』遊戲中,一方擔任『艦長』詢問隱藏船隻位置,另一方擔任『觀察員』即時回應。研究團隊先讓超過 40 名人類玩家進行遊戲,建立『BattleshipQA』數據集,作為比較基準。隨後,他們測試了先進的語言模型如 GPT-5 和較小的模型如 Llama 4 Scout。結果發現,頂尖模型能以較少回合『擊敗』人類,但小型系統表現較差,主要問題在於不擅長提出有用的問題。為改善此狀況,研究人員為每個模型引入蒙地卡羅推理策略,仔細衡量不同選項的正確可能性。經過調整後,AI 模型不論規模大小,都能在『戰艦』遊戲中擊敗普通玩家。其中,小型模型 Llama 4 Scout 的勝率從原本的 8% 大幅提升至 82%,並能以僅約 GPT-5 成本 1% 的資源,超越其表現。此外,研究團隊還透過將問題轉換為 Python 程式碼來驗證答案,提升了模型回答問題的準確度,平均提升 15%。這項研究展示了讓 AI 代理人學習問問題的重要性,並開啟了在科學領域以外如編碼和數學問題解決的應用潛力。

來源:媒體報導