研究06/04 14:36

透過玩『戰艦』遊戲教導 AI 代理人問更好的問題

據媒體報導指出，麻省理工學院電腦科學與人工智慧實驗室（MIT CSAIL）和哈佛大學工程與應用科學學院（SEAS）的研究人員，利用經典桌遊『戰艦』來訓練人工智慧代理人提出更有效的問題。在他們的『協作戰艦』遊戲中，一方擔任『艦長』詢問隱藏船隻位置，另一方擔任『觀察員』即時回應。研究團隊先讓超過 40 名人類玩家進行遊戲，建立『BattleshipQA』數據集，作為比較基準。隨後，他們測試了先進的語言模型如 GPT-5 和較小的模型如 Llama 4 Scout。結果發現，頂尖模型能以較少回合『擊敗』人類，但小型系統表現較差，主要問題在於不擅長提出有用的問題。為改善此狀況，研究人員為每個模型引入蒙地卡羅推理策略，仔細衡量不同選項的正確可能性。經過調整後，AI 模型不論規模大小，都能在『戰艦』遊戲中擊敗普通玩家。其中，小型模型 Llama 4 Scout 的勝率從原本的 8% 大幅提升至 82%，並能以僅約 GPT-5 成本 1% 的資源，超越其表現。此外，研究團隊還透過將問題轉換為 Python 程式碼來驗證答案，提升了模型回答問題的準確度，平均提升 15%。這項研究展示了讓 AI 代理人學習問問題的重要性，並開啟了在科學領域以外如編碼和數學問題解決的應用潛力。

來源：媒體報導

媒體報導Teaching AI agents to ask better questions by playing “Battleship”