返回事件流

研究員測試 AI 漏洞挑戰:GPT 5.5 成功率最高、DeepSeek V4 Pro 成本最低

根據媒體報導指出,安全研究員 Kasra Rahjerdi 於昨日發布了一份詳細報告,旨在評估多款人工智慧大語言模型在安全推理方面的能力。報告中,他搭建了一個故意留有漏洞的圖書評論 APK,作為測試平台,讓不同的 AI 模型進行挑戰,以測試其在面對安全漏洞時的推理表現。測試結果顯示,GPT 5.5 在漏洞挑戰中的成功率最高,展現出優異的安全推理能力;同時,DeepSeek V4 Pro 在成本效益方面表現突出,成為所有測試模型中成本最低的選擇。這項研究不僅提供了 AI 模型安全性能的比較數據,也為開發者和用戶在選擇 AI 工具時提供了重要參考。報告的發布引發了社群對 AI 安全性的進一步討論。

來源:媒體報導