研究06/05 24:17

研究員測試 AI 漏洞挑戰：GPT 5.5 成功率最高、DeepSeek V4 Pro 成本最低

根據媒體報導指出，安全研究員 Kasra Rahjerdi 於昨日發布了一份詳細報告，旨在評估多款人工智慧大語言模型在安全推理方面的能力。報告中，他搭建了一個故意留有漏洞的圖書評論 APK，作為測試平台，讓不同的 AI 模型進行挑戰，以測試其在面對安全漏洞時的推理表現。測試結果顯示，GPT 5.5 在漏洞挑戰中的成功率最高，展現出優異的安全推理能力；同時，DeepSeek V4 Pro 在成本效益方面表現突出，成為所有測試模型中成本最低的選擇。這項研究不僅提供了 AI 模型安全性能的比較數據，也為開發者和用戶在選擇 AI 工具時提供了重要參考。報告的發布引發了社群對 AI 安全性的進一步討論。

來源：媒體報導

媒體報導研究员测试 AI 漏洞挑战：GPT 5.5 成功率最高、Deepseek V4 Pro 成本最低