開源06/04 14:35

llama.cpp b9496版修復Gemma 4浮點錯誤

GitHub上，llama.cpp項目正式發布了b9496版本，此次更新主要針對Gemma 4模型進行了修復，解決了統一浮點錯誤（FPE）的問題。官方在發布說明中詳細列出了支持的平台，包括macOS、iOS、Linux、Android和Windows。在macOS方面，提供了Apple Silicon (arm64) 和Intel (x64) 的二進制檔案，其中KleidiAI版本被標記為禁用。iOS則提供了XCFramework。Linux平台支持Ubuntu x64、arm64、s390x，並包含Vulkan、ROCm 7.2、OpenVINO等後端，但SYCL FP32版本被禁用。Android提供了arm64 CPU版本。Windows平台涵蓋了CPU、CUDA 12、CUDA 13、Vulkan和HIP等選項，CUDA DLLs也單獨提供。此外，openEuler平台的支持被標記為禁用。此次修復由PR #24088引入，旨在提升Gemma 4模型在不同硬件和作業系統上的穩定性和效能，為開發者提供更可靠的工具鏈。

來源

來源：GitHub Release

GitHub Releaseb9496