llama.cpp b9496版修復Gemma 4浮點錯誤
GitHub上,llama.cpp項目正式發布了b9496版本,此次更新主要針對Gemma 4模型進行了修復,解決了統一浮點錯誤(FPE)的問題。官方在發布說明中詳細列出了支持的平台,包括macOS、iOS、Linux、Android和Windows。在macOS方面,提供了Apple Silicon (arm64) 和Intel (x64) 的二進制檔案,其中KleidiAI版本被標記為禁用。iOS則提供了XCFramework。Linux平台支持Ubuntu x64、arm64、s390x,並包含Vulkan、ROCm 7.2、OpenVINO等後端,但SYCL FP32版本被禁用。Android提供了arm64 CPU版本。Windows平台涵蓋了CPU、CUDA 12、CUDA 13、Vulkan和HIP等選項,CUDA DLLs也單獨提供。此外,openEuler平台的支持被標記為禁用。此次修復由PR #24088引入,旨在提升Gemma 4模型在不同硬件和作業系統上的穩定性和效能,為開發者提供更可靠的工具鏈。
來源
來源:GitHub Release
- GitHub Releaseb9496