Llama.cpp 新增 Mellum 架構支持
GitHub 發布中,開源項目 Llama.cpp 推出了新版本 b9482。這個版本的主要更新是添加了對 Mellum 架構的支持,讓使用者能夠運行基於該架構的模型。發布內容還包括對 mellum.py 檔案的格式化改進,以及將 transformers 依賴降級至 4.57.6 以解決持續整合問題。同時,項目移除了 huggingface_hub 的依賴,進一步簡化了依賴管理。發布提供了廣泛的平台支持,包括 macOS、Linux、Windows、Android 和 iOS 的二進制文件,涵蓋 CPU、Vulkan、CUDA、ROCm 等多種加速選項,適用於不同硬體環境。此次更新展現了 Llama.cpp 在擴展模型兼容性和提升開發效率方面的努力。
來源
來源:GitHub Release
- GitHub Releaseb9482