2026年6月10日,AMD 正式发布Lemonade SDK 10.7.0版。 其中,最值得关注的更新是首次 新增了对 英伟达CUDA GPU的原生支持。
Lemonade是AMD推出的开源本地AI服务器解决方案,声称提供与OpenAI、Anthropic 和 Ollama 完全兼容的API接口。据 AMD介绍,它能够 智能识别硬件并自动为用户系统配置经过深度 优化的CPU、GPU和NPU后端,全面支持文本生成、图像生成和音频推理三大核心 AI任务。该项目 原生 支持 Windows、Linux、macOS 以及 Docker 容器化部署 环境。
在 Lemonade 10.7.0 版本中,该项目 基于业界标准的 llama.cpp 推理框架 为 Windows 和 Linux 平台集成了 完整的 CUDA 支持。同时 首次 新增了 Linux 下的 stable-diffusion.cpp CUDA支持,以及 Windows 和 Linux 下的 stable-diffusion.cpp Vulkan 支持。这些改进 彻底打破了厂商壁垒, 显著提升了跨多个 GPU 供应商的AI推理兼容性。
官方更新日志明确确认,本次新增的 "llamacpp:cuda" 专用后端 实现了对英伟达GPU的完整支持。同时,还修复了Linux系统下英伟达最新Blackwell架构GPU和主显卡切换检测的问题,这表明 CUDA 推理路径已 提前 针对较新的 英伟达 硬件进行了特别优化调整。
此外,该更新 进一步扩展了模型生态, 为所有兼容 OpenAI API 的应用(包括主流的 Open WebUI 和 AnythingLLM)新增了 LMX-Omni 多模态模型支持,使 这些应用能够无缝渲染文本、图像、音频等多媒体输出。Lemonade 10.7.0 还引入了一个标准原生的Prometheus端点,用于 企业级 实时统计监控。
本次更新最具实用价值的新功能之一 是 "lemonade bench" 一站式基准测试 命令。该功能 首次 提供了跨 llama.cpp、FastFlowLM、vLLM 和Ryzen AI软件四大主流推理引擎的LLM基准测试能力,便于用户在同一系统上公平、直观地比较不同后端的本地 AI 性能。
总的来说,本次Lemonade SDK 10.7.0版的发布,标志着AMD在本地AI生态战略上迈出了里程碑式的一步。通过主动支持竞争对手英伟达的CUDA生态,AMD彻底打破了长期以来AI推理领域的厂商硬件壁垒,真正实现了"一套SDK适配全主流硬件"的行业愿景。
对于普通用户和开发者而言,这一更新带来的价值立竿见影:无论你使用的是AMD Radeon显卡、NVIDIA GeForce/RTX系列GPU,还是搭载Ryzen AI NPU的处理器,都可以通过统一的Lemonade平台部署和运行本地AI应用,无需为不同硬件更换推理框架或重新适配代码。
这种"开放优先"的策略,也将倒逼其他厂商进一步开放自家生态,最终推动整个本地AI行业向更普惠、更兼容的方向发展。 未来,随着Lemonade SDK持续完善对更多硬件架构和模型类型的支持,它有望成为本地AI部署领域的事实标准之一,为AI应用从云端向边缘和本地迁移提供坚实的基础设施支撑。
小编将在第一时间分享更多相关最新动态和爆料,敬请关注。