搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

Mac Studio M4 通过 vLLM 部署本地大模型，对接 Jeecg-AI
基于 vllm-metal 和 vllm-mlx 的 Apple Silicon 推理方案目标硬件：Mac Studio M4 Max (16+40 核) 128GB 1TB（Z1CD00240）1. 方案一：安装 vllm-metal（官方推荐）vllm-metal 是 vLLM 官方社区维护的 Apple Silicon 插件，将 MLX 和 PyTorch 统一在单一计算路径下，支持零拷贝操作。启动模型服务7.1 使用 vllm-metal 启动# 激活环境source ~/.venv-vllm-metal/bin/activate# 方式一：在线模型（自动下载）vllm serve mlx-community 安装脚本报错尝试删除并重新安装：rm -rf ~/.venv-vllm-metalcurl -fsSL https://raw.githubusercontent.com/vllm-project/vllm-metal 推荐从 vllm-metal + Qwen2.5-72B-Instruct-4bit 开始，这套组合在中英文场景下都有出色的表现，且 128GB 内存可以轻松承载。
75410编辑于 2026-03-12