搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏机器学习与统计学
Qwen3.5本地部署终极指南，Qwen3.5-27B
Qwen3.5 轻量版来了，更智能，更小巧，量化版本地部署，消费级显卡轻松跑一文中测试了，十分建议：首选 Qwen3.5-27B，无论是官方benchmark测评还是其他网友评价，都支持这一结论 Qwen3.5 全阵容：阿里这次玩了个大的阿里最新发布的 Qwen3.5，不再只是单个模型，而是一整个军团：型号类型总参数激活参数定位 Qwen3.5-27B Dense 27B 27B 稳扎稳打型 Qwen3.5 -35B-A3B MoE 35B 3B 极速小钢炮 Qwen3.5-122B-A10B MoE 122B 10B 中杯选手 Qwen3.5-397B-A17B MoE 397B 17B 旗舰巨兽两个关键词硬件需求速查这是最实际的部分，别收藏了不看：型号 4-bit 量化 8-bit 量化原始 FP16 Qwen3.5-27B 17 GB 30 GB 54 GB Qwen3.5-35B-A3B 22 GB 38 GB 70 GB Qwen3.5-122B-A10B 70 GB 132 GB 245 GB Qwen3.5-397B-A17B 214 GB 512 GB 810 GB 翻译成人话
18.2K43编辑于 2026-03-02
来自专栏机器学习与统计学
Qwen3.5 本地部署
Unsloth Dynamic 2.0 量化 Unsloth 其实是第一时间就发布了 Qwen3.5-397B-A17B 的 GGUF 格式文件（Qwen 给了 Unsloth day zero 访问权限 /llama.cpp/llama-server \ --model unsloth/Qwen3.5-397B-A17B-GGUF/MXFP4_MOE/Qwen3.5-397B-A17B-MXFP4 /Qwen3.5-397B-A17B --port 8000 --continuous-batching # 或者直接命令行对话 transformers chat Qwen/Qwen3.5-397B-A17B --reasoning-parser qwen3 vLLM： vllm serve Qwen/Qwen3.5-397B-A17B \ --port 8000 \ --tensor-parallel-size -397B-A17B # 视觉 + 文本推理（原生多模态） pip install mlx-vlm mlx_vlm.chat --model Qwen/Qwen3.5-397B-A17B 工具调用（
5.3K10编辑于 2026-03-02
来自专栏AI
Qwen Code + 微信=王炸！
在~/.qwen/settings.json中添加：展开代码语言：JSONAI代码解释{"experimental":{"cron":true}}3️⃣Qwen3.6Plus正式上线免费使用！查看PR#2897立即升级展开代码语言：BashAI代码解释npminstall-g@qwen-code/qwen-code@latest有问题或建议？欢迎在GitHubIssues反馈！总结一下本周更新堪称重量级：✅Channels系统让QwenCode突破终端限制，微信钉钉都能用✅Cron定时任务让AI自动打工，解放双手✅Qwen3.6Plus免费上线，性能强悍✅/plan规划模式让复杂任务更有条理
29710编辑于 2026-04-16
实测Qwen2.5-Math效果
Qwen2.5全家桶发布，特别是在中间还整了一个Qwen2.5-Math模型，特定针对数学能力进行推理。这不免让人想起前段时间OpenAI才发布的o1大模型。到底Qwen2.5-Math效果怎么样，可以直接拿数学题目给他进行测试。 Qwen2.5-Math一直到这里还是得出的正确的步骤。但是后面的步骤有点看不懂了。但是由于o1大模型得出的步骤和答案离正确答案更加接近，因此从评分上看效果要比Qwen2.5-Math要好一点。本人还是很看好Qwen模型系列的，而且它还没有加入COT这种推理逻辑大杀器，推理能力上就能够和o1大模型差不多了，期望Qwen3的出现能够超越国外的大模型。
79110编辑于 2024-09-22
Qwen-7B-Chat WebDemo
Qwen-7B-Chat WebDemo 环境准备在autodl平台中租一个3090等24G显存的显卡机器，如下图所示镜像选择PyTorch–>2.0.0–>3.8(ubuntu20.04)–>11.8 /Qwen-7B-Chat', cache_dir='/root/autodl-tmp', revision='v1.1.4') 代码准备首先clone代码，打开autodl平台自带的学术镜像加速。 unset http_proxy && unset https_proxy 修改代码路径，将 /root/autodl-tmp/Qwen/web_demo.py中 13 行的模型更换为本地的/root/ autodl-tmp/qwen/Qwen-7B-Chat。运行以下命令即可启动推理服务 cd /root/autodl-tmp/Qwen python web_demo.py --server-port 6006 将 autodl 的端口映射到本地的 http
38611编辑于 2025-07-17
Qwen-7B-Chat Lora 微调
Qwen-7B-Chat Lora 微调概述本节我们简要介绍如何基于 transformers、peft 等框架，对 Qwen-7B-Chat 模型进行 Lora 微调。本节所讲述的代码脚本在同级目录 04-Qwen-7B-Chat Lora 微调下，运行该脚本来执行微调过程，但注意，本文代码未使用分布式框架，微调 Qwen-7B-Chat 模型至少需要 24G 及以上的显存 tokenizer = AutoTokenizer.from_pretrained('/root/autodl-tmp/qwen/Qwen-7B-Chat', use_fast=False, trust_remote_code /qwen/Qwen-7B-Chat/', use_fast=False, trust_remote_code=True) tokenizer.pad_token_id = tokenizer.eod_id /qwen/Qwen-7B-Chat/', trust_remote_code=True, torch_dtype=torch.half, device_map="auto") model.enable_input_require_grads
88010编辑于 2025-07-17
Qwen-7B-Chat Ptuning 微调
Qwen-7B-Chat Ptuning 微调 Ptuning原理参考transformers-code 数据加载与模型配置与LoRa一致,在此具体讲一下Ptuning的细节: 基本原理为冻结主模型全部参数 labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id] # Qwen /output/Qwen", per_device_train_batch_size=2, gradient_accumulation_steps=2, logging_steps /Qwen-7B-Chat', use_fast=False, trust_remote_code=True) tokenizer.pad_token_id = tokenizer.eod_id ds.column_names) # 创建模型并以半精度形式加载 model = AutoModelForCausalLM.from_pretrained('/root/autodl-tmp/qwen
42710编辑于 2025-07-17
来自专栏大模型本地部署
Qwen3.5本地部署
0.简介本教程参考了Unsloth上有关Qwen3.5部署的教程，但是国内由于网络等原因，部署的时候会遇到一系列问题，因此以下给出逐一解决的方法。后续会持续更新Qwen3.5其他系列模型。 1.Qwen3.5-35B-A3B1.1.Tips在本指南中我们将使用Dynamic4-bit，在24GBRAM/Mac设备上可实现快速推理效果。根据你的用例，遵循下面的特定命令之一：1.2.2.1.思考模式精确编码任务：exportLLAMA_CACHE="unsloth/Qwen3.5-35B-A3B-GGUF". \--top-k20\--min-p0.00通用任务：exportLLAMA_CACHE="unsloth/Qwen3.5-35B-A3B-GGUF". /llama.cpp/llama-cli\--modelunsloth/Qwen3.5-35B-A3B-GGUF/Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf\--mmprojunsloth
2.4K00编辑于 2026-03-06
Qwen-7B-chat 全量微调
Qwen-7B-chat 全量微调修改代码首先我们要准训练模型的代码，这里我们使用的 modelscope 上的 Qwen-7B-chat 模型，大家自行下载即可。只不过在全量微调的时候没有加载 LoraConfig，那我就直接给出代码，如果对代有什么问题，大家可以先自行探索Qwen lora的代码解释，有什么不懂的地方可以提Issue。 /model/qwen/Qwen-7B-Chat/") # 用于处理数据集的函数 def process_func(example): MAX_LENGTH = 128 # Llama分词器会将一个中文字切分为多个 labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id] # Qwen /output/Qwen" \ --per_device_train_batch_size=1 \ --gradient_accumulation_steps=1 \ --logging_steps
55310编辑于 2025-07-17
来自专栏LLM
万字长文解读Qwen进化史：27篇论文深度复盘Qwen模型家族
本篇将按照时间倒序从2026年3月追溯至2023年9月，梳理了Qwen生态系统中发布的27项LLM核心技术成果：基座大模型历经Qwen → Qwen2 → Qwen2.5 → Qwen3 → Qwen3.5 /Qwen/Qwen3.5-397B-A17B 作为Qwen生态截至现在的巅峰之作，Qwen3.5系列彻底贯彻了「全模态原生」与「线性注意力」的两大技术路线。 /QwenLM/Qwen3-CoderHuggingFace: https://huggingface.co/Qwen/Qwen3-Coder-Next Qwen3-Coder-Next拥有80B的总参数量 /Qwen Qwen音频第一代模型是Qwen系列首个通用音频理解预训练模型，覆盖30+任务，涵盖语音识别、自然声分类、音乐及歌曲理解。奠定了后续28个月从Qwen到Qwen3、从文本到全模态的演进基础。
2.2K30编辑于 2026-04-21
来自专栏Python与算法之美
Qwen7b微调保姆级教程
我们构造了一个修改大模型自我认知的3轮对话的玩具数据集，使用QLoRA算法，只需要5分钟的训练时间，就可以完成微调，并成功修改了LLM模型的自我认知(以Qwen7b-Chat为例)。公众号算法美食屋后台回复关键词：torchkeras，可获取本文notebook源码~ 通过借鉴FastChat对各种开源LLM模型进行数据预处理方法统一管理的方法，因此本范例适用于非常多不同的开源LLM模型，包括 Qwen _7b' #远程：'Qwen/Qwen-7b-Chat' bnb_config=BitsAndBytesConfig( load_in_4bit=True, cp qwen_7b/*.py qwen_torchkeras/ 五，使用模型为减少GPU压力，此处可再次重启kernel释放显存。已经在Qwen的自我认知中，种下了一颗梦中情炉的种子。
2.5K31编辑于 2023-09-17
Qwen-7B-hat Transformers 部署调用
Qwen-7B-hat Transformers 部署调用环境准备在autodl平台中租一个3090等24G显存的显卡机器，如下图所示镜像选择PyTorch–>2.0.0–>3.8(ubuntu20.04 snapshot_download, AutoModel, AutoTokenizer from modelscope import GenerationConfig model_dir = snapshot_download('qwen /Qwen-7B-Chat', cache_dir='/root/autodl-tmp', revision='v1.1.4') 代码准备在/root/autodl-tmp路径下新建trans.py文件并在其中输入以下内容 transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig model_dir = '/root/autodl-tmp/qwen /Qwen-7B-Chat' tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained
43310编辑于 2025-07-17
来自专栏AI
IDEA终于可以爽用qwen code了！
首先安装qwencode展开代码语言：BashAI代码解释npminstall-g@qwen-code/qwen-code然后点击idea的AIchat面板对于使用JetBrainsAIAssistant 成功之后，可以在在idea的Settings里面看到qwencode方法二：手动安装（适用于旧版IDE）步骤1：安装QwenCodeCLI展开代码语言：BashAI代码解释npminstall-g@qwen-code /qwen-code步骤2：打开AIChat工具窗口在JetBrainsIDE中，打开AIChat工具窗口。步骤4：添加配置配置QwenCode使用以下设置：展开代码语言：JSONAI代码解释{"agent_servers":{"qwen":{"command":"/path/to/qwen","args": ["--acp"],"env":{}}}}⚠️注意：将/path/to/qwen替换为实际的qwen命令路径。
1K10编辑于 2026-03-28
来自专栏叶子的数据科技专栏
使用 Qwen-Agent 结合浏览器插件
git clone https://github.com/QwenLM/Qwen-Agent.gitcd Qwen-Agentpip install -e . # 示例: 假设Qwen1.5-72B-Chat已经通过vLLM部署于http://localhost:8000/v1，则可用以下参数指定模型服务：# --llm Qwen1.5-72B-Chat 顺便说一下，魔搭社区提供了每天 1000 次的 Qwen/Qwen2.5-72B-Instruct 等模型的免费额度，可以用来测试。创建守护进程在实际的运行中，为了避免每次启动服务，可以创建守护进程。 systemctl daemon-reloadsudo systemctl enable qwen-serversudo systemctl start qwen-server## 查看状态sudo 引用Qwen-Agent/browser_qwen_cn.md at main · QwenLM/Qwen-Agent · GitHub
1.2K10编辑于 2024-12-21
来自专栏AI
Qwen Code大更新：支持多工具并行执行
Qwen Code 现在能自动判断哪些工具可以并行执行：搜索、读文件等只读操作自动批量并发，而 Shell 写入等危险操作保持串行保安全。多工具场景下，等待时间大幅缩短。
7610编辑于 2026-04-24
Qwen1.5-7B-Chat FastApi 部署调用
Qwen1.5-7B-Chat FastApi 部署调用环境准备在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器，如下图所示镜像选择 PyTorch–>2.0.0–>3.8(ubuntu20.04 modelscope import snapshot_download, AutoModel, AutoTokenizer import os model_dir = snapshot_download('qwen /Qwen1.5-7B-Chat', cache_dir='/root/autodl-tmp', revision='master') 代码准备在 /root/autodl-tmp 路径下新建 api.py 返回响应 # 主函数入口 if __name__ == '__main__': # 加载预训练的分词器和模型 model_name_or_path = '/root/autodl-tmp/qwen /Qwen1.5-7B-Chat' tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=False)
45410编辑于 2025-07-17
Qwen Code 0.12.0 发布：新特性太感人了！
Qwen Code 近期发布了 v0.12.0 重大版本。此次更新聚焦开发者实际工作痛点，下面就来看看吧。一、核心新特性：解决实际开发痛点 1. Hooks 自动化系统：让AI替你做重复工作开发者日常会面临大量重复操作：代码生成后手动格式化、提交前运行测试、会话结束后整理总结……Qwen Code 新增的 Hooks 系统，就像给AI助手加了“ VS Code 侧边栏集成之前使用 Qwen Code 时，需要在终端和编辑器之间来回切换，影响专注度。可视化扩展管理以往安装 Qwen Code 扩展需要记忆命令行指令，配置参数还要翻文档，门槛较高。新版本的交互式 TUI 扩展管理界面，把复杂操作可视化，上手难度骤降。三、快速升级升级方式只需一行命令即可升级到最新版本： npm i @qwen-code/qwen-code@latest -g 总结 Qwen Code v0.12.0 版本的更新，没有堆砌花哨功能
40410编辑于 2026-03-31
来自专栏创作是最好的自我投资
基于Qwen2.5-Coder 快速搭建应用管理系统
Qwen2.5-Coder 特别为编程应用而设计。如何基于 Qwen2.5-Coder 快速搭建应用管理系统，下面开始详细讲解。快速搭建应用管理系统我们今天主要需要使用的Qwen开源模型为 Qwen2.5-Coder，点击Qwen2.5-Coder 模型合集进入Qwen2.5-Coder 模型合集详情页，这里我们选择 Qwen2.5 -代码-demo 点击模型tab进入模型详情页，在模型详情页输入我们的需求【基于springboot生成一个项目代码包】 Qwen2.5-代码-demo 生成内容如下，我们按照Qwen2.5-代码-demo name=Qwen可以看到项目的具体返回结果应用优化这时，虽然我们看到我们的应用管理系统已经可以成功运行了，但是页面只有一个 Hello, Qwen!
87030编辑于 2025-01-15
来自专栏AI
Qwen Code 0.12.0 发布：新特性太丝滑了！
三、快速升级与使用建议升级方式只需一行命令即可升级到最新版本：展开代码语言：BashAI代码解释npmi@qwen-code/qwen-code@latest-g如果需要使用VSCode侧边栏功能，可在
61810编辑于 2026-03-20
来自专栏算法一只狗
Qwen为什么没有像 DeepSeek 一样出圈？
其实之前我曾经介绍过Qwen系列模型，它的效果也是堪比GPT-4o模型。在DeepSeek还没有这么火爆之前，我一直认为Qwen模型其实算是开源之光。比如阿里在上半年发布的Qwen系列模型，其在2月份开源过Qwen1.5-110B大模型，并在Open LLM Leaderboard榜单（在 6 个关键基准上评估模型，用于在大量不同的评估任务上测试生成语言模型）中，拿下了开源第一名的成绩，总分达“75.42”的好成绩而其在最新的Qwen2模型中，比开源的Llama-3-70B和Qwen1.5-110B还要强。 Qwen2的研发中，实现了在多种编程语言上的显著效果提升。而在数学方面，大规模且高质量的数据帮助Qwen2-72B-Instruct实现了数学解题能力的飞升。 Qwen系列模型一直在推出自己的全方面对表OpenAI的模型。
1.2K00编辑于 2025-02-05

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Qwen3.5本地部署终极指南，Qwen3.5-27B

Qwen3.5 本地部署

Qwen Code + 微信=王炸！

实测Qwen2.5-Math效果

Qwen-7B-Chat WebDemo

Qwen-7B-Chat Lora 微调

Qwen-7B-Chat Ptuning 微调

Qwen3.5本地部署

Qwen-7B-chat 全量微调

万字长文解读Qwen进化史：27篇论文深度复盘Qwen模型家族

Qwen7b微调保姆级教程

Qwen-7B-hat Transformers 部署调用

IDEA终于可以爽用qwen code了！

使用 Qwen-Agent 结合浏览器插件

Qwen Code大更新：支持多工具并行执行

Qwen1.5-7B-Chat FastApi 部署调用

Qwen Code 0.12.0 发布：新特性太感人了！

基于Qwen2.5-Coder 快速搭建应用管理系统

Qwen Code 0.12.0 发布：新特性太丝滑了！

Qwen为什么没有像 DeepSeek 一样出圈？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐