架构师李哲
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
架构师李哲
社区首页
>
专栏
>
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
架构师李哲
关注
修改于 2025-12-03 10:50:25
修改于 2025-12-03 10:50:25
421
0
举报
概述
如何用极低成本落地医疗AI?本文揭秘基于LLaMA-Factory Online的Qwen3-VL实战:16k数据,DeepSpeed 2避坑指南,稀疏激活(A3B)推理实测——让30B大模型在消费级显卡上流畅运行!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
第四期热点征文-大模型技术
AIGC
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
第四期热点征文-大模型技术
AIGC
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
一、项目背景:打破医疗AI的“不可能三角”
二、方案设计:稀疏激活 + 高效微调
三、训练实战:从数据到可对话的医疗专家
1、数据加工:把“医学教材”喂给AI
2、模型训练:找到医疗影像的“学习密码”
(1)DeepSpeed Stage选择是性能关键
(2)参数配置对比实验与分析
3、效果验证:从“业余”到“专业”的飞跃
(1)指标对比:数十倍至上千倍的提升
(2)生成质量:从“无法使用”到“专业优秀”
(3)效率提升:速度与精度的双重胜利
4、实战对话:真正的“AI放射科医生”
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐