首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >高性能应用服务HAI - DeepSeek-R1 32B TACO 加速版

高性能应用服务HAI - DeepSeek-R1 32B TACO 加速版

原创
作者头像
geru
发布2025-03-10 14:57:50
发布2025-03-10 14:57:50
2850
举报

一、环境说明

TACO-LLM(TencentCloud Accelerated Computing Optimization LLM),是腾讯云自研的一款面向大模型的推理框架,TACO-LLM默认集成在了TencentOS Server AI中,相比其他开源框架,TACO-LLM具有更好的稳定性、安全性以及更高的性能,通过采用自研的Lookahead 加速技术以及针对DeepSeek模型的输出特征优化,能够大幅提升DeepSeek的tokens吞吐能力。

环境中已预装DeepSeek-R1:32b 加速版环境,用户可在开机后直接基于环境进行加速版调用,在不同场景下,相比vllm框架平均提速80%

二、部署方式

1. 创建实例

选择“社区应用”-“DeepSeek-R1 32B TACO 加速版”环境进行创建,实例选择“旗舰型”

2. 进行调用

实例创建完成后,环境将自动拉起服务,可直接基于openai格式对模型进行调用。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档