算法一只狗
DeepSeek-OCR 2:让模型“先学会怎么看”,再学会读
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
算法一只狗
社区首页
>
专栏
>
DeepSeek-OCR 2:让模型“先学会怎么看”,再学会读
DeepSeek-OCR 2:让模型“先学会怎么看”,再学会读
算法一只狗
关注
发布于 2026-01-29 11:36:56
发布于 2026-01-29 11:36:56
433
0
举报
概述
有点感觉像是为了V4版本的预热了。毕竟不到三个月的时间,突然就更新了OCR-2版本,这速度也太快了把。不由得让我想起了OpenAI的翁家翌对DeepSeek这个公司的评价:面对中国公司DeepSeek的竞争,OpenAI内部真正感到压力的不是对方的算法创新,而是其惊人的内部迭代速率。当你的对手能够以十倍于你的速度完成训练、验证、调整的循环时,任何暂时的算法优势都会被立马追上。
文章被收录于专栏:
算法一只狗
算法一只狗
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
腾讯技术创作特训营S17#我与AI
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
腾讯技术创作特训营S17#我与AI
#DeepSeek
#DeepSeek-OCR
#DeepEncoder
#Encoder
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
为什么要重做 Vision Encoder?
模型架构
总结起来的几个优点
1.语义驱动的阅读顺序,而不是死板的扫描顺序
2.模型效果更强
3.用 LLM 架构统一 Vision Encoder
写在最后
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐