首页
学习
活动
专区
圈层
工具
发布

智谱开源GLM-OCR模型:多个领域性能接近Gemini-3-Pro,主打“小尺寸、高精度”

2月3日,智谱(02513.HK)官微宣布正式发布并开源GLM-OCR。

据介绍,作为一款轻量的专业级OCR模型,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署。

公司表示,尽管GLM-OCR参数量仅0.9B,但在权威文档解析榜单OmniDocBench V1.5中以94.6分取得SOTA性能。在文本、公式、表格识别及信息抽取四大细分领域的表现优于多款OCR专项模型,性能接近Gemini-3-Pro。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O56GQl2A2Csll7nbYGNKmL8g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券