搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏腾讯技术工程官方号的专栏
走进AI时代的文档识别技术之文档重建
本文主要介绍基于深度学习的文档重建框架，通过文档校正、版面分析、字体识别和阅读排序将纸质文档智能转成可编辑的电子文档。图1 文档重建实例将纸质文档转为电子文档的时候，通常使用的方法是将纸质文档拍照后进行OCR识别，将照片中的文字提取出来，然后复制粘贴为电子文档。相比传统的OCR文档识别，我们可以更加完整地恢复文档中的表格、段落样式、文字样式、和文档版面。目前相关技术已经运用到腾讯文档中，后续我们将不断丰富使用场景，提升效果和用户体验。腾讯QQ研发中心——CV应用研究组致力于计算机视觉的产品研究和研发工作，利用深度学习技术和大数据为QQ、腾讯文档等提供AI基础能力。我们希望利用AI科技来方便人们生活，提升人们生活质量。
7.6K64发布于 2019-06-20
AI Agents Masterclass 项目文档
项目标题与描述AI Agents Masterclass 是一个全面的AI代理开发教程项目，旨在展示如何利用大型语言模型(LLM)与外部系统交互，实现业务流程自动化。项目包含多个功能模块，如Asana任务管理、Google Drive文档处理、Slack消息交互等，通过实际案例演示AI代理的强大能力。功能特性多平台集成：支持Asana、Google Drive、Slack等多个平台的API集成任务自动化：自动创建和管理Asana任务，包括设置截止日期和项目分配文档处理：搜索Google Drive文档并自动创建新文档对话交互：通过自然语言与AI代理交互，理解复杂指令RAG支持：实现基于文档的检索增强生成(Retrieval-Augmented Generation)多模型支持：兼容OpenAI、Anthropic、Groq ：从Google Drive搜索相关文档会议记录：自动总结会议记录并创建行动项知识库查询：基于上传的文档回答专业问题核心代码Asana任务创建工具@tooldef create_asana_task(task_name
39710编辑于 2025-07-24
来自专栏信息技术智库
看 AI 如何抢救破烂文档
一、什么是非结构化数据二、非结构化数据分析三、文档图像分析与预处理修正图形偏移消除摩尔纹四、消除反光反光原理 Python 消除图片反光方法五、版面分析与文档还原 5.1 物理版面 & 逻辑版面 5.2 版面元素检查 5.3 文档还原 5.4 文档还原的应用六、整体小结一、什么是非结构化数据非结构化数据是指没有固定格式和规则的数据，例如文本、图片、视频、音频等。非结构化数据采集的场景坑：场景及版式多样采集设备不确定性用户需求多样性文档图像质量退化严重文字检测及版面分析困难非限定条件文字识别率低结构化智能理解能力差三、文档图像分析与预处理接下来 5.3 文档还原通过前两步的版本 AI 算法分析（物理版面分析、逻辑版面分析），以及版面元素识别检查，我们就能讲文档还原了。智能文档处理，针对每个细分领域，其实都有很多有挑战、又有趣的事情，让我们一起探索吧~
59820编辑于 2023-10-16
文档场景 AI 应用：文档创作、文本润色、表格公式、图表生成
摘要：文档场景是大模型最容易落地的高频场景之一。本文围绕文档创作、文本润色、表格公式、图表生成四类典型需求，介绍腾讯云 TokenHub 平台可调用的语言与多模态模型组合，给出选型建议与体验入口，帮助内容团队把 AI 能力嵌入日常文档工作流。一、文档场景为什么是 AI 落地的"第一站" 任何一个组织里，文档工作的体量都被严重低估。二、四类文档需求与模型能力的对应关系 2.1 文档创作：长文本组织与思考文档创作的难点在于"想清楚再写下来"，对模型的核心要求是长上下文 + 深度思考能力。六、写在最后文档场景不是某一个"AI 写作神器"能解决的，它需要一套语言模型 + 多模态 + 图像生成的组合拳。
26110编辑于 2026-05-28
腾讯文档3.9.0版本上线，AI文档助手全面焕新!
读：深度阅读能力升级，垂类场景智能精读当你正面对着海量研究报告与长篇文献，急需从中提炼出关键信息时，只需进入AI文档助手，点击「AI总结」，上传需要读的文档，即可快速理解核心信息，让你在信息海洋中游刃有余为了满足用户多样化使用需求，升级后的AI文档助手丰富了可总结的文档类型，并支持一次性最多上传50个文件。无论是纯文本、本地文档、腾讯文档还是网页链接，都能直接输入，有效提升阅读效率与理解广度。这种直观的表达方式，让原本冗长、复杂的文本变得清晰易懂，极大地提升了文档的可读性和理解度。写：AI创作能力增强，全品类文档高质量生成从创意到呈现，全新AI PPT生成链路，让你的PPT制作更省心。对于需要撰写学术论文、研究报告或长篇小说等长文的用户而言，AI文档助手支持分步骤创作万字长文。接收到需求后，AI文档助手会智能生成文章大纲，搭建起清晰的框架。用户可以随意调整大纲，AI会基于大纲自动填充细节，扩展成完整的万字长文。让你的创作过程更流畅高效。同时，AI文档助手新增了图片和PDF直接生成思维导图的功能。
5K10编辑于 2024-12-02
来自专栏腾讯技术工程官方号的专栏
腾讯文档AI助手技术实践
本文从技术应用架构以及AI大模型赋能角度介绍腾讯文档AI智能助手的探索和实践之路。作为一款集多功能为一体的AI产品，腾讯文档全品类与AI进行了深度融合，全面提升用户生活和办公中的效率。全球访问量前100的AI产品中，共有12个文档类工具竞品上榜；全国访问量前100的AI产品中，共有26个文档类工具竞品上榜。 2.3 文档AI中台架构文档AI中台的概念初始于腾讯文档这款产品本身就存在10种品类，期望以中台解决方案的形式为不同品类进行赋能，同时也是这样实践和落地。文档AI中台同具体模型和产品应用解除耦合，形成了可以为不同产品赋能的文档xAI解决方案，提供对文档AI领域的整体解决方案，赋能不同的AI应用产品。第三章：文档AI应用侧技术实践 3.1 问答场景应用文档产品最核心能力之一是信息传达，海量的信息中对信息进行AI问答是关键AI落地场景之一，在文档中涉及对Word，PPT，Sheet，思维导图，收集表
3.5K41编辑于 2024-04-26
来自专栏软件深度评测
AI阅读助手ChatDOC：基于 AI 与文档对话、重新定义阅读方式的AI文献阅读和文档处理工具
ChatDOC 是一款基于 ChatGPT，允许 ChatGPT 与用户所指定的文档进行对话，处理用户的专属数据的 AI 阅读辅助工具。 ChatDOC 的特点操作简单：一键上传，快速上手一键上传文档，快速让 AI 处理文档数据。通过与 AI 助手对话式学习，深入挖掘文本结构和内容。适用场景通过基于 AI 辅助的文档阅读，ChatDOC 能够帮助用户快速分析文档、理解内容、激发灵感和扩展视野，适合办公人士、教育用户群体、以及各类对于知识管理、信息管理感兴趣的群体。在本文中的示范文档，并非我所熟悉的领域。借助 AI 辅助，我可以快速获取文章摘要、深挖特定观点和数据、翻译文本、总结内容……帮助我快速了解一个我完全不熟悉领域的知识和信息。如图：如果你愿意，也可以直接让 AI 以表格形式输出结果。上面主要是基于全文的提问。ChatDOC 还允许用户针对文档中的具体内容与 AI 互动。比如，让 AI 解读表格、解释公式、阐释文中的概念。
2.4K20编辑于 2023-07-11
来自专栏明明如月的技术专栏
AI 时代的学习方式：和文档对话
本文推荐几款基于人工智能的文档学习软件，可以上传文档然后“和文档对话”，快速高效学习文档。 2.3 Humata 官网：https://app.humata.ai/ （1）介绍 Humata 就像是你文档的 ChatGPT。可以上传文档后提问。（2）产品截图登录后在 My Files 页面上传文档。上传后选择某个文档进行提问。 ChatDOC 的回答都可以溯源至文档内容，后续还会支持图片、扫描件格式，以及多个文档交叉问答。点击即可免费使用。（2）截图上传文档后选择相应的文档，直接对话即可。（3）限制免费版：每个月只能上传 10个文件，一个月只能发起100次对话。
2.3K90编辑于 2023-04-06
来自专栏程序员
AI代码审查大文档处理技术实践
一、技术背景与挑战代码规范文档通常包含数千至数万行规则，远超主流AI API的上下文窗口限制（如GPT-4o为128K tokens，约9.6万字）。直接传输完整文档会导致：上下文溢出：触发自动截断，丢失关键规则成本激增：按token计费模式下，全文档处理成本达$0.5-2/次响应延迟：长文本处理耗时增加3-5倍二、核心技术方案1. 文档分块技术原理语义分块算法（基于LlamaIndex实现）：from llama_index.node_parser import SemanticSplitterNodeParserfrom llama_index.embeddings Qdrant + Llama3 本地部署，零API成本六、未来技术趋势超长上下文模型：Claude 3.7支持200K tokens（约15万字），可直接处理中等规模规范文档多模态理解：GPT-4o支持解析规范文档中的流程图，提取视觉规则（如架构图中的调用关系）实时分块优化：基于用户反馈动态调整分块参数（如增加异常处理规则的块大小）
62310编辑于 2025-08-07
来自专栏用户10004205的专栏
Unity 接入有道智云AI - 文档翻译
一、接口介绍文档翻译API接口提供有道的文档翻译服务，只需要通过调用文档翻译API，传入文档的Base64编码，指定源语言与目标语言，通过POST请求方式，就可以将文档中的文字内容进行翻译。协议须知：二、申请App ID、密钥 1.登录有道智云AI开放平台，进入控制台 2.在应用总览中创建应用，填写相关内容 3.获取应用ID、密钥三、在Unity中应用 1. { ///
/// 待翻译文档 Base64编码大小限制40M ///
public string q; /// < summary> /// 文档名称 /// public string fileName; ///
/// 文档类型 ///
public class FileTrans { //应用ID和密钥在有道智云AI开放平台创建应用获取 private static readonly
1.7K10编辑于 2022-08-29
腾讯文档AI，打开效率想象力！
唤起@智能助手一份内容，多种文档形态任意切换从精简的大纲延展成可汇报的幻灯片腾讯文档智能助手公测申请表 (qq.com)
1.2K10编辑于 2024-01-26
来自专栏Dance with GenAI
AI批量处理TXT文档换行符
有很多个TXT文档，里面有很多换行，要全部去掉：在deepseek中输入提示词：写一个Python脚本，完成任务如下：读取文件："F:\OneDrive\桌面\新建文本文档 (3).txt" 识别所有的换行符 outfile.write(processed_content) print(f"处理后的内容已写回文件: {input_file}") # 示例用法 input_file = r"F:\OneDrive\桌面\新建文本文档使用方法：将你的文本内容保存到 F:\OneDrive\桌面\新建文本文档 (3).txt 文件中。运行上述代码，脚本会读取文件内容，处理换行符，并将处理后的内容写回文件。运行程序，txt文档处理好了：
96210编辑于 2025-01-22
精调模型削减文档AI成本90%
本地部署可将每份文档的延迟降至50-80毫秒。同一批文档的处理时间从66分钟缩短至13分钟。这决定了你能否在不扩展基础设施的情况下扩展到每天50,000份文档。API延迟形成了一道你无法绕过的上限。精调模型真正胜出的地方差异体现在特定文档类型上，这些文档的模式复杂性和领域知识比通用智能更重要：医疗计费代码（ICD-10, CPT）。 VLAIR基准测试评估了四种法律AI工具（某法律助手、某法律顾问、某AI工具、另一AI工具）和某聊天机器人在文档提取任务上的表现。附带医疗必要性文档的保险索赔。索赔需要证明所执行程序的合理性的诊断代码。临床记录必须支持医疗必要性。一份MRI（CPT 70553）的索赔需要文档说明为何影像检查是医疗必需的而非随意选择的。任何具有定义好的文档类型、可预测模式且月处理量超过1,000份文档的情况。
14610编辑于 2026-04-09
来自专栏PDF 开发
AI文档识别技术之表格识别(一)
表格识别原理介绍1.1 表格类型分类在现实生活中，表格大小、种类与样式复杂多样，例如表格中存在不同的背景填充，不同的行列合并方法，不同的内容文本类型等，并且现有文档既包括现代的、电子的文档，也有历史的、扫描的手写文档，它们的文档样式、所处光照环境以及纹理等都有比较大的差异，表格识别一直是文档识别领域的研究难点。无需人为再添加表格线条做表格内容分割图片非标准表格：缺少表格边框或者表格内线，表格线条不清晰，需要人为添加表格线条分割表格内容，例如下面的表格就缺少很多的横线与竖线图片1.2 识别原理DocumentAI通过结合AI 与传统算法实现表格识别，主要用到的AI能力与算法有：AI：版面分析能力（通过AI版面分析检测表格在图片内所处的区域）AI：OCR能力（通过OCR实现识别表格内容）算法：图像处理算法（通过结合图像处理算法辅助获取表格结构信息）通过以上的AI与算法再结合一些表格识别算法即可实现通用表格识别，同时支持识别标准表格与非标准表格2.
3.8K40编辑于 2023-08-09
来自专栏AI人工智能
AI 辅助文档生成：从接口注释到自动化 API 文档上线
传统的文档编写方式不仅耗时费力，还容易出现文档与代码不同步的问题，维护成本极高。在这个AI技术飞速发展的时代，我开始探索如何利用人工智能来解决文档生成的痛点。本文将深入分析AI辅助文档生成的完整技术方案，包括代码注释智能解析、文档模板自动生成、多格式输出支持、版本控制集成等核心功能。 AI文档生成技术概览1.1 传统文档生成的痛点在传统的软件开发流程中，API文档的编写往往是最容易被忽视却又极其重要的环节。技术在文档生成中的应用AI技术的引入为文档生成带来了革命性的变化。核心技术架构设计2.1 系统架构概览AI文档生成系统采用微服务架构，确保各个组件的独立性和可扩展性：图2：系统架构图 - 展示AI文档生成系统的整体架构设计2.2 代码解析引擎代码解析引擎是整个系统的核心组件
1.5K10编辑于 2025-09-09
来自专栏Pandawiki AI知识库
告别文档噩梦：AI如何让产品技术文档从负担变成竞争力
第二步：注入AI能力单纯把文档搬到一个平台只是第一步，真正的价值在于让文档具备“智能”。AI创作：根据代码注释自动生成API文档，根据产品需求自动编写功能说明。 AI问答：开发者可以直接提问：“视频上传接口的限流配置是什么？”AI会从文档中精准定位答案，而不是返回一堆需要手动筛选的结果。第三步：建立持续更新机制文档最大的敌人不是写得不好，而是“过时”。技术文档的智能化升级从静态到动态传统文档是“写完后放着”，智能文档是“持续进化的知识体”。PandaWiki的AI问答功能，能够理解开发者的技术问题并给出精准答案。步骤三：内容迁移将现有的Swagger文档、Confluence页面、Markdown文件统一导入。步骤四：AI配置选择适合的AI模型，配置问答提示词，设置权限管理。 AI驱动智能化：AI辅助创作、问答和搜索，显著提升内容质量和用户体验。轻松集成第三方应用：支持将知识库嵌入到其他网站或作为聊天机器人的形式，实现多平台覆盖。你的团队需要升级文档系统吗？
26010编辑于 2025-12-01
来自专栏MavenTalk
WPS Office AI实战：AI带来的文档智能化体验
前面我们已经了解过 AI 在PPT制作、Word写作方面带来的革命性效率提供，今天一起来聊聊在线文档的AI应用。如果你习惯用在线文档的话，一样也可以享受到AI的强大优势。金山在线智能云文档已经接入WPS Office AI套件大家庭，用AI来改造写作的新时刻已经到来。前面申请过AI的账号），AI就位，下一步就可以进行我们的AI创作之旅行唤醒方式第一次打开智能文档时，AI能力就能直观的展现在眼前。多文档内容归纳总结根据已经存在的云文档，进行总结归纳，重写输出自己需要的内容。比如别人的旅行游记文档和自己的预算表，WPS AI 将自动生成属于你的旅行计划。文档模板 WPS AI 为你专属定制了新媒体、互联网、教育等领域的工作AI模板，你需要做的就是选择模板，创作自己的文档！
1.3K40编辑于 2023-09-06
来自专栏鱼皮客栈
我做了个 AI 文档阅读神器，免费开源！
为了帮助大家免受文档的折磨，我用 AI 开发了个 AI 文档助手网站，可以帮你快速读懂各种复杂的文档、还帮你管理文档。网站完全免费，代码完全开源！当你要阅读文档时，点击 “单个导入” 按钮，上传文档文件，然后需要填写 Kimi AI 的 API Key。填写好 API Key，就可以生成文档阅读指南啦，生成速度非常快。 AI 生成的效果还是不错的，图文并茂，能帮你更快理解复杂的文档。你还可以批量导入多个文档，同时调用 AI 生成阅读指南，提高效率。此外，你还可以把这个网站当做自己的智能文档收藏夹，可以分类检索已经导入的文档、下载原始文件、随时查看文档阅读指南。但现在 AI 编程技术已经很成熟了，我选用 Claude Code AI 开发工具，轻轻松松一天搞定，而且一行代码都不用自己写。
12400编辑于 2026-06-11
来自专栏趣谈前端
AI+可视化文档引擎，持续更新！
低代码的技术实践，也陆陆续续设计并开发了多款可视化搭建产品，比如： H5-Dooring（页面可视化搭建平台） V6.Dooring（可视化大屏搭建平台）橙子6试卷（表单搭建引擎）最近规划的新产品可视化文档引擎目前也在持续迭代更新中，也收到了很多用户的优秀建议，接下来就和大家一起分享一下这周我对Nocode/WEP 文档知识引擎的最新更新。优化文本和AI生成内容的文本格式之前使用AI创作内容时用户发现有文本溢出，这个问题我也在第一时间优化好了，并且支持MD格式的AI内容： 3. 支持行内自定义链接 4. 添加意见反馈侧边栏大家在使用过程中有任何问题和优化建议都可以随时反馈~ 后期规划目前正在做搭建模块，目标是基于文档知识资产，通过零代码可视化搭建的技术快速生成内容知识站点，目前已经在飞速开发，下周会上线给大家使用：最后后面会继续迭代产品，实现如下能力：基于知识库一键生成独立站点内容AI润色丰富文档组件生态基于知识库的业务流程引擎支持万能表格组件当然还有50+规划，后期会陆续实现，如果大家有更好的想法
36510编辑于 2024-06-04
来自专栏愚公系列-书籍专栏
【愚公系列】《AIGC辅助软件开发》011-AI辅助编写技术文档：技术文档
随着人工智能技术的不断进步，AI工具的辅助作用逐渐显现，特别是在技术文档的编写过程中。借助AI，开发者和技术作家可以更高效地生成、编辑和维护文档，从而专注于更高层次的创作和思考。本文将对AI辅助编写技术文档的相关概念进行概述，探讨技术文档的类型、结构及其重要性，并介绍AI在文档编写中的应用场景和优势。我们还将分享一些最佳实践和实用工具，帮助您更好地利用AI提升文档质量和编写效率。无论您是技术作家、软件开发者，还是项目经理，这篇文章都将为您提供有价值的见解，助力您在技术文档编写的过程中实现更高的效率和更好的效果。让我们一起探索AI如何变革技术文档的编写方式！那么在面对一个新的系统开发时，我们怎么让 AI来辅助我们设计和编写架构设计文档呢?下面以一个智慧校园系统的架设计为例，看看我们得到什么样的结果。
79200编辑于 2024-11-29

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

走进AI时代的文档识别技术之文档重建

AI Agents Masterclass 项目文档

看 AI 如何抢救破烂文档

文档场景 AI 应用：文档创作、文本润色、表格公式、图表生成

腾讯文档3.9.0版本上线，AI文档助手全面焕新!

腾讯文档AI助手技术实践

AI阅读助手ChatDOC：基于 AI 与文档对话、重新定义阅读方式的AI文献阅读和文档处理工具

AI 时代的学习方式：和文档对话

AI代码审查大文档处理技术实践

Unity 接入有道智云AI - 文档翻译

腾讯文档AI，打开效率想象力！

AI批量处理TXT文档换行符

精调模型削减文档AI成本90%

AI文档识别技术之表格识别(一)

AI 辅助文档生成：从接口注释到自动化 API 文档上线

告别文档噩梦：AI如何让产品技术文档从负担变成竞争力

WPS Office AI实战：AI带来的文档智能化体验

我做了个 AI 文档阅读神器，免费开源！

AI+可视化文档引擎，持续更新！

【愚公系列】《AIGC辅助软件开发》011-AI辅助编写技术文档：技术文档

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

走进AI时代的文档识别技术 之文档重建

AI Agents Masterclass 项目文档

看 AI 如何抢救破烂文档

文档场景 AI 应用：文档创作、文本润色、表格公式、图表生成

腾讯文档3.9.0版本上线，AI文档助手全面焕新!

腾讯文档AI助手技术实践

AI阅读助手ChatDOC：基于 AI 与文档对话、重新定义阅读方式的AI文献阅读和文档处理工具

AI 时代的学习方式： 和文档对话

AI代码审查大文档处理技术实践

Unity 接入有道智云AI - 文档翻译

腾讯文档AI，打开效率想象力！

AI批量处理TXT文档换行符

精调模型削减文档AI成本90%

AI文档识别技术之表格识别(一)

AI 辅助文档生成：从接口注释到自动化 API 文档上线

告别文档噩梦：AI如何让产品技术文档从负担变成竞争力

WPS Office AI实战：AI带来的文档智能化体验

我做了个 AI 文档阅读神器，免费开源！

AI+可视化文档引擎，持续更新！

【愚公系列】《AIGC辅助软件开发》011-AI辅助编写技术文档：技术文档

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

走进AI时代的文档识别技术之文档重建

AI 时代的学习方式：和文档对话