搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏心源易码
古籍版面分析新SOTA：HisDoc-DETR如何助力AI赋能古籍数字化难题
历史文献作为文明传承的重要载体，其数字化保护与深度利用一直面临巨大挑战。纸张老化、排版复杂、字迹模糊乃至残缺破损等现象，严重制约了大规模、高精度古籍数字化进程。早期基于深度学习的方法主要集中在FCN、U-Net或YOLOv3 等模型上面，然而，这些方法虽然在相对简单、结构良好且训练数据充足的文档上表现良好，但对于历史文献，特别是文字分布稀疏、背景复杂的手写稿和早期刻本提升归档效率：相较于人工标注和整理，HisDoc-DETR 能够大幅提升数字化归档效率，使海量古籍的数字化成为可能。在文化遗产保护与数字化归档方面，HisDoc-DETR 可以应用到国家图书馆、博物馆等文化机构中，快速处理馆藏古籍的数字化图像，自动生成带有版面结构信息的元数据，丰富数字资源的内涵，确保历史信息的完整性和可检索性辅助校勘与断代：精确的版面信息可为古籍的校勘工作提供辅助，例如识别不同版本之间的版式差异。版式特征也可作为古籍断代研究的重要线索。
51120编辑于 2025-09-26
来自专栏技术汇总专栏
面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析
一、研究背景古籍承载着丰富的历史、文化与思想价值，但其数字化与智能化利用始终面临难题。传统的古籍版面复杂多变，存在稀疏文字、跨栏结构、插图混排等特征，这些都给自动化版面分析带来极大挑战。三、应用场景与价值HisDoc-DETR 的研究突破不仅在算法层面带来了创新，更为古籍数字化保护、利用和传播提供了全新的技术支撑。 3.2 古籍数字化与知识库建设高精度的版面解析是古籍 OCR（文字识别）和语义理解的前提。凭借对跨页、跨栏及混排等复杂版式的适应能力，HisDoc-DETR 能够满足古籍数字化的系统化管理需求，确保古籍信息的完整性与可利用性，为数字化古籍资源建设提供强有力的技术保障。未来，类似的方法有望进一步拓展到多语种、跨时代文献的数字化处理，推动古籍保护与利用进入智能化新时代。
1.2K30编辑于 2025-11-03
《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》
在文化遗产数字化领域，大模型的核心应用难点在于如何处理古籍中大量的异体字、残缺文本与模糊语义，尤其是面对明清时期的手写残卷，传统的文字识别技术不仅准确率低下，更无法理解古籍中蕴含的历史语境与专业术语。我在参与某博物馆古籍数字化项目时，首先遭遇的便是大模型对古籍文字的“识别盲区”—初期使用通用大模型识别一本明代医学残卷，发现其将“癥瘕”误判为“症痕”，把“炮制”错解为“泡制”，更无法关联“君臣佐使”等中医方剂配伍逻辑系统的“多模态数据融合”能力，是提升古籍数字化体验的重要方向。古籍数字化不仅包含文字内容，还涉及古籍的版式设计、插图、印章、纸张材质等多模态信息，例如一本元代画册型古籍，除了文字题跋，还有大量山水画作与收藏印章，这些信息对研究古籍的流传脉络与艺术价值至关重要。为降低部署门槛，我开展“模型轻量化优化”工作：首先，对大模型进行模型蒸馏，基于原始大模型训练一个轻量级模型，保留核心的古籍处理能力，同时将模型体积从10GB压缩至1.5GB，推理速度提升3倍；其次，采用
55400编辑于 2025-10-10
来自专栏机器之心
用AI让经典重新跳动，这个平台开放了3000万古籍字符
而且，「识典古籍」项目负责人对媒体解释说，「识典古籍」不只是一个数字化平台，还是一个针对古籍保护的完整项目，包括古籍修复、数字化、活化三大方向。古籍保护、传承面临的困境「史在他邦，文归海外」今年 10 月 3 日，中国人物画史上最杰出的画作之一——《女史箴图》绢本在大英博物馆迎来一年一度的开放展出季。可见，古籍的数字化需要一场生产效率的变革。人工智能让古籍焕发新生近几年，国内科技企业正越来越多地参与到古籍的数字化工作中来。比如在 2021 年，阿里巴巴的「汉典重光」平台帮助一批珍藏于美国加州大学伯克利分校的中文古籍善本，以数字化方式回归故土，首批 20 万页古籍已完成数字化，并沉淀为覆盖 3 万多字的古籍字典。但由于古籍的自然语言理解比普通文本要难得多，目前 AI 还是会犯一些错误（3% 到 4% 左右）。随着算法的迭代，项目团队有望将标点准确率提升到 98% 左右。
1.3K20编辑于 2022-12-15
来自专栏TEL18600524535
藏文识别技术：为藏文信息的数字化处理开辟了新的道路
随着科技的飞速发展，藏文识别技术应运而生，为藏文信息的数字化处理开辟了新的道路。 3.特征提取与模型识别：传统方法：提取字符的几何、投影、轮廓等人工设计特征，使用分类器（如SVM）识别。深度学习方法（主流）：采用卷积神经网络（CNN）自动学习字符的深层视觉特征。印刷与古籍难题：古籍藏文常使用特殊字体、存在磨损模糊；现代印刷品质量参差不齐，背景干扰多。长元音符号识别：元音符号位置灵活（上、下、环绕），准确识别其与基字的对应关系是关键。古籍数字化支持：专门技术致力于识别老化、模糊的藏文古籍文献。赋能现实：藏文识别的广阔天地藏文识别技术正深刻融入多个领域：文献典籍数字化：加速海量藏文古籍、经书、历史档案的电子化进程，建立可检索的数据库，保护濒危文化遗产。
57100编辑于 2025-08-06
来自专栏AI应用低代码开发实践
AI MaaS智能修复系统：古籍修复工具的“智能内核”——国内某低代码平台落地的完整技术实践
古籍数字化智能修复的核心，不是“搭个界面”，而是获取高质量、低成本的AI能力。登录后进入工作台，点击右上角“+ 新建应用”，命名为“古籍修复工具”，选择“对话应用”（选择合适版本以满足场景核心需求）； 3. “添加节点”→ 3.“HTTP请求”→ 4.自定义“API”“请求体(JSON)”等各项内容； 4.1. 粘贴内容：修复古籍“□”字符，需结合上下文+朝代常识（年号、官职、地名），仅补全不新增，存疑标“存疑”，输出“修复文本+1句历史依据”； 3. ）”； - 结果展示框（展示组件）：标签“修复结果”，数据来源“自定义API返回结果”； 3.
18300编辑于 2025-12-31
本文详解孔夫子旧书网古籍数据接口的实战调用，涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景，提供可复用的Python代码及避坑指南，助力学术研究、旧书商
本文从实战角度拆解接口调用全流程，覆盖认证签名、古籍检索、商铺集成、特色数据处理四大核心场景，提供可直接复用的 Python 代码与避坑指南，助力古籍数字化、学术研究、旧书商管理等业务快速落地。获取单本图书的详细元数据（含版本、页数、描述）古籍详情展示、数字化存档商铺检索/v2/shops/search按地域、主营类目检索旧书商铺商铺合作筛选、多店比价商铺详情/v2/shops/detail获取商铺信息 + 在售商品列表（支持指定商品数量）商铺数据集成、货源监控分类列表/v2/categories获取图书分类体系（含古籍专属类目）类目筛选条件构造、业务分类管理3. 重新核对 appSecret调用频率超限429QPS 超过 3，或日调用超 3000 次1. 用_control_qps方法控制间隔；2. 增加缓存（尤其古籍详情）；3. 2.扩展方向：◦古籍数字化存档：结合get_book_detail接口获取的description和images，构建古籍数字档案库；◦价格趋势分析：基于缓存的历史价格数据，分析古籍（如清代刻本）的价格波动规律
45810编辑于 2025-09-23
来自专栏运维之路
数字化转型杂谈5：数字化转型3个主线
数字化转型可以围绕三条主线展开：聚焦组织外部的客户服务、产品或商业模式创新的数字化业务，聚焦组织内部组织与运营管理的数字化管理，聚焦技术赋能的数字化技术。如果将数字化业务分3个阶段，数字化业务大体可以分为以“业务线上化、数据业务化、业务智能化”为重点的三个阶段。 数字化管理：数字化管理的重点是企业各职能团队从组织、文化、流程、协同、工具等综合性的建设，整合形成战斗力，达到高效协同，以支撑并推动数字化业务的落地。 数字化技术：数字化管理与数字化业务的落地需要一个敏捷高效的技术架构与科学有效的IT风险管控体系支撑。企业数字化转型的三个主线的思路其实也适合于领域数字化分解思路，比如运维的数字化主线：场景（保障、运营）、组织+流程、平台。
1.4K21发布于 2021-11-02
封神！PaddleOCR-VL-1.5实测：0.9B参数，碾压级文档解析能力
[3][7]。案例5：模糊杂志/古籍识别场景痛点：泛黄古籍、模糊杂志排版，字迹模糊、纸张有污渍，传统OCR识别错别字极多，生僻字无法识别，古籍数字化难度大。实测截图（左：模糊古籍原图右：识别结果+生僻字标注）：实测结论：针对模糊场景做了专项优化，模糊字体识别错别字率远低于同类模型，生僻字、异体字识别准确率90%以上，可直接用于古籍数字化、旧杂志整理这也是它能轻松应对手写笔记、模糊古籍、歪折文档的关键，相当于给模型加了“自适应高清镜头”。 2. 版面解析升级：PP-DocLayout V3统一架构升级后的PP-DocLayout V3，把“版面检测、实例分割、阅读顺序预测”整合到一个端到端架构中，不再需要单独的后处理步骤。
1.8K10编辑于 2026-02-04
来自专栏JavaPark
好物周刊#45：系统激活工具
3. 我的电视 [3] 安卓电视直播软件，内置直播源。二、软件 1. 7-Zip[4] 一款开源免费软件。大多数源代码都基于 GNU LGPL 许可协议下发布。部分代码基于 BSD 3 句条款（BSD 3-clause）许可协议发布。并且，部分代码受到了 unRAR 许可协议的限制。 3. 云萌 [6] Windows 10+ 激活工具，一键免费终身激活，享受正版相同服务，每次重装自动激活，更换硬件支持 Microsoft 账户迁移激活。 3. 汉典重光 [9] 汉典重光古籍数字化平台，收录海外回归古籍，基于达摩院文字识别技术进行数字化古籍识别，方便古籍爱好者查阅使用。通过 Vimwiki，你可以: 组织笔记和想法管理待办事项编写文档坚持写日记将这一切导出成 HTML 网页 3.
65010编辑于 2024-02-23
Power BI 文史应用：古籍竹简卷轴可视化
内容列设置为按索引列排序：按钮切片器拖拽内容列：默认文本无法纵向排列，使用SVG度量值强制： SVG.竹简= "data:image/svg+xml;utf8,<svg xmlns='http://www.w<em>3</em>.
8410编辑于 2026-03-20
来自专栏TEL18600524535
一种基于深度学习算法的维吾尔文OCR技术，支持高精度识别、多场景适配、跨平台应用
维吾尔文OCR技术是一种基于人工智能和深度学习技术的维吾尔文光学字符识别工具，能够快速、准确地将印刷体或手写体维吾尔文转换为可编辑、可搜索的数字化文本。（3）字符识别（Text Recognition）传统方法：特征提取（如HOG、LBP）+ 分类器（SVM、KNN），但泛化能力较差。古籍识别：针对老维吾尔文（如察合台文）优化，结合超分辨率技术提升清晰度。3. 跨平台支持提供Windows、Android、iOS、Web端、国产化平台应用，支持API接口集成。教育领域：教材数字化、试卷自动批改。新闻出版：报纸、书籍的快速录入与电子化。金融法律：身份证、合同等文档的自动化处理。文化遗产保护：察合台文古籍的数字化存档。
45510编辑于 2025-06-24
来自专栏HyperAI超神经
龙泉寺贤超法师：用 AI 为古籍经书识别、断句、翻译
By 超神经内容提要：来自最强科研寺庙龙泉寺的贤超法师，近年来一直在研究人工智能与文献古籍的融合，目前，他已带领的《大藏经》团队实现 AI 自动标点、文白翻译、古籍文字识别等技术实践。今后的古籍点校工作模式有希望改为：AI 先断句、加标点；专业学者进行后期校对、修改。基于深度学习的 OCR，识别古籍文字目前市面上的 OCR 软件都是针对印刷体的，因此不能很好地识别古籍文献中的字体。基于弱监督学习的精确文字分割最终，其开发的 OCR 方法能够进行古籍的单字识别、单列识别和半自动的多列识别，能够有效地完成各类古籍的电子化工作。 ? OCR 软件识别古文将其数字化 贤超法师还在其公众号「贤超小和尚」（微信号：xianchaofashi）中，分享了更多项目实践和学佛感悟，感兴趣的朋友可以关注。
2K100发布于 2021-01-25
当OCR遇见大语言模型：智能文本处理的进化之路
引言：当视觉识别遇到语言理解在数字化浪潮中，我们每天都会遇到这样的场景：用手机拍摄文件自动转换文字、扫描古籍进行电子化存档、从商品包装提取成分信息...这些看似简单的操作背后，是OCR（光学字符识别）技术数十年发展的结晶 3.4 语义增强检索python# 古籍数字化应用ocr_text = "孟子见梁惠王。王曰：'叟！不远千里而来... 从古籍数字化到工业文档处理，从医疗报告分析到教育自动化，这种技术融合正在打开通向智能认知的新纪元。
1.2K11编辑于 2025-02-19
来自专栏通用文字识别信息技术白皮书
合合信息、上海大学、华南理工大学发布业内首个古彝文编码“大字典” ，为古文字打造“身份证”
近年来，人工智能，特别是深度学习技术的发展，为古文字识别提供了高效的工具，极大地提高了古代文献和文字数字化进程的速度和效率，本次古彝文基础编码数据库的发布，将成为古文字数字化的重要成果之一。在资料文档数字化的过程中，采用科技手段优化图像质量问题是关键的一环。在古彝文语料收集过程中，研究团队选取的古籍图片采集工具是合合信息旗下的智能扫描“扫描全能王”。为发动更多的社会力量参与到古彝文识别和保护，扫描全能王已同步启动公益性活动，上线古彝文典籍上传入口，面向全社会征集古籍资料。研究团队在接收古籍后会将其转交给对应专家、部门进行研究，助力中华文化瑰宝传承。近年来，国家正不断推进文化数字化战略。 2022年，国务院办公厅印发《关于推进实施国家文化数字化战略的意见》，提出了“中华文化全景呈现，中华文化数字化成果全民共享”的目标，体现了传统文化“数字化”的重要性。
40510编辑于 2023-09-26
来自专栏编程教程
Python实现PDF图片OCR识别：从原理到实战的全流程解析
免费python编程教程：https://pan.quark.cn/s/2c17aed36b72 在数字化办公场景中，扫描版PDF文件（即图片型PDF）的文本提取需求日益增长。其核心优势在于：离线运行能力高度可定制的配置参数（如--psm页面分割模式）活跃的开源社区支持典型应用场景：政府公文、古籍数字化等对数据隐私敏感的场景。 extracted_data[field] = line[1][0].replace(keywords[0], '').strip() return extracted_data4.2 古籍数字化保护 img = preprocess_image(image_path) # 使用Tesseract的古籍专用配置 custom_config = r'--oem 3 --psm 随着AI技术的持续演进，OCR正在从单纯的文字识别向智能文档理解（IDU）阶段跨越，为企业数字化转型提供强大动力。
2.2K10编辑于 2025-09-17
来自专栏低代码（low code）专栏
如何进行企业数字化转型？数字化转型的3大核心规律
本文2.6k字，文字虽不多，但切忌一览而过~数字化转型推行了这么久，为什么依旧有不少企业不愿意进行数字化转型？如何做好数字化转型工作？企业应当牢记三点：1、数字化转型没有范式，有烦事一直以来，从国家到企业，都习惯“摸着石头过河”。数字化转型却没有石头可摸，没有一种范式通用于所有企业。正因如此，在数字化转型的过程当中，烦心事不少，要迈过的沟坎也不少。数字化转型没有“一招鲜”，每个行业、每个企业都有自身的特殊性，这种特殊性导致数字化转型经验难以复制。 3、数字化转型不是生意，是生死有些企业认为数字化只是信息化的“新瓶装旧酒”式噱头，或者直接把ERP、PLM等IT系统的实施和应用也认为是数字化。这些也是在数字化转型中的关键人才。第四：工欲善其事,必先利其器以上就是“如何进行企业数字化转型？数字化转型的3大核心规律”的全部内容，希望对大家有所帮助。
71420编辑于 2022-08-26
来自专栏AIGC 先锋科技
从 ChatGPT 到 Sora | 生成式人工智能如何改变数字人文研究和服务 ?
文章首先概述了古籍资源的重要性及数字化保护的必要性，随后详细介绍了ChatGPT等大规模语言模型的开发及其在文献管理、内容理解、跨文化研究等方面的应用。古籍的研究与保护对于中华文化的传承、文化自信的提升以及传统文化的宝藏挖掘具有重大意义。然而，由于年代和保存条件的限制，古籍保护面临着许多困难。古籍的物质损害是不可避免的，且难以保护古籍的原貌和原创性。近年来，深度神经网络、自然语言处理技术和大规模语言模型的进步，使得古籍资源的数字化和智能化处理表现出色，具有广阔的应用前景。 3.2 Content Understanding and Knowledge Production of Ancient Literature 古代书籍的完整保护与数字人文研究应包括古籍的原生保护与数字化 在文本内容解析方面，使用适当的命令可以直接指导大型模型解析历史文献[1]，从文本中识别古籍的命名实体和关系，构建古籍的知识图谱，识别古籍事件元素，识别引用句子，进行文本情感分析，并实现古籍的自动摘要、自动标注
80310编辑于 2024-07-08
来自专栏音视频咖
当小龙虾学会视频处理：腾讯云媒体处理 tencent-mps Skill 正式上线 OpenClaw
它愣住了，试着又叫了一声，确认自己真的拥有了说话的能力，与此同时，一股陌生的、带着古老气息的味道，从古籍书架后方飘了过来，吸引着它的注意力，当天上午，图书馆开门后，墨团悄悄绕到古籍书架后方，发现书架与墙壁之间竟有一道细小的缝隙，缝隙中不断透出金色的微光，还夹杂着模糊的古代读书声和车马声，凑近了，还能感受到一股微弱的吸力，墨团瞬间明白，这是一道时空裂缝，它正想再仔细观察，背着书包的初二学生苏晓走进了图书馆，径直走向三楼的古籍区，管理员陈老师曾提到过一本名叫《星时记》的千年古籍，就藏在这个古籍书架上，只是一直找不到踪影，苏晓猜测，时空裂缝的出现，或许和这本古籍有关，于是两人便在古籍书架上仔细寻找起来，随着时间一点点过去，裂缝的光芒越来越亮《星时记》，又看了看书架后方的裂缝，终于说出了隐藏已久的秘密，原来，陈老师的家族世代守护着《星时记》和图书馆的时空秘密，这本古籍是先祖流传下来的，用来稳定周边的时空秩序，前段时间整理古籍时，他不小心触碰了古籍的能量开关腾讯云音视频为全真互联时代，提供坚实的数字化助力。
47610编辑于 2026-03-27
来自专栏TEL18600524535
浅析藏文OCR技术的核心难点及其应用领域
古籍字体：木刻本、贝叶经等存在特殊字形和磨损。所以造成的难点是不同字体的同一字符可能形态迥异（如 "ཀ" 在乌金体和手写体中的写法不同）。 3.多格式输出：支持识别后输出为TXT、JSON、XML、Word等格式4.跨平台支持：提供Windows、Linux及国产化平台应用，支持API接口集成。支持离线模式，保障数据安全。藏文OCR应用场景文化保护：藏文古籍、佛经、历史档案的数字化存档。教育领域：教材电子化、试卷自动批改、藏文学习APP开发。政务办公：公文扫描、档案管理、多语言信息处理。
69310编辑于 2025-06-24

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

古籍版面分析新SOTA：HisDoc-DETR如何助力AI赋能古籍数字化难题

面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析

《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》

用AI让经典重新跳动，这个平台开放了3000万古籍字符

藏文识别技术：为藏文信息的数字化处理开辟了新的道路

AI MaaS智能修复系统：古籍修复工具的“智能内核”——国内某低代码平台落地的完整技术实践

本文详解孔夫子旧书网古籍数据接口的实战调用，涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景，提供可复用的Python代码及避坑指南，助力学术研究、旧书商

数字化转型杂谈5：数字化转型3个主线

封神！PaddleOCR-VL-1.5实测：0.9B参数，碾压级文档解析能力

好物周刊#45：系统激活工具

Power BI 文史应用：古籍竹简卷轴可视化

一种基于深度学习算法的维吾尔文OCR技术，支持高精度识别、多场景适配、跨平台应用

龙泉寺贤超法师：用 AI 为古籍经书识别、断句、翻译

当OCR遇见大语言模型：智能文本处理的进化之路

合合信息、上海大学、华南理工大学发布业内首个古彝文编码“大字典” ，为古文字打造“身份证”

Python实现PDF图片OCR识别：从原理到实战的全流程解析

如何进行企业数字化转型？数字化转型的3大核心规律

从 ChatGPT 到 Sora | 生成式人工智能如何改变数字人文研究和服务 ?

当小龙虾学会视频处理：腾讯云媒体处理 tencent-mps Skill 正式上线 OpenClaw

浅析藏文OCR技术的核心难点及其应用领域

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

古籍版面分析新SOTA：HisDoc-DETR如何助力AI赋能古籍数字化难题

面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析

《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》

用AI让经典重新跳动，这个平台开放了3000万古籍字符

藏文识别技术：为藏文信息的数字化处理开辟了新的道路

AI MaaS智能修复系统：古籍修复工具的“智能内核”——国内某低代码平台落地的完整技术实践

本文详解孔夫子旧书网古籍数据接口的实战调用，涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景，提供可复用的Python代码及避坑指南，助力学术研究、旧书商

数字化转型杂谈5：数字化转型3个主线

封神！PaddleOCR-VL-1.5实测：0.9B参数，碾压级文档解析能力

好物周刊#45：系统激活工具

Power BI 文史应用：古籍竹简卷轴可视化

一种基于深度学习算法的维吾尔文OCR技术，支持高精度识别、多场景适配、跨平台应用

龙泉寺贤超法师：用 AI 为古籍经书识别、断句、翻译

当OCR遇见大语言模型：智能文本处理的进化之路

合合信息、上海大学、华南理工大学发布业内首个古彝文编码“大字典” ，为古文字打造“身份证”

Python实现PDF图片OCR识别：从原理到实战的全流程解析

如何进行企业数字化转型？数字化转型的3大核心规律

​从 ChatGPT 到 Sora | 生成式人工智能如何改变数字人文研究和服务 ?

当小龙虾学会视频处理：腾讯云媒体处理 tencent-mps Skill 正式上线 OpenClaw

浅析藏文OCR技术的核心难点及其应用领域

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

从 ChatGPT 到 Sora | 生成式人工智能如何改变数字人文研究和服务 ?