搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏心源易码
古籍版面分析新SOTA：HisDoc-DETR如何助力AI赋能古籍数字化难题
历史文献作为文明传承的重要载体，其数字化保护与深度利用一直面临巨大挑战。纸张老化、排版复杂、字迹模糊乃至残缺破损等现象，严重制约了大规模、高精度古籍数字化进程。它为历史文献的数字化、研究和文化传承提供了工具。3.1 文化遗产保护与数字化归档全球范围内，大量历史文献因年代久远、保存条件不佳而面临损毁风险。数字化是保护这些文化遗产的关键。提升归档效率：相较于人工标注和整理，HisDoc-DETR 能够大幅提升数字化归档效率，使海量古籍的数字化成为可能。在文化遗产保护与数字化归档方面，HisDoc-DETR 可以应用到国家图书馆、博物馆等文化机构中，快速处理馆藏古籍的数字化图像，自动生成带有版面结构信息的元数据，丰富数字资源的内涵，确保历史信息的完整性和可检索性辅助校勘与断代：精确的版面信息可为古籍的校勘工作提供辅助，例如识别不同版本之间的版式差异。版式特征也可作为古籍断代研究的重要线索。
51120编辑于 2025-09-26
来自专栏技术汇总专栏
面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析
一、研究背景古籍承载着丰富的历史、文化与思想价值，但其数字化与智能化利用始终面临难题。传统的古籍版面复杂多变，存在稀疏文字、跨栏结构、插图混排等特征，这些都给自动化版面分析带来极大挑战。三、应用场景与价值HisDoc-DETR 的研究突破不仅在算法层面带来了创新，更为古籍数字化保护、利用和传播提供了全新的技术支撑。 3.2 古籍数字化与知识库建设高精度的版面解析是古籍 OCR（文字识别）和语义理解的前提。凭借对跨页、跨栏及混排等复杂版式的适应能力，HisDoc-DETR 能够满足古籍数字化的系统化管理需求，确保古籍信息的完整性与可利用性，为数字化古籍资源建设提供强有力的技术保障。未来，类似的方法有望进一步拓展到多语种、跨时代文献的数字化处理，推动古籍保护与利用进入智能化新时代。
1.2K30编辑于 2025-11-03
《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》
在文化遗产数字化领域，大模型的核心应用难点在于如何处理古籍中大量的异体字、残缺文本与模糊语义，尤其是面对明清时期的手写残卷，传统的文字识别技术不仅准确率低下，更无法理解古籍中蕴含的历史语境与专业术语。我在参与某博物馆古籍数字化项目时，首先遭遇的便是大模型对古籍文字的“识别盲区”—初期使用通用大模型识别一本明代医学残卷，发现其将“癥瘕”误判为“症痕”，把“炮制”错解为“泡制”，更无法关联“君臣佐使”等中医方剂配伍逻辑系统的“多模态数据融合”能力，是提升古籍数字化体验的重要方向。古籍数字化不仅包含文字内容，还涉及古籍的版式设计、插图、印章、纸张材质等多模态信息，例如一本元代画册型古籍，除了文字题跋，还有大量山水画作与收藏印章，这些信息对研究古籍的流传脉络与艺术价值至关重要。 “模型量化”技术，将模型参数从32位浮点型转换为16位甚至8位整型，在保证精度损失不超过5%的前提下，进一步降低硬件资源占用；最后，设计“云端+边缘端”混合部署方案，核心的知识图谱与复杂的多模态处理放在云端
55500编辑于 2025-10-10
来自专栏机器之心
用AI让经典重新跳动，这个平台开放了3000万古籍字符
而且，「识典古籍」项目负责人对媒体解释说，「识典古籍」不只是一个数字化平台，还是一个针对古籍保护的完整项目，包括古籍修复、数字化、活化三大方向。在这种情况下，古籍的数字化回归是一种更为实际的解决方案。修复难，数字化也难我国古籍数量众多，但真正能在网上查阅的数量却很少。造成这种现象的原因是多方面的。可见，古籍的数字化需要一场生产效率的变革。人工智能让古籍焕发新生近几年，国内科技企业正越来越多地参与到古籍的数字化工作中来。比如在 2021 年，阿里巴巴的「汉典重光」平台帮助一批珍藏于美国加州大学伯克利分校的中文古籍善本，以数字化方式回归故土，首批 20 万页古籍已完成数字化，并沉淀为覆盖 3 万多字的古籍字典。公众可通过该平台翻阅、检索古籍。无论是「汉典重光」还是「识典古籍」，我们都能看到 AI 技术在提高古籍数字化效率方面发挥的作用。
1.3K20编辑于 2022-12-15
本文详解孔夫子旧书网古籍数据接口的实战调用，涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景，提供可复用的Python代码及避坑指南，助力学术研究、旧书商
本文从实战角度拆解接口调用全流程，覆盖认证签名、古籍检索、商铺集成、特色数据处理四大核心场景，提供可直接复用的 Python 代码与避坑指南，助力古籍数字化、学术研究、旧书商管理等业务快速落地。 era年代（如 “清代”“民国”“明代”，普通电商接口无此字段）否bookCondition品相编码（1 = 全新→8 = 八五品以下，古籍业务核心筛选条件）否categoryId古籍分类 ID（如 “ 获取单本图书的详细元数据（含版本、页数、描述）古籍详情展示、数字化存档商铺检索/v2/shops/search按地域、主营类目检索旧书商铺商铺合作筛选、多店比价商铺详情/v2/shops/detail获取商铺信息 timestamp=1719000000000）；4.密钥追加：在拼接字符串末尾直接追加appSecret（无分隔符，例：上述字符串 +abc123def）；5.MD5 加密：对最终字符串进行 UTF-8 2.扩展方向：◦古籍数字化存档：结合get_book_detail接口获取的description和images，构建古籍数字档案库；◦价格趋势分析：基于缓存的历史价格数据，分析古籍（如清代刻本）的价格波动规律
45810编辑于 2025-09-23
来自专栏JavaPark
好物周刊#45：系统激活工具
书摘天下 [8] 书摘天下提供古诗词赏析，励志名言，作文写作指导，范文参考，包括名人名言，励志名言，工作总结，优秀作文，诗词鉴赏等资料。 3. 汉典重光 [9] 汉典重光古籍数字化平台，收录海外回归古籍，基于达摩院文字识别技术进行数字化古籍识别，方便古籍爱好者查阅使用。支持 mp4, webm, m8u3 等音视频后缀直接播放。支持第三方独立播放器在线播放。（只要包含【?url=】等特征即可。）支持上传本地文件到图床服务器。支持暗黑模式。
65010编辑于 2024-02-23
来自专栏TEL18600524535
藏文识别技术：为藏文信息的数字化处理开辟了新的道路
随着科技的飞速发展，藏文识别技术应运而生，为藏文信息的数字化处理开辟了新的道路。印刷与古籍难题：古籍藏文常使用特殊字体、存在磨损模糊；现代印刷品质量参差不齐，背景干扰多。长元音符号识别：元音符号位置灵活（上、下、环绕），准确识别其与基字的对应关系是关键。古籍数字化支持：专门技术致力于识别老化、模糊的藏文古籍文献。赋能现实：藏文识别的广阔天地藏文识别技术正深刻融入多个领域：文献典籍数字化：加速海量藏文古籍、经书、历史档案的电子化进程，建立可检索的数据库，保护濒危文化遗产。
57100编辑于 2025-08-06
来自专栏AI应用低代码开发实践
AI MaaS智能修复系统：古籍修复工具的“智能内核”——国内某低代码平台落地的完整技术实践
古籍数字化智能修复的核心，不是“搭个界面”，而是获取高质量、低成本的AI能力。 AI聚合型MaaS平台是“智能内核”——聚合27+供应商的422+模型，通过统一API、实时性能评测、智能路由调度，提供“即插即用”的古籍修复能力；某低代码平台是承载能力的“交互载体”。登录后进入工作台，点击右上角“+ 新建应用”，命名为“古籍修复工具”，选择“对话应用”（选择合适版本以满足场景核心需求）； 3. 粘贴内容：修复古籍“□”字符，需结合上下文+朝代常识（年号、官职、地名），仅补全不新增，存疑标“存疑”，输出“修复文本+1句历史依据”； 3. 拖拽组件： - 文本输入框（基础组件）：标签“残缺古籍文本”，提示“请粘贴含□文本（例：天□三年）”，多行输入； - 按钮（基础组件）：文本“开始修复”，绑定“调用自定义API”→“GLM-4.6（古籍修复专用
18300编辑于 2025-12-31
封神！PaddleOCR-VL-1.5实测：0.9B参数，碾压级文档解析能力
全场景适配，无死角：新增印章识别、文本行定位，强化古籍/生僻字、多语种（藏语、孟加拉语等）解析，覆盖公式、表格、手写笔记、双栏论文等全场景。案例5：模糊杂志/古籍识别场景痛点：泛黄古籍、模糊杂志排版，字迹模糊、纸张有污渍，传统OCR识别错别字极多，生僻字无法识别，古籍数字化难度大。实测截图（左：模糊古籍原图右：识别结果+生僻字标注）：实测结论：针对模糊场景做了专项优化，模糊字体识别错别字率远低于同类模型，生僻字、异体字识别准确率90%以上，可直接用于古籍数字化、旧杂志整理这也是它能轻松应对手写笔记、模糊古籍、歪折文档的关键，相当于给模型加了“自适应高清镜头”。 2. ✅ 企业用户（财务/政务/编辑）：轻量高效，全场景适配，歪折文档、印章表格、古籍等场景均可落地，大幅降低人工成本，支持规模化部署。
1.8K10编辑于 2026-02-04
Power BI 文史应用：古籍竹简卷轴可视化
以便拆分后的文本按顺序显示：返回报表视图，内容列设置为按索引列排序：按钮切片器拖拽内容列：默认文本无法纵向排列，使用SVG度量值强制： SVG.竹简= "data:image/svg+xml;utf8,
8410编辑于 2026-03-20
来自专栏HyperAI超神经
龙泉寺贤超法师：用 AI 为古籍经书识别、断句、翻译
By 超神经内容提要：来自最强科研寺庙龙泉寺的贤超法师，近年来一直在研究人工智能与文献古籍的融合，目前，他已带领的《大藏经》团队实现 AI 自动标点、文白翻译、古籍文字识别等技术实践。今后的古籍点校工作模式有希望改为：AI 先断句、加标点；专业学者进行后期校对、修改。基于深度学习的 OCR，识别古籍文字目前市面上的 OCR 软件都是针对印刷体的，因此不能很好地识别古籍文献中的字体。基于弱监督学习的精确文字分割最终，其开发的 OCR 方法能够进行古籍的单字识别、单列识别和半自动的多列识别，能够有效地完成各类古籍的电子化工作。 ? OCR 软件识别古文将其数字化 贤超法师还在其公众号「贤超小和尚」（微信号：xianchaofashi）中，分享了更多项目实践和学佛感悟，感兴趣的朋友可以关注。
2K100发布于 2021-01-25
来自专栏编程教程
Python实现PDF图片OCR识别：从原理到实战的全流程解析
免费python编程教程：https://pan.quark.cn/s/2c17aed36b72 在数字化办公场景中，扫描版PDF文件（即图片型PDF）的文本提取需求日益增长。其核心优势在于：离线运行能力高度可定制的配置参数（如--psm页面分割模式）活跃的开源社区支持典型应用场景：政府公文、古籍数字化等对数据隐私敏感的场景。 extracted_data[field] = line[1][0].replace(keywords[0], '').strip() return extracted_data4.2 古籍数字化保护 results = list(executor.map(ocr_recognition, image_list)) return results使用量化模型（如PaddleOCR的INT8版本随着AI技术的持续演进，OCR正在从单纯的文字识别向智能文档理解（IDU）阶段跨越，为企业数字化转型提供强大动力。
2.2K10编辑于 2025-09-17
当OCR遇见大语言模型：智能文本处理的进化之路
引言：当视觉识别遇到语言理解在数字化浪潮中，我们每天都会遇到这样的场景：用手机拍摄文件自动转换文字、扫描古籍进行电子化存档、从商品包装提取成分信息...这些看似简单的操作背后，是OCR（光学字符识别）技术数十年发展的结晶 3.4 语义增强检索python# 古籍数字化应用ocr_text = "孟子见梁惠王。王曰：'叟！不远千里而来... 从古籍数字化到工业文档处理，从医疗报告分析到教育自动化，这种技术融合正在打开通向智能认知的新纪元。
1.2K11编辑于 2025-02-19
来自专栏TEL18600524535
一种基于深度学习算法的维吾尔文OCR技术，支持高精度识别、多场景适配、跨平台应用
维吾尔文OCR技术是一种基于人工智能和深度学习技术的维吾尔文光学字符识别工具，能够快速、准确地将印刷体或手写体维吾尔文转换为可编辑、可搜索的数字化文本。古籍识别：针对老维吾尔文（如察合台文）优化，结合超分辨率技术提升清晰度。3. 跨平台支持提供Windows、Android、iOS、Web端、国产化平台应用，支持API接口集成。教育领域：教材数字化、试卷自动批改。新闻出版：报纸、书籍的快速录入与电子化。金融法律：身份证、合同等文档的自动化处理。文化遗产保护：察合台文古籍的数字化存档。
45510编辑于 2025-06-24
来自专栏通用文字识别信息技术白皮书
合合信息、上海大学、华南理工大学发布业内首个古彝文编码“大字典” ，为古文字打造“身份证”
近年来，人工智能，特别是深度学习技术的发展，为古文字识别提供了高效的工具，极大地提高了古代文献和文字数字化进程的速度和效率，本次古彝文基础编码数据库的发布，将成为古文字数字化的重要成果之一。在资料文档数字化的过程中，采用科技手段优化图像质量问题是关键的一环。在古彝文语料收集过程中，研究团队选取的古籍图片采集工具是合合信息旗下的智能扫描“扫描全能王”。为发动更多的社会力量参与到古彝文识别和保护，扫描全能王已同步启动公益性活动，上线古彝文典籍上传入口，面向全社会征集古籍资料。研究团队在接收古籍后会将其转交给对应专家、部门进行研究，助力中华文化瑰宝传承。近年来，国家正不断推进文化数字化战略。 2022年，国务院办公厅印发《关于推进实施国家文化数字化战略的意见》，提出了“中华文化全景呈现，中华文化数字化成果全民共享”的目标，体现了传统文化“数字化”的重要性。
40510编辑于 2023-09-26
来自专栏音视频咖
当小龙虾学会视频处理：腾讯云媒体处理 tencent-mps Skill 正式上线 OpenClaw
它愣住了，试着又叫了一声，确认自己真的拥有了说话的能力，与此同时，一股陌生的、带着古老气息的味道，从古籍书架后方飘了过来，吸引着它的注意力，当天上午，图书馆开门后，墨团悄悄绕到古籍书架后方，发现书架与墙壁之间竟有一道细小的缝隙，缝隙中不断透出金色的微光，还夹杂着模糊的古代读书声和车马声，凑近了，还能感受到一股微弱的吸力，墨团瞬间明白，这是一道时空裂缝，它正想再仔细观察，背着书包的初二学生苏晓走进了图书馆，径直走向三楼的古籍区，管理员陈老师曾提到过一本名叫《星时记》的千年古籍，就藏在这个古籍书架上，只是一直找不到踪影，苏晓猜测，时空裂缝的出现，或许和这本古籍有关，于是两人便在古籍书架上仔细寻找起来，随着时间一点点过去，裂缝的光芒越来越亮《星时记》，又看了看书架后方的裂缝，终于说出了隐藏已久的秘密，原来，陈老师的家族世代守护着《星时记》和图书馆的时空秘密，这本古籍是先祖流传下来的，用来稳定周边的时空秩序，前段时间整理古籍时，他不小心触碰了古籍的能量开关腾讯云音视频为全真互联时代，提供坚实的数字化助力。
47610编辑于 2026-03-27
来自专栏资讯分享
优秀贯标企业！腾讯云数据库TDSQL、操作系统TencentOS首批通过强制性国标GB18030-2022认证
8月17日，在中国电子技术标准化研究院举办的“强制性国家标准GB18030标准宣贯会暨首批通过认证测试产品发布会”上，腾讯云两款产品数据库TDSQL、操作系统TencentOS作为首批通过认证测试的产品强制性国家标准GB18030-2022《信息技术中文编码字符集》于2023年8月1日起全面实施。大量的地名、古籍、方言中也包含生僻字，其中多数尚未实现数字化。相比旧版标准 GB18030-2005，新国标新增了17000 多个汉字，共收录 87887 个汉字，大幅扩充了汉字字符数量，尤其是生僻字数量，基本上满足了人名、地名、古籍、方言等场景中生僻字处理的需求
50810编辑于 2023-08-28
【专利技术】汉字数字水印技术，开启信息安全新纪元（第5期）
例如 “田” 字，中间横笔的断开如果不符合古籍异体字的规范，就会被视为错误的写法。正是这种对字形结构的严格要求，使得基于拓扑变异的隐形水印成为可能。 1、高效水印嵌入，突破容量瓶颈：新专利通过部首部件拆分设计，单个部件可承载6-8bit信息，实现CJK全字符集覆盖，单字水印容量提升至30-64bit，突破传统人工设计产能瓶颈。尤其适用于古籍数字化等生僻字密集场景，可保障全文本水印嵌入的完整性。 4、文物数字化保护领域：在文物数字化保护领域，将该专利技术应用于文物数字化项目中，可以对文物的数字化图像、文字描述等信息进行水印嵌入，既可保护数字化成果版权，又能追踪信息传播路径、保障信息真实性，为文物保护与研究提供技术支撑
18420编辑于 2025-12-29
好物周刊#149：同事.skill
开发者武器库 [8] 提供 60+ 免费在线开发工具，Base64、JSON、颜色转换、UUID、JWT 解码等，提升开发效率。 3. 古籍文献知识图谱网 [9] 一个专业级的古典文学研究数字化平台，适合文学研究者、历史学者、古籍爱好者进行学术研究和数据挖掘。 github.com/cosZone/MoePeek [6] FreeCut: https://github.com/walterlow/freecut [7] 句方便: https://seneasy.cloud [8] 开发者武器库: https://devtool.tech [9] 古籍文献知识图谱网: https://cnkgraph.com [10] Avira 浏览器安全: https://chromewebstore.google.com shareId=860487e32c6cc8d6c9070cd7f00caedf3cbf4102f695862d9c82f463b92417af [20] issue: https://github.com
6110编辑于 2026-04-17
来自专栏腾讯云数据库(TencentDB)
优秀贯标企业！腾讯云数据库TDSQL首批通过强制性国标GB18030-2022最高级别认证
8月21日，在中国电子技术标准化研究院举办的“强制性国家标准GB18030标准宣贯会暨首批通过认证测试产品发布会”上，腾讯云数据库TDSQL、操作系统TencentOS作为首批通过认证测试的产品，获得强制性国家标准GB18030-2022《信息技术中文编码字符集》于2023年8月1日起全面实施。大量的地名、古籍、方言中也包含生僻字，其中多数尚未实现数字化。相比旧版标准 GB18030-2005，新国标新增了17000 多个汉字，共收录 87887 个汉字，大幅扩充了汉字字符数量，尤其是生僻字数量，基本上满足了人名、地名、古籍、方言等场景中生僻字处理的需求
73950编辑于 2023-08-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

古籍版面分析新SOTA：HisDoc-DETR如何助力AI赋能古籍数字化难题

面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析

《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》

用AI让经典重新跳动，这个平台开放了3000万古籍字符

本文详解孔夫子旧书网古籍数据接口的实战调用，涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景，提供可复用的Python代码及避坑指南，助力学术研究、旧书商

好物周刊#45：系统激活工具

藏文识别技术：为藏文信息的数字化处理开辟了新的道路

AI MaaS智能修复系统：古籍修复工具的“智能内核”——国内某低代码平台落地的完整技术实践

封神！PaddleOCR-VL-1.5实测：0.9B参数，碾压级文档解析能力

Power BI 文史应用：古籍竹简卷轴可视化

龙泉寺贤超法师：用 AI 为古籍经书识别、断句、翻译

Python实现PDF图片OCR识别：从原理到实战的全流程解析

当OCR遇见大语言模型：智能文本处理的进化之路

一种基于深度学习算法的维吾尔文OCR技术，支持高精度识别、多场景适配、跨平台应用

合合信息、上海大学、华南理工大学发布业内首个古彝文编码“大字典” ，为古文字打造“身份证”

当小龙虾学会视频处理：腾讯云媒体处理 tencent-mps Skill 正式上线 OpenClaw

优秀贯标企业！腾讯云数据库TDSQL、操作系统TencentOS首批通过强制性国标GB18030-2022认证

【专利技术】汉字数字水印技术，开启信息安全新纪元（第5期）

好物周刊#149：同事.skill

优秀贯标企业！腾讯云数据库TDSQL首批通过强制性国标GB18030-2022最高级别认证

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐