首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏心源易码

    古籍版面分析新SOTA:HisDoc-DETR如何助力AI赋能古籍数字化难题

    历史文献作为文明传承的重要载体,其数字化保护与深度利用一直面临巨大挑战。纸张老化、排版复杂、字迹模糊乃至残缺破损等现象,严重制约了大规模、高精度古籍数字化进程。 它为历史文献的数字化、研究和文化传承提供了工具。3.1 文化遗产保护与数字化归档全球范围内,大量历史文献因年代久远、保存条件不佳而面临损毁风险。数字化是保护这些文化遗产的关键。 提升归档效率:相较于人工标注和整理,HisDoc-DETR 能够大幅提升数字化归档效率,使海量古籍数字化成为可能。 在文化遗产保护与数字化归档方面,HisDoc-DETR 可以应用到国家图书馆、博物馆等文化机构中,快速处理馆藏古籍数字化图像,自动生成带有版面结构信息的元数据,丰富数字资源的内涵,确保历史信息的完整性和可检索性 辅助校勘与断代:精确的版面信息可为古籍的校勘工作提供辅助,例如识别不同版本之间的版式差异。版式特征也可作为古籍断代研究的重要线索。

    51120编辑于 2025-09-26
  • 来自专栏技术汇总专栏

    面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析

    2.保证边界精度:古籍 OCR 依赖边界框的精准定位,如果边框稍有偏移,后续的文字切割与识别都会受影响。通过 GIoU-aware,系统能优先输出定位精准的框。 这充分证明了三大模块的互补性与有效性,也展示了该方法在古籍复杂场景下的独特优势。表 1. HisDoc-DETR核心模块缺失后的实验结果 表 2. 特征融合模块对比结果表 3. 3.2 古籍数字化与知识库建设高精度的版面解析是古籍 OCR(文字识别)和语义理解的前提。 凭借对跨页、跨栏及混排等复杂版式的适应能力,HisDoc-DETR 能够满足古籍数字化的系统化管理需求,确保古籍信息的完整性与可利用性,为数字化古籍资源建设提供强有力的技术保障。 未来,类似的方法有望进一步拓展到多语种、跨时代文献的数字化处理,推动古籍保护与利用进入智能化新时代。

    1.2K30编辑于 2025-11-03
  • 《大模型赋能文化遗产数字化古籍修复与知识挖掘的技术实践》

    在文化遗产数字化领域,大模型的核心应用难点在于如何处理古籍中大量的异体字、残缺文本与模糊语义,尤其是面对明清时期的手写残卷,传统的文字识别技术不仅准确率低下,更无法理解古籍中蕴含的历史语境与专业术语。 我在参与某博物馆古籍数字化项目时,首先遭遇的便是大模型对古籍文字的“识别盲区”—初期使用通用大模型识别一本明代医学残卷,发现其将“癥瘕”误判为“症痕”,把“炮制”错解为“泡制”,更无法关联“君臣佐使”等中医方剂配伍逻辑 系统的“多模态数据融合”能力,是提升古籍数字化体验的重要方向。 古籍数字化不仅包含文字内容,还涉及古籍的版式设计、插图、印章、纸张材质等多模态信息,例如一本元代画册型古籍,除了文字题跋,还有大量山水画作与收藏印章,这些信息对研究古籍的流传脉络与艺术价值至关重要。 这一实践让我认识到,古籍数字化不是“文字的简单电子化”,而是“多模态信息的全面整合与深度关联”,大模型的多模态能力为文化遗产的立体呈现提供了全新可能。

    55400编辑于 2025-10-10
  • 来自专栏机器之心

    用AI让经典重新跳动,这个平台开放了3000万古籍字符

    而且,「识典古籍」项目负责人对媒体解释说,「识典古籍」不只是一个数字化平台,还是一个针对古籍保护的完整项目,包括古籍修复、数字化、活化三大方向。 在这种情况下,古籍数字化回归是一种更为实际的解决方案。 修复难,数字化也难 我国古籍数量众多,但真正能在网上查阅的数量却很少。造成这种现象的原因是多方面的。 可见,古籍数字化需要一场生产效率的变革。 人工智能让古籍焕发新生 近几年,国内科技企业正越来越多地参与到古籍数字化工作中来。 比如在 2021 年,阿里巴巴的「汉典重光」平台帮助一批珍藏于美国加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,首批 20 万页古籍已完成数字化,并沉淀为覆盖 3 万多字的古籍字典。 公众可通过该平台翻阅、检索古籍。 无论是「汉典重光」还是「识典古籍」,我们都能看到 AI 技术在提高古籍数字化效率方面发挥的作用。

    1.3K20编辑于 2022-12-15
  • 来自专栏TEL18600524535

    藏文识别技术:为藏文信息的数字化处理开辟了新的道路

    随着科技的飞速发展,藏文识别技术应运而生,为藏文信息的数字化处理开辟了新的道路。 攻坚克难:藏文识别的独特挑战藏文识别面临远超拉丁字母文字的复杂挑战:字形结构高度复杂: 字符由基字、上加字(2-3个)、下加字(2-4个)、元音符号(可上下叠加)、后加字、再后加字等纵向叠加构成(如“ཀྲུྨ 印刷与古籍难题: 古籍藏文常使用特殊字体、存在磨损模糊;现代印刷品质量参差不齐,背景干扰多。长元音符号识别: 元音符号位置灵活(上、下、环绕),准确识别其与基字的对应关系是关键。 古籍数字化支持: 专门技术致力于识别老化、模糊的藏文古籍文献。 赋能现实:藏文识别的广阔天地藏文识别技术正深刻融入多个领域:文献典籍数字化: 加速海量藏文古籍、经书、历史档案的电子化进程,建立可检索的数据库,保护濒危文化遗产。

    57100编辑于 2025-08-06
  • 来自专栏超级架构师

    数字化数字化转型指南 - 第2部分

    关键要点 业务转型,无论是否为数字化,都很复杂。 利用参考框架来模拟,理解和定价其经济,风险和财务影响至关重要。 为了有效,数字化转型必须具有破坏性。 本文提出的框架有助于评估中断的性质和程度,因此选择数字化进化是有意识决策的结果。 业务和技术块的组装,共享和集成构成“可组合”的企业是成为数字化的本质。 因此,本文简要介绍了改变企业文化以成功实现数字化变革的重要性。最后,我相信,有一些结束的想法可以成功地指导您自己的数字化旅程。 行动中的数字化转型框架 本节为金融服务公司(特别是资产管理公司)执行数字化转型框架。 图34提出了一个参考框架,将人为因素纳入业务转型,无论是否为数字化。在分配有限资源以完成数字化旅程时,组织应该预期会执行微妙的平衡行为。

    1.1K51发布于 2019-06-02
  • 本文详解孔夫子旧书网古籍数据接口的实战调用,涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景,提供可复用的Python代码及避坑指南,助力学术研究、旧书商

    本文从实战角度拆解接口调用全流程,覆盖认证签名、古籍检索、商铺集成、特色数据处理四大核心场景,提供可直接复用的 Python 代码与避坑指南,助力古籍数字化、学术研究、旧书商管理等业务快速落地。 ,古籍常用 “年代倒序”)否2. 核心接口列表(按业务场景分类)接口名称接口地址核心功能适用场景图书检索/v2/books/search按关键词、作者、年代、品相检索古籍 / 旧书古籍批量筛选、学术样本采集图书详情/v2/books/detail 获取单本图书的详细元数据(含版本、页数、描述)古籍详情展示、数字化存档商铺检索/v2/shops/search按地域、主营类目检索旧书商铺商铺合作筛选、多店比价商铺详情/v2/shops/detail获取商铺信息 2.扩展方向:◦古籍数字化存档:结合get_book_detail接口获取的description和images,构建古籍数字档案库;◦价格趋势分析:基于缓存的历史价格数据,分析古籍(如清代刻本)的价格波动规律

    45810编辑于 2025-09-23
  • 来自专栏AI应用低代码开发实践

    AI MaaS智能修复系统:古籍修复工具的“智能内核”——国内某低代码平台落地的完整技术实践

    古籍数字化智能修复的核心,不是“搭个界面”,而是获取高质量、低成本的AI能力。 一、AI聚合型MaaS:古籍修复的能力供给核心 核心优势解决三大痛点: 1. 低成本获取专业模型:可获取GLM-4.6等模型,无需自建GPU集群与历史语料库,授权后可调用; 2. 应用编辑器左侧“系统提示”进入配置页; 2. 粘贴内容:修复古籍“□”字符,需结合上下文+朝代常识(年号、官职、地名),仅补全不新增,存疑标“存疑”,输出“修复文本+1句历史依据”; 3. 上侧“用户界面”选择“小程序和H5”,进入拖拽编辑页; 2. 拖拽组件: - 文本输入框(基础组件):标签“残缺古籍文本”,提示“请粘贴含□文本(例:天□三年)”,多行输入; - 按钮(基础组件):文本“开始修复”,绑定“调用自定义API”→“GLM-4.6(古籍修复专用

    18300编辑于 2025-12-31
  • 封神!PaddleOCR-VL-1.5实测:0.9B参数,碾压级文档解析能力

    对比DeepSeek-OCR2会遗漏部分符号,Mineru则会出现格式错误。 案例2:歪折文档识别 场景痛点 :手机斜拍、纸张弯折的文档,文字倾斜、表格线条扭曲,传统OCR识别错乱,需要人工二次核对。 案例5:模糊杂志/古籍识别 场景痛点 :泛黄古籍、模糊杂志排版,字迹模糊、纸张有污渍,传统OCR识别错别字极多,生僻字无法识别,古籍数字化难度大。 实测截图 (左:模糊古籍原图 右:识别结果+生僻字标注): 实测结论 :针对模糊场景做了专项优化,模糊字体识别错别字率远低于同类模型,生僻字、异体字识别准确率90%以上,可直接用于古籍数字化、旧杂志整理 这也是它能轻松应对手写笔记、模糊古籍、歪折文档的关键,相当于给模型加了“自适应高清镜头”。 2.

    1.8K10编辑于 2026-02-04
  • 来自专栏超级架构师

    数字化转型】数字化转型指南 - 第2部分

    数字化数字化转型指南:定义,定价和规划(第1部分) 关键要点 业务转型,无论是否为数字化,都很复杂。利用参考框架来模拟,理解和定价其经济,风险和财务影响至关重要。 为了有效,数字化转型必须具有破坏性。本文提出的框架有助于评估中断的性质和程度,因此选择数字化进化是有意识决策的结果。 业务和技术块的组装,共享和集成构成“可组合”的企业是成为数字化的本质。 因此,本文简要介绍了改变企业文化以成功实现数字化变革的重要性。最后,我相信,有一些结束的想法可以成功地指导您自己的数字化旅程。 行动中的数字化转型框架 本节为金融服务公司(特别是资产管理公司)执行数字化转型框架。 图34提出了一个参考框架,将人为因素纳入业务转型,无论是否为数字化。在分配有限资源以完成数字化旅程时,组织应该预期会执行微妙的平衡行为。

    72710编辑于 2023-01-04
  • 来自专栏JavaPark

    好物周刊#45:系统激活工具

    主要分为四个部分: 前端 微服务后端 开放平台 SDK 代码沙箱 2. 咩咩单词 [2] 一款简易背单词的微信小程序。 3. 我的电视 [3] 安卓电视直播软件,内置直播源。 主要具有以下特性: 使用了 LZMA 与 LZMA2 算法的 7z 格式 拥有极高的压缩比 支持格式: 压缩 / 解压缩:7z、XZ、BZIP2、GZIP、TAR、ZIP 以及 WIM 仅解压缩:AR、 汉典重光 [9] 汉典重光古籍数字化平台,收录海外回归古籍,基于达摩院文字识别技术进行数字化古籍识别,方便古籍爱好者查阅使用。 2. Replace Google CDN[11] 将 Google CDN 替换为国内镜像,加速网站访问速度。 3. 值得一看的技术类书籍列表 [13] 国内外互联网技术大牛们都写了哪些书籍:计算机基础、网络、前端、后端、数据库、架构、大数据、深度学习…… 2.

    65010编辑于 2024-02-23
  • 来自专栏机器之心

    后GAN时代的内容生成:这次来聊聊DALL·E 2、数字人以及用GAN修古籍

    最近,DALL·E 更新到了第二版(DALL·E 2),其生成能力令人叹为观止。 这些进展让我们看到了内容生成在现实生活中广泛应用的可能性。 特邀嘉宾与主题介绍 分享主题:基于GAN的古籍文档的修复 嘉宾简介:陈善雄,西南大学计算机与信息科学院教授,研究方向为模式识别、文档分析预处理。 ,在国际学术会议发表主题报告10余次 分享摘要:本次分享将分析利用生成对抗网络在古籍文档修复方面的一些工作,特别是在修复过程中字体风格的保持方面进行约束。 研究兴趣为对真实物理世界中物体、场景与人的高效高保真三维数字化与生成。 分享摘要:对物理世界中物体、场景、人的高效高保真三维数字化一直以来都是计算机图形学、三维视觉、VR/AR等领域的核心研究问题。 中科大3DV课题组在基于单目视频的高保真数字人建模与驱动方面开展了多方面的研究,包括基于单目视频的完整头部建模与说话数字人生成,穿衣人体建模与驱动,拟实现数字化每个人的愿景。

    59540编辑于 2022-05-16
  • 当OCR遇见大语言模型:智能文本处理的进化之路

    引言:当视觉识别遇到语言理解在数字化浪潮中,我们每天都会遇到这样的场景:用手机拍摄文件自动转换文字、扫描古籍进行电子化存档、从商品包装提取成分信息...这些看似简单的操作背后,是OCR(光学字符识别)技术数十年发展的结晶 直接处理图像与文本的关联三、技术融合的五大优势3.1 错误校正(以医疗报告为例)pythonfrom transformers import pipeline# OCR原始输出ocr_text = "患者诊断为2型糖原病 text-generation', model='medical-llm')corrected = med_llm(f"修正医学文本:{ocr_text}")[0]['generated_text']# 输出:患者诊断为2型糖尿病 3.4 语义增强检索python# 古籍数字化应用ocr_text = "孟子见梁惠王。王曰:'叟!不远千里而来... 从古籍数字化到工业文档处理,从医疗报告分析到教育自动化,这种技术融合正在打开通向智能认知的新纪元。

    1.2K11编辑于 2025-02-19
  • Power BI 文史应用:古籍竹简卷轴可视化

    度量值中的font-family可以使用中文字体的英文名称(需注意字体是否免费)。按钮背景上传竹简照片,完工。

    8410编辑于 2026-03-20
  • 来自专栏TEL18600524535

    一种基于深度学习算法的维吾尔文OCR技术,支持高精度识别、多场景适配、跨平台应用

    维吾尔文OCR技术是一种基于人工智能和深度学习技术的维吾尔文光学字符识别工具,能够快速、准确地将印刷体或手写体维吾尔文转换为可编辑、可搜索的数字化文本。 (2)文本检测(Text Detection)传统方法:使用滑动窗口、连通域分析(如MSER)定位文本区域。 2. 多场景适配文档识别:支持扫描件、PDF、图片(JPG/PNG)输入,自动矫正扭曲文本。古籍识别:针对老维吾尔文(如察合台文)优化,结合超分辨率技术提升清晰度。3. 教育领域:教材数字化、试卷自动批改。新闻出版:报纸、书籍的快速录入与电子化。金融法律:身份证、合同等文档的自动化处理。文化遗产保护:察合台文古籍数字化存档。

    45510编辑于 2025-06-24
  • 来自专栏HyperAI超神经

    龙泉寺贤超法师:用 AI 为古籍经书识别、断句、翻译

    By 超神经 内容提要:来自最强科研寺庙龙泉寺的贤超法师,近年来一直在研究人工智能与文献古籍的融合,目前,他已带领的《大藏经》团队实现 AI 自动标点、文白翻译、古籍文字识别等技术实践。 贤超法师用一天时间完成了 2 万字左右规模的古文标点,按照古籍标点每千字 15 元的一般稿酬水平,相当于一天创造了 300 元的经济价值。 基于深度学习的 OCR,识别古籍文字 目前市面上的 OCR 软件都是针对印刷体的,因此不能很好地识别古籍文献中的字体。 基于弱监督学习的精确文字分割 最终,其开发的 OCR 方法能够进行古籍的单字识别、单列识别和半自动的多列识别,能够有效地完成各类古籍的电子化工作。 ? OCR 软件识别古文将其数字化 贤超法师还在其公众号「贤超小和尚」(微信号:xianchaofashi)中,分享了更多项目实践和学佛感悟,感兴趣的朋友可以关注。

    2K100发布于 2021-01-25
  • 来自专栏通用文字识别信息技术白皮书

    合合信息、上海大学、华南理工大学发布业内首个古彝文编码“大字典” ,为古文字打造“身份证”

    近年来,人工智能,特别是深度学习技术的发展,为古文字识别提供了高效的工具,极大地提高了古代文献和文字数字化进程的速度和效率,本次古彝文基础编码数据库的发布,将成为古文字数字化的重要成果之一。 在资料文档数字化的过程中,采用科技手段优化图像质量问题是关键的一环。在古彝文语料收集过程中,研究团队选取的古籍图片采集工具是合合信息旗下的智能扫描“扫描全能王”。 为发动更多的社会力量参与到古彝文识别和保护,扫描全能王已同步启动公益性活动,上线古彝文典籍上传入口,面向全社会征集古籍资料。 研究团队在接收古籍后会将其转交给对应专家、部门进行研究,助力中华文化瑰宝传承。近年来,国家正不断推进文化数字化战略。 2022年,国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,提出了“中华文化全景呈现,中华文化数字化成果全民共享”的目标,体现了传统文化“数字化”的重要性。

    40510编辑于 2023-09-26
  • 来自专栏编程教程

    Python实现PDF图片OCR识别:从原理到实战的全流程解析

    ​免费python编程教程:https://pan.quark.cn/s/2c17aed36b72 在数字化办公场景中,扫描版PDF文件(即图片型PDF)的文本提取需求日益增长。 其核心优势在于:离线运行能力高度可定制的配置参数(如--psm页面分割模式)活跃的开源社区支持典型应用场景:政府公文、古籍数字化等对数据隐私敏感的场景。 extracted_data[field] = line[1][0].replace(keywords[0], '').strip() return extracted_data4.2 古籍数字化保护 img = preprocess_image(image_path) # 使用Tesseract的古籍专用配置 custom_config = r'--oem 3 --psm 随着AI技术的持续演进,OCR正在从单纯的文字识别向智能文档理解(IDU)阶段跨越,为企业数字化转型提供强大动力。​

    2.2K10编辑于 2025-09-17
  • 来自专栏音视频咖

    当小龙虾学会视频处理:腾讯云媒体处理 tencent-mps Skill 正式上线 OpenClaw

    覆盖从素材生产到内容分发的全链路媒体处理能力: 你只需要说: "这个视频有点模糊,帮我做大模型画质增强,把分辨率提升到 2K。" Agent 就会自动完成所有操作。 它愣住了,试着又叫了一声,确认自己真的拥有了说话的能力,与此同时,一股陌生的、带着古老气息的味道,从古籍书架后方飘了过来,吸引着它的注意力,当天上午,图书馆开门后,墨团悄悄绕到古籍书架后方,发现书架与墙壁之间竟有一道细小的缝隙 ,管理员陈老师曾提到过一本名叫《星时记》的千年古籍,就藏在这个古籍书架上,只是一直找不到踪影,苏晓猜测,时空裂缝的出现,或许和这本古籍有关,于是两人便在古籍书架上仔细寻找起来,随着时间一点点过去,裂缝的光芒越来越亮 《星时记》,又看了看书架后方的裂缝,终于说出了隐藏已久的秘密,原来,陈老师的家族世代守护着《星时记》和图书馆的时空秘密,这本古籍是先祖流传下来的,用来稳定周边的时空秩序,前段时间整理古籍时,他不小心触碰了古籍的能量开关 腾讯云音视频为全真互联时代,提供坚实的数字化助力。

    47610编辑于 2026-03-27
  • 来自专栏TEL18600524535

    浅析藏文OCR技术的核心难点及其应用领域

    古籍字体:木刻本、贝叶经等存在特殊字形和磨损。所以造成的难点是不同字体的同一字符可能形态迥异(如 "ཀ" 在乌金体和手写体中的写法不同)。 2. 多场景适配:支持扫描件、PDF、图片(JPG/PNG)等多种输入格式。 藏文OCR应用场景文化保护:藏文古籍、佛经、历史档案的数字化存档。教育领域:教材电子化、试卷自动批改、藏文学习APP开发。政务办公:公文扫描、档案管理、多语言信息处理。

    69310编辑于 2025-06-24
领券