首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈技术

    CCIG 2024:合合信息文档解析技术突破与应用前景

    在此盛会上,合合信息的智能创新事业部研发总监常扬发表演讲。常扬老师分享了合合信息在文档解析技术方面的最新研究成果,探讨如何利用这些技术加速大模型的训练和应用。 合合信息的文档解析技术合合信息在文档解析技术方面进行了深入的研究和开发,其核心研究方向包括多文档元素识别、版面分析和高性能的文档解析技术。 合合信息的文档解析技术能够提供高精准、高效率的解析结果,适用于大模型的训练和应用场景。技术实现:精细化模型训练:通过精细化的模型训练和调优,提高文档解析的准确性。 版面分析算法的发展合合信息在近期的研究发现,真实世界的文档布局类型非常丰富,无法简单地用单栏、双栏等类别来定义。例如下面列举的,目录,报纸,试卷等。 Textln 文档解析效果总结常扬老师在CCIG 2024大会上的演讲深入探讨了合合信息在文档解析技术方面的突破性进展。

    56221编辑于 2024-05-31
  • 合合信息智能图像处理技术,让你的设备更智能

    图像增强技术主要包括以下几个方面:切边增强:通过增强图像中的边缘信息来提高图像的清晰度和对比度,突出显示图像中物体的边缘轮廓,使其更加清晰鲜明,从而改善图像的质量和可视效果。 锐化:通过突出显示图像中的边缘和细节信息,增强图像的对比度和清晰度,使图像更加清晰和逼真。常见的锐化方法包括拉普拉斯变换、边缘增强滤波器等。

    37810编辑于 2024-12-04
  • 来自专栏学习

    合合信息助力打造全能工具箱

    而在众多OCR技术服务商中,合合信息 凭借其深厚的技术积累和成熟的应用生态,成为众多企业优先选择的对象。 产品介绍 合合信息提供了一系列高精度的智能文字识别及文档处理解决方案,广泛应用于各行各业,帮助企业和机构在数字化转型过程中提升信息处理效率、优化工作流程、加强数据管理。 我们这里拿几个常见的功能进行演示下: 通用文档解析 合合信息的通用文档解析支持多达数百种文档格式,覆盖常见办公文档(如 Word、Excel 等 )、各类报告、表单等,适配性广,满足多场景文档处理需求 总结 基于合合信息开发的这款 TextIn 多功能工具箱,亲测太香啦!不管是日常办公的格式转换、文档解析,还是图片去水印等需求,它都能稳稳拿捏 。 而且背靠合合信息,功能扩展性超强,感觉后续集成更多实用能力后,完全能成为效率神器,不管是打工人搞文档,还是搞点小项目折腾图片,有它帮忙都能轻松不少,强烈推荐试试!

    28010编辑于 2025-07-20
  • 来自专栏通用文字识别信息技术白皮书

    合合信息新推出反光消除技术,助力手写文字识别更精准

    近期,合合信息旗下扫描全能王推出液晶手写板(简称“手写板”),为用户带来仿真、流畅的书写绘画体验,一同发布的还有扫描全能王APP的新功能“拍手写板”。 保留手写质感,AI助力“无伤”去反光随着手机、相机等数码产品的普及,数字图像成为人们生活中重要的信息载体之一,反光则是数字图像中常见的干扰因素。 合合信息是一家人工智能及大数据科技公司,在智能文字识别、智能图像处理技术研发应用上有着十余年深耕经验。 公司技术人员提到,反光通常会不同程度地盖住一些画面上的信息,所以处理过程中需要尽量保留图像的原始细节,避免因消除反光导致图像质量下降。 合合信息反光消除技术能够根据手写板笔迹的风格进行特征提取,并对手写文字进行特征编码,助力文档图像中反光区域文字的提取。

    1.2K20编辑于 2023-04-26
  • 合合信息发布业内首个AI Agent跨平台云资源智能管理终端

    大会上,上海合合信息科技股份有限公司(以下简称“合合信息”)发布了业内首个AI Agent跨平台云资源智能管理终端Chaterm,通过打造“对话式终端管理工具”,帮助云计算从业人士实现云资源的智能化和规模化管理 以服务器为例,据合合信息技术团队人员介绍,在工作中,一名程序员一天需要同时应对四五十台服务器,遇到体量较大的项目,有的程序员甚至要同时管理上千台服务器。 合合信息智能文档处理应用亮相峰会现场作为一家人工智能企业,合合信息始终坚持探索AI技术在不同领域的应用。 据合合信息现场工作人员介绍,企业每天生成的数据中,有大量的数据被锁定在PDF、PPTX和HTML等常用格式中,无法被有效利用。 未来,合合信息将持续聚焦核心技术突破,在智能文档处理等领域不断拓展AI智能应用边界,助力构建更加智能、高效的数字化生态。

    30210编辑于 2025-06-20
  • 来自专栏深度学习与python

    合合信息:基于 JuiceFS 构建统一存储,支撑 PB 级 AI 训练

    合合信息是一家专注于智能文字识别、图像处理、自然语言处理、知识图谱与大数据挖掘的科技公司,依托自主研发的 AI 与大数据技术,已在上交所科创板上市。 合合信息产品发展历程 随着 AI 训练平台规模持续扩展,公司积累了千亿级文件和百 PB 级数据,覆盖 NLP、CV 等多种任务类型,存储需求愈发复杂。 为应对这些挑战,合合信息引入 JuiceFS 构建统一的存储访问架构,并结合 BeeGFS 提供分布式缓存能力。 合合信息早期分布式文件存储架构 计算作业管理策略:解耦存储,提高 GPU 利用率 以下是我们在训练任务的 GPU 计算资源调度方面所做的一些工作。 关于作者 唐义凡, 合合信息运维部存储和数据库负责人

    21210编辑于 2025-07-20
  • 用AI“读懂”专业文档资料,合合信息助力出海企业规避侵权“陷阱”

    为了应对提交出口产品注册资料、制作海外项目竞标标书等场景,合合信息智能文档处理技术助力企业解析、翻译电子文档,推进出海项目进程。中企出海,应对合规审查是第一关。 合合信息文档解析技术是智能文档处理技术流程中的关键步骤,能够在还原版面的基础上,理解、抽取多语种文档内文字、表格、公式、图片等元素,为企业出海提升文档处理效率。 合合信息文档解析技术作为“全科优秀生”,支持一个接口解析PDF、Word(doc、docx)、常见图片(jpg、png、webp、tiff)、HTML 等多种文件格式,可一次性获取文字、表格、标题层级、 公式、手写字符、图片信息合合信息会继续挖掘智能文档处理技术在出海场景中的深度应用,帮助更多企业“扬帆远航”。

    27710编辑于 2024-12-02
  • 来自专栏通用文字识别信息技术白皮书

    合合信息瞄准“多模态”技术

    在《视言碰撞:语言模型与视觉生态协同论坛》上,合合信息图像算法研发总监郭丰俊博士就文档图像前沿技术热点话题进行了分享。 大会现场,郭丰俊对合合信息在AI图像安全方面的工作进行了分享。 针对图片生成式造假,合合信息基于空域与频域关系建模,利用多维度特征来分辨真实图片和生成式图片的细微差异,判断图片是否由AI生成。 今年8月,合合信息获得了文档分析与识别国际会议(ICDAR 2023)“文本篡改检测”赛道冠军。 合合信息技术团队提出的方案能够在保持低误检率的同时,准确识别并定位图片中文本的篡改行为,从而有效保障文本信息的真实性。相关方案已在银行、证券、保险多个场景中应用。

    58930编辑于 2023-10-17
  • 来自专栏通用文字识别信息技术白皮书

    合合信息“版面分析”实现新突破

    近期,人工智能及大数据科技企业合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技,助力使用者从各类复杂的图片文档中精准获取信息合合信息技术人员在采访中提到,得益于全卷积神经网络(FCN)和图神经网络(GNN) 的突破,文档版面分析的方法和性能得到了很大发展。 公司基于深度学习的方法,结合文本区域的几何坐标、视觉特征、文本语义等多种模态信息对文本阅读顺序进行预测,显著提升分类结果。 同时,合合信息表格结构解析方法在逻辑版面分析中也发挥了重要作用,主要包括自上而下的方法、自下而上的方法以及端到端图像到标记的方法等。 版面分析是实现文档信息数字化的重要能力,解决了版面分析的痛点,有助于各界用户将图像文档以数字化的手段更精准地转化为文档数据,提升工作效率。

    2.1K20编辑于 2023-04-14
  • 亮相CCIG2024,合合信息文档解析技术破解大模型语料“饥荒”难题

    大会期间,由CSIG文档图像分析与识别专委会与上海合合信息科技股份有限公司(简称“合合信息”)联合主办了《大模型技术及其前沿应用》论坛,来自华南理工大学、上海交通大学、清华大学、复旦大学、上海人工智能实验室 、合合信息等高校、研究机构及企业的专家代表就大模型技术在图像领域的发展、应用进行了深入研讨。 论坛上,合合信息智能创新事业部研发总监常扬分享了合合信息智能文档处理技术在文档解析领域的工作,给与会者带来了新的技术视角。 通过十几年技术积淀,合合信息打通了电子档解析、扫描档图像处理、文字识别、表格识别、版面分析、版面还原和排版布局等文档智能化处理的全流程,面对电子文档及扫描件,能够灵活地识别文字、表格、无线表、跨页表格、 常扬表示,近年来的开放词汇目标检测(OVD),视觉语义对齐(Alignment)等工作,以及生成式模型等前沿进展,将给版面分析带来新的研究思路,合合信息技术团队也将持续在智能文档处理领域深耕,让新技术在行业中更快速地产生价值

    27721编辑于 2024-05-29
  • 来自专栏AI人工智能

    技术引领场景革新|合合信息PRCV论坛聚焦多模态文本智能前沿实践

    技术引领场景革新|合合信息PRCV论坛聚焦多模态文本智能前沿实践1. 教育知识库构建:合合信息与赛尔教育合作,将 TextIn 应用于教育大模型的知识库建设。 合合信息合合信息(INTSIG)致力于成为全球多模态大模型文本智能技术的领先者,以“文本”为核心枢纽,推动人工智能从感知走向认知与决策。 依托这一坚实的技术体系,合合信息已实现从工具型产品到智能基础设施的跃迁。 为了解决这个难题,合合信息推出了“翻页自动拍”技术。

    31710编辑于 2025-10-24
  • 来自专栏通用文字识别信息技术白皮书

    中国信通院携手合合信息开启《文档图像篡改检测标准》制定工作

    文档图像是信息的重要载体,却经常被不法分子利用软件、算法进行篡改。这些虚假材料往往被用于散播谣言、经济诈骗、编造虚假新闻,给个人、社会造成了恶劣的影响。 该项标准由中国信通院牵头,上海合合信息科技股份有限公司、中国图象图形学学会、中国科学技术大学等科技创新企业及知名学术机构联合编制。 在图像内容安全领域,已有部分企业展开了前沿探索,利用科技手段对篡改文本图像实行真伪判定、篡改痕迹检测,人工智能科技企业合合信息是其中的代表。 据悉,合合信息研发了基于深度学习的图像篡改检测技术及相关系统,可检测出多种篡改形式,智能捕捉图像在篡改过程中留下的细微痕迹,并以热力图的形式展示图像区域篡改地点,相关技术已被应用于银行、保险等行业中。 公开资料显示,合合信息专注于智能文档处理底层技术及应用产品的研究工作,相关技术在国际顶会ICPR、ICFHR等十余项竞赛中获得冠军,并于CVPR、AAAI、ACL、ACM MM等国际顶会上发表。

    39720编辑于 2023-06-15
  • 来自专栏通用文字识别信息技术白皮书

    合合信息对于文本纠错:提升OCR任务准确率的方法理解

    合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。 ,从而达到基于语义信息的文本纠错。 方案选择 对于文本纠错,合合信息的理解是:严格来说Beam Search只是对CTC解码的优化,存在着优化上限(Beam长度为文本长度,找到全局最优解),只有当与基于统计LM(n-gram)相结合时才有着一定的纠错能力 ,但往往是基于统计信息针对字词的纠错,对于语法和语义的纠错则能力有限。 至于要不要引入LM的先验信息,可以视具体OCR任务决定。

    1.2K40编辑于 2022-08-26
  • 来自专栏QQ大数据团队的专栏

    合合信息携手腾讯云升级智能决策平台,多业务场景查询效率提升45%

    近日,合合信息发布2025年第三季度财报,报告期内实现营收4.6亿元,同比增长27.49%,创上市以来单季度最高涨幅。亮眼表现的背后,是公司持续加大AI与数据智能领域的投入。 合合信息是国内领先的人工智能产品公司,长期专注于以AI技术创新服务全球用户,旗下拥有扫描全能王、名片全能王等知名产品,用户遍布200多个国家和地区,全球累计用户超过10亿。 今年在腾讯云的大数据能力支持下,合合信息对相关智能决策平台进行升级。 得益于TCHouse-C的存算分离架构,合合信息在应对业务高峰时能自动扩展算力,在低负载时自动收缩资源,既保证了性能稳定,又避免了资源浪费。 在大数据能力合作之外,合合信息还与腾讯云进行多项协同工作,加速智能化应用在产品与业务场景中的落地,为用户提供更高效、智能的服务体验。 Tencent BigDat

    30010编辑于 2025-12-01
  • 合合信息携手富士胶片商业创新(中国),AI让数码多功能机“读懂”文档

    上海市人工智能协会副秘书长徐琦、ISC²上海峰会主席/上海交通大学网络空间安全学院施勇博士、上海合合信息科技股份有限公司智能解决方案事业部总经理李明受邀出席,共同探讨AI新浪潮下的业务转型之道。 尽管现有的设备能够高效实现文档电子化,扫描后的合同、票据等海量文档多以图片、复杂表格等非结构化数据形式存在,企业仍需投入大量人力进行信息提取和录入。 合合信息与富士胶片商业创新(中国)开展合作,借助智能文档处理技术赋能数码多功能机等办公硬件设备,为客户提供从文档扫描、信息抽取到业务洞察的智能化服务。 在AI技术的加持下,合合信息TextIn DocFlow文档自动化处理平台可将扫描后的纸质文档转化为结构化业务数据。 合合信息智能解决方案事业部总经理李明表示,在大模型时代,AI已从“效率工具”升级为企业的“系统性生产力引擎”,富士胶片商业创新“数字工作流”解决方案整合智能文档抽取技术,正是AI驱动产业转型的落地实践。

    23210编辑于 2025-08-21
  • 探访WAIC2025:当AI成为双刃剑,合合信息如何破解真假难题

    随着AI技术的不断发展,各种安全问题例如AI生成伪造和造假接踵而至,在众多展台中,合合信息的AI安全展区格外引人注目。 正是带着这样的思考,我来到了合合信息的展台。添加图片注释,不超过 140 字(可选)3.技术发展的必然选择:以技术制衡技术在合合信息展区,我了解到:合合信息早在最开始主要针对传统的PS篡改。 添加图片注释,不超过 140 字(可选) 但更让我惊叹的是合合信息AI人脸鉴伪系统的表现。 在与合合信息技术负责人的交流中,我了解到他们的目标不是赢得一场技术竞赛,而是帮助构建一个更加可信的数字环境,让人们能够安心地享受技术带来的便利,而不用担心被虚假信息欺骗。 当AI生成技术越来越强大时,我们确实需要像合合信息这样的公司,用技术的力量来守护技术本身。

    35910编辑于 2025-08-06
  • 合合信息智能审核白皮书上线,AI破解审核业务“数据孤岛”难题

    近期,合合信息发布了智能审核白皮书,聚焦金融、财务、供应链管理等典型场景,打造AI智能审核方案,帮助企业提高复杂场景下的文档审核效率。 为了解决这些“绊脚石”,合合信息技术团队在白皮书中总结出了智能审核全景架构,为行业提供标准化、可落地的审核模式。 针对审核流程效率低下和审核材料版式复杂两大核心痛点,合合信息总结出了丰富的实战经验,根据不同行业的需求打造个性化解决方案。 例如,在财务场景,合合信息AI智能审核系统深度嵌入业务流程,支持OA系统、费控系统、ERP系统等多系统对接,实现财务审核全流程自动化。 未来,合合信息也将持续探索AI能力在文档解析、抽取、审核等多个复杂场景中的应用,助力文档处理全流程智能化升级。

    32710编辑于 2025-08-08
  • 合合信息首批通过中国信通院文档图像篡改检测平台能力完备性测评

    在中国信通院最新开展的文档图像篡改检测平台能力完备性测评中,合合信息旗下TextIn通用篡改检测平台首批通过测试,体现了公司在图像篡改检测技术领域的领先水平。 据合合信息技术团队人员介绍,合合信息自研的篡改检测系统融合先进的图像处理技术与深度学习算法,能够高效、准确地识别各类凭证图像中的篡改行为,包括身份证、行驶证、驾驶证、银行卡、护照、中国港澳台通行证、商场小票等 此前,合合信息在图像安全领域的技术积累多次获得了行业认可,于2024全球AI攻防挑战赛金融场景赛道,2023ICDAR文档图像篡改检测赛道等多项国际竞赛中获得冠军。 AI技术发展日新月异,面对大模型等前沿技术带来的安全挑战,合合信息将持续优化图像篡改检测技术在多场景的应用,推动技术能力向规范化、普适化延伸。

    20810编辑于 2025-05-30
  • 来自专栏通用文字识别信息技术白皮书

    合合信息图像篡改检测技术构建图像安全“防火墙”

    近期,合合信息推出智能开户解决方案,在智能图像处理技术的支持下,帮助银行、证券业等金融机构解决人工审核时间成本高、材料伪造识别难、采集图像质量差等痛点,提升业务自动化处理效率,降低电信网络诈骗风险。 “帮信罪”被起诉人数位列排名前三,AI帮助金融机构防范风险“帮信罪”全称为“帮助信息网络犯罪活动罪”,是指明知他人利用信息网络实施犯罪,依然为其犯罪提供互联网接入、广告推广、支付结算等帮助的犯罪行为。 “帮信罪”的犯罪嫌疑人多为低学历、低收入、低年龄群体,因缺乏法律知识和个人身份信息保护意识,沦落为电信网络犯罪的重要“帮凶”。 据悉,合合信息研发了基于深度学习的图像篡改检测技术及相关系统,通过学习图像被篡改后统计特征的变化,智能捕捉图像在篡改过程中留下的细微痕迹,可检测出复制粘贴、拼接、擦除等多种篡改形式。 此外,合合信息智能图像处理技术可通过助力图像“质检”,对翻拍、模糊、曝光过强、黑白等场景图像进行识别检测。

    50820编辑于 2023-05-11
  • 合合信息旗下启信宝获首批授权,公开展示上海市数据产品知识产权登记信息

    值上海数据产品知识产权登记试点一周年之际,上海市知识产权局加大数据产品知识产权信息的公开力度,推动数据产品知识产权保护与社会化应用。 近日,合合信息旗下启信宝正式接入由上海市知识产权局官方授权的“数据产品知识产权”数据,成为首批获权对外公开展示数据产品知识产权信息的企业平台。此举获央视新闻等权威媒体关注报道。 接入启信宝后,“数据产品知识产权”数据将与平台展示的其他维度信息,例如工商、司法、产业链等实现有机融合,构建更为立体的企业画像,为用户投资决策、商业合作、风险管控等场景提供更全面的数据支撑。

    16010编辑于 2025-12-22
领券