首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >玩转OCR | 腾讯云智能结构化识别-公式识别(理科老师神器)

玩转OCR | 腾讯云智能结构化识别-公式识别(理科老师神器)

原创
作者头像
红目香薰
发布2025-01-05 18:07:19
发布2025-01-05 18:07:19
9600
举报

很好的工具哦,先开通,在去测测。

看看,我看到了什么,咱们赠送50~1000次的免费额度,我们可以充分的做一下测试。

我再功能包里面找到了这个。

接下来我们先去测试啊。

要识别的单据证照、不限定版式,智能结构化全搞定

这个大标题看着就很厉害,所以我们进来具体的测试一下。

测试地址:https://ocrdemo.cloud.tencent.com/?from_column=20421&from=20421

测试内容

测试1:智能结构化

这里是测试页的第一个内容,智能机构化可以对本文图片进行识别,识别的内容我看了一下都是正确的,虽然可能出现有一些自定义的类名对不上,但是这还是比较正常的,自己改一下就OK,还是非常方便的。

测试2:大模型知识引擎

这里识别也都是正确的,我先测试了一下基础识别,接下来我在做一个复杂的识别。

复杂识别中我们可以看到其不仅仅可以对复杂的且文字大小较小的内容进行完整的识别,在表格识别上也做到了100%的还原,真的是相当厉害了。

测试3:类型识别

这里在测试文档中给了很多个测试内容,我这里也都是逐一的测试了一下,可以看到给出了图片类别分析还是很可以的。

商户门头照是完美的识别出来了,那么其它的理论上也都是可以读取的,不过在测试demo中并没有其它的照片类型识别。下面有一个警告的识别,例如你的银行卡照片一般是不允许照相存储的,表征上要体现安全。

对图片文字内容进行识别,这个相对来说应该复杂度小一些,如果是手写的压力肯定也就大了。

我用学生的笔记测试了一下,也还是不错的,有些许符号的问题,对于符号的处理能力上比较弱,这里是需要加强一些,识别换行上比较模糊。

英文识别肯定是最容易的,毕竟笔顺不复杂。

测试4:医疗票据

这里的医疗票据识别我是非常感兴趣的,毕竟老中医开的药房要是能识别出来那就真厉害了。我先测试了一下机器开的单子,后面又上传了一个人写的药方。

很明显,完全无法匹配,说明我们自己的笔记加密的手法还是可以的,机器很难进行识别。

测试5、文本图像增强

这个增强可以理解成对图片的主体进行识别,并且进行全屏放大。效果还是不错的,不仅仅是识别了,而且的自动调整了角度,让内容可以正向的让我们看到。

测试6、教育场景

这里分为了3个场景,数学公式、试题识别、试卷切题,其中的数学公式我觉得是一个大大的神器,我们可以先来看看。

数学神器

直接识别数学公式,并且可以转换成公式代码。

有了代码,我们拿出来用就很方便了。

代码语言:txt
复制
<math xmlns="http://www.w3.org/1998/Math/MathML" display="block">
  <mtable displaystyle="true" columnalign="right left" columnspacing="0em" rowspacing="3pt">
    <mtr>
      <mtd></mtd>
      <mtd>
        <mi></mi>
        <mo stretchy="false">(</mo>
        <mn>2</mn>
        <mo stretchy="false">)</mo>
        <mtext>&#x8BBE;</mtext>
        <mrow data-mjx-texclass="INNER">
          <mo data-mjx-texclass="OPEN">(</mo>
          <mtable columnalign="center" columnspacing="1em" rowspacing="4pt">
            <mtr>
              <mtd>
                <mn>1</mn>
              </mtd>
              <mtd>
                <mn>2</mn>
              </mtd>
            </mtr>
            <mtr>
              <mtd>
                <mn>0</mn>
              </mtd>
              <mtd>
                <mn>3</mn>
              </mtd>
            </mtr>
          </mtable>
          <mo data-mjx-texclass="CLOSE">)</mo>
        </mrow>
        <mi>X</mi>
        <mo>+</mo>
        <mrow data-mjx-texclass="INNER">
          <mo data-mjx-texclass="OPEN">(</mo>
          <mtable columnalign="center" columnspacing="1em" rowspacing="4pt">
            <mtr>
              <mtd>
                <mn>2</mn>
              </mtd>
              <mtd>
                <mn>5</mn>
              </mtd>
            </mtr>
            <mtr>
              <mtd>
                <mn>0</mn>
              </mtd>
              <mtd>
                <mn>3</mn>
              </mtd>
            </mtr>
          </mtable>
          <mo data-mjx-texclass="CLOSE">)</mo>
        </mrow>
        <mo>=</mo>
        <mn>12</mn>
        <mrow data-mjx-texclass="INNER">
          <mo data-mjx-texclass="OPEN">(</mo>
          <mtable columnalign="center" columnspacing="1em" rowspacing="4pt">
            <mtr>
              <mtd>
                <mn>1</mn>
              </mtd>
              <mtd>
                <mn>1</mn>
              </mtd>
            </mtr>
            <mtr>
              <mtd>

效果:

这不就有了,而且很清晰。

试卷切题

这里对老师们是相当的友好,组题的时候有一些题题库里面是没有的,之前用过很多工具,都不能很顺利的获取出正确的结果,使用腾讯OCR效果非常棒的。

总结

整体的我这里是都测试了,虽然没有在文章中全部提现,但是我自己是感受了一遍,有了数学公式识别,在教学的时候是非常方便的,很多时候自己搞了个好题,学习题库里没有,还不想单独分享出去,那就能用这个识别出来,根据代码来生成图片就很方便, 毕竟每次写公式都想吐,下面的图片熟悉吧,是不是非常不愿意看到它呢。

如果你不想继续那么烦躁,就来尝试一下这个数学公式识别的神器吧。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 要识别的单据证照、不限定版式,智能结构化全搞定
  • 测试内容
    • 测试1:智能结构化
    • 测试2:大模型知识引擎
    • 测试3:类型识别
    • 测试4:医疗票据
    • 测试5、文本图像增强
    • 测试6、教育场景
      • 数学神器
      • 试卷切题
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档