首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >例如,文档识别和组织的基本机器算法从哪里开始?

例如,文档识别和组织的基本机器算法从哪里开始?
EN

Stack Overflow用户
提问于 2018-04-05 16:43:45
回答 1查看 40关注 0票数 2

如果这个问题不合适,请原谅。这是一种具体的,我不是要求实际的代码,而是更多的指导,这个任务是否值得承担。如果不是这里,请关闭问题,并请指出我的正确方向。

短背景:我一直对修补感兴趣。我年轻的时候经常玩分区和OS脚本,在我父亲禁止我使用电脑之前,我最终达到了基本的“通用编程”能力。我现在要去法学院,在一家律师事务所工作,但我热爱发展,我想在这一领域实现更多的技术创新。

要点:在我公司,从三月中旬到四月的第一周,我们每年都有一个繁忙的季节(移民+ H1B截止日期)。我们收到了大量的文件和扫描文件,需要进行验证、组织和检查。

我向我们的在线平台添加了(非常)简单的代码行,以帮助组织工作;基本上,我将标签附加到所有传入的文档中,一旦它们被验证,代码就会按照标记来组织它们(比如“标识文档”、“工作体验文档”等等)。这将使我的生活每年都要轻松得多,因为本赛季我将以每周工作100+小时结束。

我想更进一步,使用一种算法来检查文档之间的签名和数据不匹配,并最终组织文档以便它们可以打印。最后,我甚至想要实现机器学习和一个非常基本的神经网络来实现整个大脑麻木和痛苦过程的自动化。

实际问题:,我只是想知道最好的方式来继续或开始。我知道相当多的python和java,我们已经有了一个带有文档的在线平台。在书籍,视频,甚至课程方面,你还会推荐什么资源呢?有这种基本分类的名称吗?我能在没有高级学位的情况下通过我自己的努力来建造这样的东西吗?

愚蠢而夸张的尾声:告诉我真相,我觉得到目前为止我没有追求我在12岁时所爱的东西而浪费了我的生命。我想这是我弥补的方式,如果我能做到这一点,也许我可以在法律上和法律之外继续这样做.

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-04-05 16:54:55

你并没有给出很多关于这个任务的细节,但是如果你有有限数量的数字形式的表单作为图像,那么这似乎是非常有可能的。

我个人在Python中使用了OpenCV,在过去的10年中,更复杂的机器学习任务变得越来越简单。

例如,对象检测(例如12)检查签名字段中是否有任何内容,或尝试从图像(例如12)中提取数据。

我建议你从最简单的事情开始,这样才能改善你的工作。一个小而简单的任务会让你积累如何做事情的知识。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49677509

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档