我是C#的一个新开发人员。我在开发一些应用程序时遇到了一个问题。
我必须开发一个“应用程序”,打开扫描文档(任何申请表格或银行支票),将文档的所需数据保存到数据库,例如.支票号码,在学校申请表上的支票或学生姓名,学籍等扫描副本中的帐号。。
我有了和像素一起工作的想法。
请提供有关的解决办法。
我使用.Net Framework3.5和C#语言
关于瓦伦·杜塔
发布于 2010-10-20 11:53:43
为了将文档保存到数据库中,有两种思想流派。
我写了一些博客文章,详细介绍了每种方法的优缺点:
http://www.atalasoft.com/cs/blogs/loufranco/archive/2007/12/03/images-in-databases-part-i-what-to-store.aspx
http://www.atalasoft.com/cs/blogs/loufranco/archive/2007/12/04/images-in-databases-part-ii-web-images-are-random-access.aspx
http://www.atalasoft.com/cs/blogs/loufranco/archive/2009/04/28/document-storage-database-blobs-or-the-filesystem.aspx
归根结底是方便(blobs)与性能(文件系统) --文件越大,您就越喜欢使用文件系统。如果您使用的是当前版本的Server,那么就会有一个文件系统字段类型,您将为您提供方便--这是这两个世界中最好的,但不是标准的。
至于从图像中获取信息,您需要OCR。最好的开源OCR是谷歌的Tesseract。
如果你想看看商业选择,我的公司,Atalasoft,销售OCR引擎,我们有一个Tesseract的.NET包装。
发布于 2010-10-20 11:50:29
要使用OCR从图片中检索数据,Office中有一个OCR组件,您可以使用它,如本文所示:在C#中使用Office 2007 OCR组件
否则,就会有一个关于库的问题:有开源的C# OCR库吗?。
检索完数据后,只需使用适合您的需求的类(SqlConnection或类似类)将其插入数据库。
https://stackoverflow.com/questions/3977395
复制相似问题