目前,我正在重新设计文档和表单,以提高使用Aws the提取的易用性。
你有经验和最佳实践可以分享吗?
问候
发布于 2022-04-29 09:14:43
以下是指南中推荐的一些最佳实践,以便实现提供最佳输入文档:
下面列出了几种可以优化输入文档以获得更好结果的方法。
为了在从文件中的表格中提取文本时取得最佳结果,请确保:
我强烈建议你看一看开发者指南。
发布于 2022-04-23 10:31:02
AWS技术是利用机器学习算法从表单和表中提取数据。总的来说,它们没有提供任何可遵循的良好做法。他们的想法是,不管格式如何,他们都可以提取数据。
我的建议是做一些手工测试。只需查看当前窗体或文档使用的最常见问题是什么。检查数据是否丢失,不一致,或只是错误地检测到,并试图解决该位置。然后对新表单重复相同的过程,看看是否有改进。
提高提取精度是你唯一的目标吗?如果是这样的话,那么您可能已经知道存在的问题了。利用这些知识。
在这种情况下,知道哪个地方得到了改进将是非常有帮助的。
对提供更好的答案也有帮助的是,我们谈论的是什么类型的文件。以及你使用的是什么框架/生成器。
https://stackoverflow.com/questions/71575124
复制相似问题