首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >表单设计最佳实践

表单设计最佳实践
EN

Stack Overflow用户
提问于 2022-03-22 15:54:22
回答 2查看 315关注 0票数 0

目前,我正在重新设计文档和表单,以提高使用Aws the提取的易用性。

你有经验和最佳实践可以分享吗?

问候

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-04-29 09:14:43

以下是指南中推荐的一些最佳实践,以便实现提供最佳输入文档

下面列出了几种可以优化输入文档以获得更好结果的方法。

  • 确保您的文档文本使用Amazon支持的语言。目前,亚马逊公司支持英语、西班牙语、德语、意大利语、法语和葡萄牙语。
  • 提供高质量的图像,最好至少有150个新闻部。
  • 如果您的文档已经是Amazon支持的文件格式之一(PDF、TIFF、JPEG和PNG),那么在将文档上传到Amazon之前,不要转换或降级文档。

为了在从文件中的表格中提取文本时取得最佳结果,请确保:

  • 文档中的表在视觉上与页面上的周围元素分开。例如,表没有覆盖在图像或复杂的模式上。
  • 桌子上的文字是笔直的。例如,相对于页面上的其他文本,文本不会被旋转。从表中提取文本时,可能会在以下情况下看到不一致的结果:
  • 跨多列的合并表单元格。
  • 具有与同一表其他部分不同的单元格、行或列的表。

我强烈建议你看一看开发者指南。

票数 0
EN

Stack Overflow用户

发布于 2022-04-23 10:31:02

AWS技术是利用机器学习算法从表单和表中提取数据。总的来说,它们没有提供任何可遵循的良好做法。他们的想法是,不管格式如何,他们都可以提取数据。

我的建议是做一些手工测试。只需查看当前窗体或文档使用的最常见问题是什么。检查数据是否丢失,不一致,或只是错误地检测到,并试图解决该位置。然后对新表单重复相同的过程,看看是否有改进。

提高提取精度是你唯一的目标吗?如果是这样的话,那么您可能已经知道存在的问题了。利用这些知识。

在这种情况下,知道哪个地方得到了改进将是非常有帮助的。

对提供更好的答案也有帮助的是,我们谈论的是什么类型的文件。以及你使用的是什么框架/生成器。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71575124

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档