我有大约6000份pdf格式的文档,它们有一个不同的结构,但它们都包含相同的日期和代码(不同的结构--我的意思是,这些值的位置在每个文档中都会发生变化),我正在使用文档IA来提取所有信息,但是我想知道是否有可能只提取我需要的字段。文件IA工作台是最好的选择吗?
发布于 2022-11-11 17:21:10
您是说创建自定义文档提取器吗?您可以在文档AI中这样做,请访问此功能链接。
Tldr;您必须在Document的工作台上完成此操作,并培训您自己的提取器(上传文件并训练处理器提取指定的数据),以完成有关此功能的步骤,我建议访问此文档以了解有关此特性的详细步骤。
此外,请注意,该功能目前正处于预览阶段。预览产品通常是公开宣布的,但不一定是功能完整的,也没有为这些产品提供SLA或技术支持承诺。
https://stackoverflow.com/questions/74404234
相似问题