我们的组织正在将我们的日常工作迁移到Azure Cloud平台上。我的工作之一是使用Python读取许多pdf文件,并将所有文本/非结构化数据转换为表,例如,第一列显示文件名,第二列保存所有文本数据等。
只是想知道Azure平台中是否有一项服务可以自动实现这一点?我是Azure的新用户,所以对此不太熟悉。如果有什么帮助的话,谢谢。
发布于 2022-08-24 01:52:47
我建议你看看Azure型识别器。您可以训练它识别表并从PDF文件中提取数据。
https://stackoverflow.com/questions/73465616
复制相似问题