我对FormRecognizer有一个问题,它的行为不符合我应该看到的。这里是进退两难的地方
我有一张发票,当它通过https://{endpoint}/formrecognizer/v2.0/layout/analyze运行时,它可以识别发票中的表,并使用"tables“节点生成适当的JSON。以下是其中的一部分示例
{
"rows": 8,
"columns": 8,
"cells": [
{
"rowIndex": 0,
"columnIndex": 4,
"columnSpan": 3,
"text": "% 123 F STREET Deer Park TX 71536",
"boundingBox": [
3.11,
2.0733
],
"elements": [
"#/readResults/0/lines/20/words/0",
"#/readResults/0/lines/20/words/1"
]
}当我训练一个没有标签文件https://{endpoint}/formrecognizer/v2.0/custom/models的模型时,它不会生成一个空的"tables“节点,但它会生成(tokens)。下面是上面没有"table“的例子。
{
"key": {
"text": "__Tokens__12",
"boundingBox": null,
"elements": null
},
"value": {
"text": "123 F STREET",
"boundingBox": [
5.3778,
2.0625,
6.8056,
2.0625,
6.8056,
2.2014,
5.3778,
2.2014
],
"elements": null
},
"confidence": 1.0
}我不确定这到底是怎么回事,但任何洞察力都将不胜感激!
发布于 2020-07-14 08:33:03
如果您使用标签文件训练一个模型,然后调用FR Analyze(),FR服务将调用布局服务,后者返回"pageResults“部分中的表。
https://stackoverflow.com/questions/62839018
复制相似问题