例如,以英尺和英寸为例:我怎么能把其中的一个元素分解成这样的东西:
"the person is 5 feet 11 inches tall."feet {} inches tall.".format(list[1], list[1]) #I am aware taking the same index of list will give me 5-
我的PDF文件包含一个相当复杂的表,这使得大多数工具不够。例如,我尝试使用以下工具,但它们没有很好地提取它:AWS Textract、Google AI Document、Google Vision、Microsoft Text Recognition。实际上,Google AI Document成功地做了大约70%的正确,但它还不够好。
因此,我寻找了一种自定义火车模型的方法,以便在提取这个表时,它会正确地提取它。我想知道哪些工具适合我的用例,如果有任何(AI)工具,