我现在将使用PoDoFo来解析pdofo。我在这里获得了源代码pdofo-tools podofotxtextract:podofotxtextract文件TextExtractor.cpp。我会修改这个代码来获取文本坐标,在阅读了这篇文章后:PoDoFo extract text并阅读了Adobe规范,为了检索我需要的联系信息,我需要使用操作符Tm,这个操作符是矩阵。因此,我在源代码中添加了一个新案例,如下所示
... other case in if( bTextBlock ) ....
else if( strcmp( pszToken, "Tm" ) == 0 )
{
std::cout << "I have matrix here Tm " << std::endl;
}
....这段代码可以工作,但我不知道如何显示矩阵的值。Adobe指定:

如果有人能帮我的话
发布于 2020-01-05 07:54:12
我推荐你读一下Ryan Hodson写的“简明扼要的PDF”(先用谷歌搜索一下)和Acrobat (类似的问题中也有) https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/pdf_reference_archives/PDFReference.pdf
首先,你误解了pdf是如何“编码”的。Podofo将为您提供变体和标记。您应该堆叠变体,并在找到令牌后处理它们(除了少数情况下,令牌打开或关闭一个块,它不会有任何变体)。
当你到达Tm标记时,你应该有6个变种,这将与你粘贴的矩阵的位置相对应。
https://stackoverflow.com/questions/39246260
复制相似问题