我试图将pdf转换成文本,als提取文本的颜色信息。
我试图在golang中这样做,但是使用我从golang调用的命令行工具是绝对可以接受的。
我找到了pdftotext来自poppler-utils,它几乎完美。只是,它没有给我颜色信息。
我尝试了github.com/ledongthuc/pdf,这也不给我颜色信息。
还有别的工具吗?我是不是错过了用pdftotext做这件事的方法?
发布于 2021-01-01 19:40:48
有一个名为C++ ( poppler,https://poppler.freedesktop.org)的库,它允许从PDF文件(包括颜色)中提取文本。
https://stackoverflow.com/questions/65481791
复制相似问题