我试图使用Pdf2Image将一个PDF文件转换为图像,但我得到了以下错误消息:
*未标识的image :无法在<_io.BytesIO上标识图像文件0x7f241957a950>*对象
当我昨天在同一个笔记本和相同的代码上工作时,一切都很好。
我已经查过了类似的问题,但似乎没有解决办法来解决我的问题。
有人能回答这个问题吗?
以下是代码:
from pdf2image import convert_from_bytes
file = "/content/example.pdf"
images = convert_from_bytes(open(file, 'rb').read(), size=800, dpi=800)我已经尝试过!sudo apt-get update,或者和convert_from_path一起工作
还通过!apt-get install poppler-utils安装了poppler。
如果有帮助的话,这就是我正在做的完整的笔记本。
我已经发现,如果我只运行!sudo apt-get update、!apt-get install poppler-utils和!pip install pdf2image,代码将完美运行。它可能与安装其他工具有关,如tesseract、PyPdf2、.
发布于 2022-10-18 12:10:12
问题好像是枕头。
Tesseract正在研究枕头v.9.2.0,而pdf2image只在使用枕头v.7.2.0。
在所有pip安装之后添加!pip install -I pillow==7.2.0之后,一切似乎都进行得很好。
也许这不是最好的解决方案,但它现在对我有效,也许有人知道更好的解决方案。
https://stackoverflow.com/questions/74108875
复制相似问题