理想情况下,我希望避免使用gems,就像我目前使用的那样:pdf-reader、combine-pdf和origami
每个宝石,如果它遇到一个损坏的pdf有时不会发送一个例外,但停留在那里,什么也不做。
因此,我想请您帮助我的代码,看看文件是否损坏。
我注意到一些pdf文件没有十六进制的(hex 25 50 44 46 | %PDF),但恐怕它不是一个通用的解决方案。
除了所有这些宝石有时抛出异常时,即使pdf确实工作,但至少如果我确定pdf工作,我会知道该做什么。
我可以从那里开始。我怎么看红宝石的十六进制?是检查pdf的唯一方法吗?
发布于 2018-12-10 01:49:05
result = IO.binread('file.pdf', 4).unpack("H*").first
valid_pdf = result == '25504446'将对前4个字节进行比较。
发布于 2018-12-09 23:46:43
我以前在用ruby验证grub引导程序时遇到过这种情况。我发现最简单的解决办法是预先检查我知道应该存在的巫术。与此类似的东西:
result = `hexdump pdf_file.pdf | head -n 1`
valid_pdf = result.split(" ")[1..2] == ["2550", "4446"]随着时间的推移,您可以展开您的检查,以寻找其他坏的pdfs提前。
一个好的做法,以规避您的pdf挂起锁,是使用 functionality in ruby的方式,您可以正确退出,而不必强制关闭您的程序。
发布于 2022-06-07 13:15:22
File.read(pdf_filepath, 4) == "%PDF"https://stackoverflow.com/questions/53697619
复制相似问题