首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >检查PDF文件是否被Ruby破坏?

检查PDF文件是否被Ruby破坏?
EN

Stack Overflow用户
提问于 2018-12-09 23:09:29
回答 3查看 758关注 0票数 0

理想情况下,我希望避免使用gems,就像我目前使用的那样:pdf-readercombine-pdforigami

每个宝石,如果它遇到一个损坏的pdf有时不会发送一个例外,但停留在那里,什么也不做。

因此,我想请您帮助我的代码,看看文件是否损坏。

我注意到一些pdf文件没有十六进制的(hex 25 50 44 46 | %PDF),但恐怕它不是一个通用的解决方案。

除了所有这些宝石有时抛出异常时,即使pdf确实工作,但至少如果我确定pdf工作,我会知道该做什么。

我可以从那里开始。我怎么看红宝石的十六进制?是检查pdf的唯一方法吗?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2018-12-10 01:49:05

代码语言:javascript
复制
result = IO.binread('file.pdf', 4).unpack("H*").first
valid_pdf = result == '25504446'

将对前4个字节进行比较。

票数 0
EN

Stack Overflow用户

发布于 2018-12-09 23:46:43

我以前在用ruby验证grub引导程序时遇到过这种情况。我发现最简单的解决办法是预先检查我知道应该存在的巫术。与此类似的东西:

代码语言:javascript
复制
result = `hexdump pdf_file.pdf | head -n 1`
valid_pdf = result.split(" ")[1..2] == ["2550", "4446"]

随着时间的推移,您可以展开您的检查,以寻找其他坏的pdfs提前。

一个好的做法,以规避您的pdf挂起锁,是使用 functionality in ruby的方式,您可以正确退出,而不必强制关闭您的程序。

票数 2
EN

Stack Overflow用户

发布于 2022-06-07 13:15:22

代码语言:javascript
复制
File.read(pdf_filepath, 4) == "%PDF"
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53697619

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档