首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PDF阅读器红宝石横向页面

PDF阅读器红宝石横向页面
EN

Stack Overflow用户
提问于 2014-07-11 13:57:38
回答 1查看 602关注 0票数 2

我正在尝试使用pdf阅读器ruby gem (https://github.com/yob/pdf-reader/)将Pdf转换为纯文本。

它可以很好地处理页面方向为纵向的页面,但不适用于页面方向为横向的页面

当我尝试将景观页面转换为纯文本时,其读取内容的顺序是随机的,并且我也丢失了一些纯文本的数据

景观页面的属性如下

代码语言:javascript
复制
{:Parent=>#<PDF::Reader::Reference:0x000000062d4e60 @id=11481, @gen=0>, :Type=>:Page, :Resources=>{:Font=>{:Fcpdf0=>#<PDF::Reader::Reference:0x000000062cfc80 @id=8585, @gen=0>, :Fcpdf2=>#<PDF::Reader::Reference:0x000000062cef10 @id=8588, @gen=0>, :Fcpdf3=>#<PDF::Reader::Reference:0x000000062cec18 @id=8590, @gen=0>}, :ProcSet=>#<PDF::Reader::Reference:0x000000062cdca0 @id=4, @gen=0>}, :MediaBox=>[0, 0, 595.276, 841.89], :CropBox=>nil, :Rotate=>90, :Contents=>[#<PDF::Reader::Reference:0x000000062c6c70 @id=15, @gen=0>, #<PDF::Reader::Reference:0x000000062c6a18 @id=16, @gen=0>]} 

画像页面的属性如下

代码语言:javascript
复制
{:Parent=>#<PDF::Reader::Reference:0x000000062fadb8 @id=11481, @gen=0>, :Type=>:Page, :Resources=>{:Font=>{:Fcpdf0=>#<PDF::Reader::Reference:0x000000062f9be8 @id=8585, @gen=0>, :Fcpdf2=>#<PDF::Reader::Reference:0x000000062f8c48 @id=8588, @gen=0>, :Fcpdf1=>#<PDF::Reader::Reference:0x000000062f8748 @id=8587, @gen=0>, :Fcpdf4=>#<PDF::Reader::Reference:0x000000062f3b30 @id=8592, @gen=0>}, :ProcSet=>#<PDF::Reader::Reference:0x000000062f3630 @id=4, @gen=0>}, :MediaBox=>[0, 0, 594, 792], :CropBox=>[0, 0, 594, 792], :Rotate=>0, :Contents=>[#<PDF::Reader::Reference:0x000000062f05e8 @id=9, @gen=0>, #<PDF::Reader::Reference:0x000000062f02c8 @id=10, @gen=0>]} 

我将pdf阅读为:

代码语言:javascript
复制
reader = PDF::Reader.new("sample.pdf")

page = reader.pages[page_no]

puts page.text

所以有没有人能帮我把横向页面转换成纯文本。

EN

回答 1

Stack Overflow用户

发布于 2014-07-11 14:07:55

尝试设置orientation

代码语言:javascript
复制
reader = PDF::Reader.new("sample.pdf",{:orientation => :landscape}) 
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24690924

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档