首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在R中将PDF文件转换为Excel

在R中将PDF文件转换为Excel
EN

Stack Overflow用户
提问于 2019-09-04 20:19:26
回答 1查看 451关注 0票数 0

我想转换一个pdf (这是2页)到excel。pdf由公司资产负债表和损益表两个表组成。现在我得到了这个在线代码(在R中),它工作得很好,但从2页来看,它只转换了第2页,而不是第一页。我到处搜索,我也尝试了不同的解决方案,但都不起作用。由于有很多这样的文件,在线转换工具也太昂贵了。有没有人能帮我。如果它可以一次转换两个页面,那就太好了。

代码语言:javascript
复制
library("pdftools")
tx1<-pdf_text("C:/Users/Snehal Salaskar/Desktop/Companies/CanFin/2013-14.pdf")
tx3<-strsplit(tx1,"\n")
lapply(tx3, function(x) write.table( data.frame(x), 'Profit.csv'  , sep=',' ))

我想让它一次转换所有的2页

EN

回答 1

Stack Overflow用户

发布于 2019-09-05 15:19:35

我已经看过pdf了,它看起来需要做相当多的工作才能将它格式化成一个漂亮的表格。如果您只是想将输出捕获到一个文件中,那么问题是您以相同的文件名保存了两次

你可以保存到两个文件,或者使用append=TRUE将它们都保存到一个文件,例如

代码语言:javascript
复制
# save to two files
lapply(seq_along(tx3), function(i){
  write.table( data.frame(tx3[[i]]), sprintf('Profit_%s.csv', i), sep=',' )
}) 

# save to single file with append=TRUE adding on the data
lapply(seq_along(tx3), function(i){
  write.table( data.frame(tx3[[i]]), sprintf('Profit.csv', i), sep=',' ,
               append = TRUE)
}) 

lapply中的对象本身相比,我更喜欢将索引与seq_along一起使用,因为它会给我一个标识符号和一个对象,以添加到文件名中

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57788282

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档