我想转换一个pdf (这是2页)到excel。pdf由公司资产负债表和损益表两个表组成。现在我得到了这个在线代码(在R中),它工作得很好,但从2页来看,它只转换了第2页,而不是第一页。我到处搜索,我也尝试了不同的解决方案,但都不起作用。由于有很多这样的文件,在线转换工具也太昂贵了。有没有人能帮我。如果它可以一次转换两个页面,那就太好了。
library("pdftools")
tx1<-pdf_text("C:/Users/Snehal Salaskar/Desktop/Companies/CanFin/2013-14.pdf")
tx3<-strsplit(tx1,"\n")
lapply(tx3, function(x) write.table( data.frame(x), 'Profit.csv' , sep=',' ))我想让它一次转换所有的2页
发布于 2019-09-05 15:19:35
我已经看过pdf了,它看起来需要做相当多的工作才能将它格式化成一个漂亮的表格。如果您只是想将输出捕获到一个文件中,那么问题是您以相同的文件名保存了两次
你可以保存到两个文件,或者使用append=TRUE将它们都保存到一个文件,例如
# save to two files
lapply(seq_along(tx3), function(i){
write.table( data.frame(tx3[[i]]), sprintf('Profit_%s.csv', i), sep=',' )
})
# save to single file with append=TRUE adding on the data
lapply(seq_along(tx3), function(i){
write.table( data.frame(tx3[[i]]), sprintf('Profit.csv', i), sep=',' ,
append = TRUE)
}) 与lapply中的对象本身相比,我更喜欢将索引与seq_along一起使用,因为它会给我一个标识符号和一个对象,以添加到文件名中
https://stackoverflow.com/questions/57788282
复制相似问题