从 PDF 里面提取表格数据 我选择最新的一个 PDF 做演示:20200523-covid-19-sitrep-124.pdf,下面使用 tabulizer 包进行数据提取,不过这个包依赖于 rJava Java下载:https://www.java.com/zh_CN/ rJava 包的安装: install.packages('rJava') tabulizer 包的安装: install.packages ("tabulizer") 数据提取,我就不在这里说了,直播的时候再一一讲解。 # 使用 tabulizer 包 library(tabulizer) library(purrr) library(tidyr) library(tidyverse) f <- "pdf/20200523