首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信技能树

    R语言奇淫巧技之pdftools

    最近逛r-bloggers这个论坛发现pdftools包这个神器,原文链接是:https://www.r-bloggers.com/2019/04/join-split-and-compress-pdf-files-with-pdftools 就可以使用pdftools包的pdf_subset()函数,示例代码如下: # Load pdftools library(pdftools) # extract some pages pdf_subset 就可以使用pdftools包的pdf_combine()函数,示例代码如下: # Generate another pdf pdf("test.pdf") plot(mtcars) dev.off()

    3.2K40发布于 2020-09-30
  • 来自专栏异常问题

    [678]ModuleNotFoundError: No module named 'frontend'

    pycharmcode\zxf_project\dp_project\ocr_admin\tasks\utils\__init__.py", line 8, in <module> from .pdfTools import resolutionPDF File "C:\soft\pycharm\pycharmcode\zxf_project\dp_project\ocr_admin\tasks\utils\pdfTools.py

    8.4K20编辑于 2025-08-22
  • 来自专栏R语言交流中心

    R语言提取PDF文件中的文本内容

    安装R包: install.packages("pdftools")。 当然如果在Windows以外的环境安装需要部署 poppler 环境。 installlibpoppler-cpp-dev CentOS: sudo yum installpoppler-cpp-devel Mac OS-X: brew install poppler 开始使用: library(pdftools

    11.7K10发布于 2019-07-31
  • 来自专栏R语言交流中心

    R语言操作pdf文档

    今天给大家介绍一个可以读取pdf文件信息的R包pdftools。此包基于Poppler库(https://poppler.freedesktop.org/)进行解析pdf文件。 在这里我们就不深入剖析这个Poppler库了,直接看下pdftools包的使用。 首先是包的安装: install.packages(“pdftools”) install.packages("tesseract") 接下来我们直接通过实例来看下包的相关功能: ##pdf文件的载入

    2.4K10发布于 2021-07-05
  • 来自专栏DotNet NB && CloudNative

    DinkToPdf: .Net轻松搞定Html转PDF生成,几分钟上手!

    var converter = new SynchronizedConverter(new PdfTools()); 3. // Add converter to DI services.AddSingleton(typeof(IConverter), new SynchronizedConverter(new PdfTools public static void Main(string[] args) { var converter = new BasicConverter(new PdfTools

    72110编辑于 2025-04-26
  • 来自专栏生信技能树

    神技能-自动化批量从PDF里面提取表格

    and Predictors of Response to Checkpoint Blockade 表现优异的学徒 但是拿到学徒提交的代码才眼前一亮,她居然是从上面文章的PDF附件里面,使用R语言的pdftools 读取PDF并且提取信息的代码如下: rm(list=ls()) library(pdftools) options(stringsAsFactors = F) b <- pdf_text('SupplementaryTables.pdf apply家族函数要活学活用 不过, 我还是觉得学徒代码太丑,修改了一下: rm(list=ls()) library(pdftools) options(stringsAsFactors = F)

    1.7K50发布于 2019-07-05
  • 来自专栏用户7627119的专栏

    R如何提取,合并pdf文件

    今天就用R来实现一下 install.packages("pdftools") library(pdftools) #创建一个文件夹来存放每篇文章的首页 dir.create("cover") #假设所有的文章都存在

    2K20编辑于 2022-09-21
  • 来自专栏IT技术分享社区

    NetCore实战:基于html生成pdf文件案例讲解

    static void ConvertHtmlToPdf() { var converter = new BasicConverter(new PdfTools private static void ConvertUrlToPdf() { var converter = new BasicConverter(new PdfTools

    1K30编辑于 2023-11-14
  • 来自专栏华章科技

    一文看懂用R语言读取Excel、PDF和JSON文件(附代码)

    03 pdftools:PDF文件 学术期刊、网络杂志和电子书籍一般都会以PDF格式的文件呈现。 一般的计量型数据分析很少会遇到读取PDF文件的情况,不过在进行文本挖掘(Text Mining)和主题模型(Topic Modelling)预测中,pdftools包绝对是必备R包之一。 这里所用的PDF文档是pdftools包的帮助文档,读者可以自行到R官网上搜索下载。帮助文档是开放PDF文件,无须提供密码。 读取文档代码如下: > library(pdftools) > pdf_info(pdf = ". /helpDocs/pdftools.pdf") ## $version ## [1] "1.5" ## ## $pages ## [1] 5 ...

    7.9K21发布于 2019-07-30
  • 来自专栏小工匠聊架构

    OpenSource - 文件在线预览模块(多格式转 PDF 文件)

    http://ip:port/demo/toSvg 参数配置 castle: upload: # 自行配置可访问的路径 fileDomain: http://up.hcses.cn/pdftools # 文件可访问的地址 fileServerPath: /www/wwwroot/up.hcses.cn/pdftools/ # 原始文件的服务器存储位置 其他说明 本示例转换 PDF 部分采用了

    1.4K00编辑于 2024-05-25
  • 来自专栏小明的数据分析笔记本

    可能会用到的R语言包~2

    blog.sciencenet.cn/blog-255662-846673.html 自己可能会用到输入拉丁名然后获取科属信息这个功能 自己看论文的时候遇到拉丁名总会想知道中文名,不知道有没有软件可以实现翻译拉丁文为中文名 pdftools 今天在 生信技能树 公众号 看到的推文 R语言奇淫巧技之pdftools包,操作pdf文件非常方便,用到的时候可以回过头看这篇推文。

    1.3K10发布于 2020-11-05
  • 来自专栏生信菜鸟团

    如何将pdf转换为word 2.0

    5.R 需要结合pdftools和tesseract两个R包,进行OCR提取 pdf_ocr_text( pdf, #file path or raw vector with pdf data

    3.9K40发布于 2020-06-04
  • 来自专栏数据驱动实践

    R语言:OCR图文识别,tesseract支持png、pdf转word

    ocr('ec.png', engine = tesseract("chi_sim")) cat(text) # 支持pdf图文识别,Read from PDF files pngfile <- pdftools

    4.5K20编辑于 2022-04-18
  • 来自专栏生信技能树

    patchwork拼图对不齐怎么办?

    ~ 拼图问题重现 拿到学员发来的数据和代码(已获得学员准许图片打码发公众号),拼图方式如下: # install.packages("magick") library(magick) library(pdftools

    31310编辑于 2025-04-27
  • 课程复习---细胞聚类

    (Seurat)library(dplyr)library(factoextra)library(cluster)library(showtext)library(gridExtra)library(pdftools

    24700编辑于 2024-12-27
  • 来自专栏R语言可视化

    可视化—KEGG气泡图和桑葚图绘制

    save.image(file = "myWorkspace.RData")# 读取保存的工作空间(如有需要)# load("myWorkspace.RData")# 加载PDF处理和图像处理的R包library(pdftools

    1.2K10编辑于 2025-06-30
  • 来自专栏DotNet程序园

    如何在ASP.NET Core 中快速构建PDF文档

    , "libwkhtmltox.dll")); services.AddSingleton(typeof(IConverter), new SynchronizedConverter(new PdfTools

    2K21发布于 2019-12-24
  • 流程更新----空间细胞聚类及配受体共现分析(针对visium、bin模式的Stereo-seq、以及HD)

    (Seurat)library(dplyr)library(factoextra)library(cluster)library(showtext)library(gridExtra)library(pdftools

    74810编辑于 2024-11-17
  • 来自专栏肠道菌群与代谢组学

    非靶向代谢组学—全分析流程3(以3分组为例)

    Metabolite Enrichment Analysis Results.xlsx", overwrite = TRUE) #附加批量PDF转PNGlibrary(pdftools) library

    1.7K13编辑于 2025-07-04
领券