首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 拆分PDF重命名】将PDF按页拆分多个PDF文件,并用PDF里文字对文件批量重命名,python和腾讯api识别改名的完整代码和详细步骤

    咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统(windows版) 图片 此外,为了进一步提高文件管理的效率和准确性,我们希望能够根据 PDF 每页的内容对拆分后的文件进行智能重命名,使文件名称能够直观反映其包含的主要信息 以下是使用 Python 和腾讯云 OCR API 实现将 PDF 按页拆分多个 PDF 文件并用 PDF 里文字对文件批量重命名 完整步骤和代码示例: 步骤 1:准备工作 安装必要的库: PyPDF2 :用于拆分 PDF 文件。 pdf2image:用于将 PDF 页面转换为图像,以便进行 OCR 识别。同时需要安装 Poppler 工具,pdf2image 依赖它来处理 PDF 文件。 rename_pdfs 函数:根据 OCR 识别结果重命名拆分后的 PDF 文件。 通过以上步骤,你可以实现将 PDF 按页拆分并根据其中的文字对文件进行批量重命名

    2.2K10编辑于 2026-04-04
  • 来自专栏全栈程序员必看

    pdf拆分保留书签_pdf补丁

    2010年6月11日更新 功能介绍 PDF补丁丁是一个用于修改PDF文件信息的工具。 它具有以下功能: 生成PDF文件:通过导入一批图片或已有PDF文件,生成包含图片及已有PDF文件指定页面范围的PDF文件。在生成文件时还可挂上书签。用此功能还可以拆分、合并PDF文件。 补丁生成新文件: 将上述信息文件和已有PDF文件合并,生成新的PDF文档,该PDF文档具有XML信息文件的设置(如页面设置、书签等)。 提取内容:可提取PDF文件中指定的页面或图片,导出的文件不再具有原文件在打印、复制等方面的限制。 分析文档结构:将PDF文档的内容导出成供PDF文档格式爱好者分析、调试用的XML文件。 合并图片后自动按顺序重命名文件。 修复错误:   修复了合并索引色图片后色彩错乱的问题。 0.2.7 新增功能: 撰写了使用文档。 合并导出信息和导入信息的功能为一个界面。

    1.9K20编辑于 2022-11-16
  • 不知道怎么拆分PDF文件?免费PDF拆分工具来啦

    有粉丝问有没有PDF拆分工具,就算可以把一个很多页的PDF,根据你的需求,拆分成很多个PDF,虽然不知道这个的应用场景在哪里,但既然粉丝需要我还是把它找来了。 这款工具叫做彩凤PDF拆分精灵只需要输入自己想拆的页码,中间用逗号隔开就可以了,使用非常简单就不多介绍了PDF拆分软件获取链接:https://tool.nineya.com/s/1j2hpsopo

    23900编辑于 2025-08-13
  • 来自专栏数据处理与分析

    使用Python拆分、合并PDF

    知识点 使用Python操作PDF! 主要内容有:1、PDF拆分2PDF合并。 在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。 PDF拆分 很多时候,获取的PDF很长,我们如果想要截取其中某些页面那么怎么处理呢?有很多的工具可以完成类似的操作,我们用Python也能做到类似的事情。 from PyPDF2 import PdfFileWriter, PdfFileReader def pdf_split(pdf_in,pdf_out,start,end): # 初始化一个 ,结束页 pdf_manage(pi, po, s, e) PDF合并 与pdf拆分相对的,是pdf的合并。 from PyPDF2 import PdfFileReader,PdfFileMerger def pdf_merger(in_pdfs,out_pdf): # 初始化 merger

    5.2K30发布于 2021-04-07
  • 来自专栏物流IT圈

    Java 合并、拆分PDF文档

    处理PDF文档时,我们可以通过合并的方式,来任意组几个不同的PDF文件或者通过拆分将一个文件分解成多个子文件,这样的好处是对文档的存储、管理很方便。 下面将通过Java程序代码介绍具体的PDF合并、拆分的方法。 工具 Free Spire.PDF for Java 2.0.0 (免费版) 注:2.0.0版本的比之前的1.1.0版本在功能上做了很大提升,支持所有收费版的功能,对于通过Java编程来处理PDF文档非常实用 步骤2:建好文件夹后,引用两个文件:选中这两个jar文件,点击鼠标右键,选择“Build Path” – “Add to Build Path”。 ? 【示例1】合并PDF文档 ? 【示例2拆分PDF文档 这里分2种情况来进行。 测试文档: ? 1. 按每一页单独拆分 ? 拆分结果: ? 2. 按指定页数范围拆分 ? 拆分结果: ?

    2.2K40发布于 2019-07-16
  • 来自专栏全栈程序员必看

    Python中通过PyPDF2实现PDF拆分「建议收藏」

    场景 PyPDF 2是一个纯python PDF库,能够分割、合并、裁剪和转换PDF文件的页面。它还可以向PDF文件中添加自定义数据、查看选项和密码。 PyPDF 2 1.26.0文档: https://pythonhosted.org/PyPDF2/ 实现 使用pip 安装pypddf2 新建merged.pdf有两页 新建pdfSplit.py 要与pdf在同一目录下。 from PyPDF2 import PdfFileReader, PdfFileWriter def split(path, name_of_split): pdf = PdfFileReader output_pdf: pdf_writer.write(output_pdf) if __name__ == '__main__': path = 'merged.pdf

    1.9K30编辑于 2022-09-10
  • 来自专栏java后端

    pdf文档怎么拆分呢?

    今日主题:java拆分pdf文档 今天为什么讲这个呢?因为上次我朋友问我,一个pdf有多页怎么拆分呢? 我说你用wps就可以拆分了,想不到他居然收费,真的是伤了我的心了,我用的是Free Spire.PDF for Java这个东西做的我用的是Free Spire.PDF for Java这个东西做的然后我就决心自己写代码将他拆分成一页一个 pdf。 包 2、将lib目录的jar包安装到本地仓库中 mvn install:install-file -DgroupId=e-iceblue -DartifactId=spire.pdf.free -Dversion (pdfPath); //拆分为多个pdf文档 document.split("C:/Users/KING/Desktop/全部图片/splitDocument-{0}.

    1.3K40编辑于 2021-12-24
  • 来自专栏办公魔盒

    VB.NET 拆分、合并PDF工具(PDF批量打印)

    VB.NET 合并PDF工具(PDF批量打印) 有粉丝后台留言想要拆分PDF文档的工具,那么他来了..... 上两期原文 问:为什么要自己做,不使用网上的现成工具? 答:因现在网上99%以上的PDF合并工具都是需要收费,或者要使用收费的破J版,或者是一些网页的在线服务不能上传和合并大批量的文件(这也涉及到文件的安全性)所以想着自己弄一个. 答:开发这款小工具主要解决的问题是大批量打印PDF文件,平常在工作中我们常常需要打印大批量的PDF文件,我们通常的操作就是使用PDF阅读器,一个个打开然后,然后就是一个个点击打印(这是我知道的方式哈,有更简洁的方式请广大的网友分享一下 我想到的方式就是使用程序一个个批量发送到打印机打印,但这种方式有一个弊端就是不稳定有可能会中断,然后就不知道自己打印到那一份文件了,同时几个人打印也容易被人插进来,导致文件错乱,不好分类;后来我就想到了一个方式就是把PDF 本期只做上期VB.NET 合并PDF工具(PDF批量打印)的补充,这次新增了批量拆分PDF文档操作,下面看演示 核心代码 Sub Split_all_pdf(datapath As String

    2K20发布于 2021-02-05
  • 来自专栏Mac应用教程

    PDF Merge PDF Splitter Mac(PDF合并和拆分软件)v6.3.5

    如何将PDF合并为一个?PDF Merge PDF Splitter for Mac是一款非常易于使用的苹果软件,可让您快速将多个PDF合并为一个PDF或将指定页面拆分为一个新PDF。 图片PDF Merge PDF Splitter for Mac特征介绍将多个PDF文件合并为一个PDF。合并受密码保护的PDF文件,但是您必须知道密码。支持拖放。支持拖动项目进行排序。

    90010编辑于 2022-07-08
  • 来自专栏完美Excel

    使用Python拆分和合并PDF文件

    因此,我需要一种分割PDF文件的方法。虽然Adobe Acrobat Pro DC允许拆分和合并PDF文件,但需要付费。 Python就能够实现,谁不喜欢免费的解决方案呢? getPage()方法允许我们将PDF文件拆分为单独的页面,以便我们可以选择,然后使用Python将它们合并到一个文件中。 图2:使用Python从PDF文件中获取页面 创建并保存PDF文件 现在我们已经成功地从PDF中提取了一个页面。 将上述代码放到一起 下面是允许你使用Python拆分和合并PDF文件的完整代码: from PyPDF4 import PdfFileReader,PdfFileWriter pdf =PdfFileReader 2.通过提取单个页面来拆分PDF文件。 3.将页面合并到新的PDF文件中。 注:本文学习整理自pythoninoffice.com。 欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。

    3.4K10编辑于 2022-03-07
  • 来自专栏鱼的爱情看不出泪水

    如何利用Python批量重命名PDF文件

    除了普通的文件名修改,我们还可以将PDF内容提取出来并用于重命名 安装Python和使用PyChram编译器 Python的安装在这里并不想多少,目前网络上的教程都是正确的。 jupyter 安装tabula 在Terminal安装: pip install tabula-py 代码测试 运行以下代码测试: import tabula demo = tabula.read_pdf ('C:\\Users\\UserName\\Downloads\\1.pdf') df2 = tabula.read_pdf("https://github.com/tabulapdf/tabula-java /raw/master/src/test/resources/technology/tabula/arabic.pdf") print(demo) 这个时候其实已经出来了,不过你也可以用Jupyter CSDN 2. 知乎 3. Towards Data Science

    1.5K10编辑于 2023-03-03
  • 来自专栏数据处理与编程实践

    VBA: 一键批量重命名PDF文件

    一、背景 工作中经常会遇到这种情况: 一批 PDF 文件需要统一修改名称 比如把 BYD 批量改成 TES 文件一多,手动修改不仅慢,还容易出错 这种重复性操作,其实非常适合用 VBA 来解决。 二、工具说明 核心只需要填 3 个参数: 文件夹路径 旧字符串 新字符串 点击按钮,即可完成批量重命名。 , vbCritical, "Error" Exit Sub End If ' 读取参数 folderPath = Trim(wt.Range("B2").Value newFilePath) Then skipCount = skipCount + 1 Else ' 重命名 Nothing Set wt = Nothing End Sub 三、核心思路 这段代码本质就做了三件事: 1️⃣ 遍历文件夹 通过 FileSystemObject 获取目录下所有文件 2️⃣

    6310编辑于 2026-04-16
  • 来自专栏TalkPython

    用Python玩转PDF | 批量拆分文件

    如果一个PDF文件页数较多,导致体积较大,可以将其拆分成几个部分,以方便阅读。那么如何拆分?今天继续分享使用Python编写程序来完成PDF文件的批量拆分。 这里采用按固定页数进行拆分的方式。 例如,假设按每份5页进行拆分,那么一个27页的PDF文件会被拆分成6份(27/5=5.4≈6),第1~5份均为5页,第6份为2页。仍然使用PyPDF2模块来拆分PDF文件。 以下为完整程序: from pathlib import Path from PyPDF2 import PdfFileReader, PdfFileWriter def split_pdf_file( 拆分函数,需要两个参数,一个为PDF文件目录src,一个为拆分页数size,也就是多少页文件拆分为一个文件。 程序运行后,会把文件目录下所有满足条件的PDF文件,进行拆分,也可以理解为文件批量拆分

    1.2K20编辑于 2022-11-21
  • PDF拆分+识别+重命名+导出表格】PDF文件拆分为单独页面后批量提取内容重名命,将所有的区域的内容保存后导出表格,基于 WPF 和腾讯云的 实现方案

    传统方式下,将 PDF 文件拆分为单独页面并对每个页面进行有意义的重命名以及提取关键信息并导出表格,通常需要人工手动操作,这不仅效率低下,还容易出错。 本方案基于 WPF(Windows Presentation Foundation)构建用户界面,方便用户操作,同时借助腾讯云提供的云服务能力,实现 PDF 文件的拆分、内容识别、重命名以及信息导出表格等功能 编写拆分代码:在 WPF 项目中创建一个方法用于拆分 PDF 文件。 编写代码调用 OCR 接口对拆分后的每个 PDF 页面进行文字识别。 绑定事件处理:为各个按钮绑定对应的事件处理方法,例如选择 PDF 文件按钮绑定文件选择对话框的打开方法,开始处理按钮绑定调用上述拆分、识别、重命名和导出表格等一系列操作的方法。

    2K10编辑于 2025-03-06
  • PDF批量提取内容改名】提取PDF指定可复制的内容并批量重命名PDF,提取识别文字并对PDF文件批量重命名,批量PDF文档指定识别提取区域

    本文主要解决问题:1、可复制内容的PDF,提取多个区域内容,对PDF重命名下面我们讲下这个发票如何提取区域内容对PDF进行重命名图片第一步、下载软件批量PDF多区域内容提取重命名百度网盘:https:/ pwd=8866腾讯网盘:https://share.weiyun.com/yw15BsM7第二步、打开软件导入文件,设定好提取的坐标,然后加载要修改的PDF文档如何获取PDF区域坐标,可以参考下面的小技巧第三步 、设定PDF重命名后点击【开始提取】几十个文件1秒不到,PDF要修改的文件就被修改完成,速度非常快,几万个文件也就几分钟左右最后可以将整个修改的过程中可以导出Excel表格,还可以保留本次修改的坐标,下次接着再用 ,对于大量提取PDF区域文件内容来修改文件名的用户来说比较友好,PDF的内容置于文件第二页,第三页,也就是可以指定页的内容的提取,自定义提取PDF文档内的任意坐标,提取任意指定区域的内容,多区域进行组合 ,下面是图片识别文字的PDF的方法可以参考添加描述

    4.5K10编辑于 2024-10-26
  • 来自专栏Python大数据分析

    Python也可以合并和拆分PDF,批量高效!

    PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。 知乎上也有人问,如何对PDF进行合并和拆分? 而且很多软件是收费的,本来PDF合并拆分也不是什么难事,赚的是信息差的钱。 我一般会用Python的PyPDF2库来编辑PDF,其中就包括合并、拆分多个PDF。 话不多说,下面给出案例代码: 该示例代码定义了两个函数 merge_pdf() 和 split_pdf(),分别用于合并和拆分 PDF。 在测试代码中,首先调用 merge_pdf() 函数将两个 PDF 文件合并,然后调用 split_pdf() 函数将合并后的 PDF 文件拆分为多个页面,并将这些页面保存到不同的文件中。 这个脚本需要安装 PyPDF2 库才能使用。可以使用 pip install PyPDF2 命令安装 PyPDF2 库。

    59410编辑于 2024-04-19
  • 来自专栏用户5696267的专栏

    条码打印软件之PDF拆分合并功能

    在条码打印软件中不仅可以导入导出PDF文档,而且在条码打印软件中有PDF工具箱,支持PDF拆分PDF合并等功能,PDF合并有三种合并方式,PDF顺序合并、PDF交叉合并、PDF叠加合并。 接下来小编给大家演示一下PDF拆分PDF合并功能是如何实现的。 PDF拆分。顾名思义,就是把一个PDF文档根据页数拆分成多个PDF文档。 把需要拆分PDF文档添加到PDF工具箱中,选择“拆分文件”,设置每个PDF的页数,通过“浏览”选择拆分PDF文档的保存位置,点“执行”,这样就可以把添加的PDF文档拆分在多个PDF文档。 如下图: PDF合并之顺序合并。条码打印软件中的PDF顺序合并就是把多个PDF文档合并成一个PDF文档,合并后的PDF文档内容是按照PDF文档添加顺序显示的。 操作和上面的操作一样,处理类型选择“交叉合并”即可,看下效果 以上就是条码打印软件中PDF拆分PDF合并的功能操作步骤以及效果图,操作非常方便,可以方便快捷的把PDF文档进行拆分合并,输出自己想要的效果

    1.3K30发布于 2019-06-25
  • 来自专栏哆哆Excel

    在C#中,PDFsharp库使用(二):PDF拆分

    它提供了一套丰富的 API,允许你以编程方式生成、编辑和渲染 PDF 文件 一、PDF拆分界面 二、PDF拆分代码 //PDF拆分--添加文件 //添加文件表Listbox中, //PDF拆分--添加文件 } } } //PDF拆分---删除button //对Listbox中的列表进行操作删除 //PDF拆分---删除button private void button6 //PDF拆分-输出目录Button 拆分后要输出的文件目录 //PDF拆分-输出目录 private void button7_Click(object sender, EventArgs e) } } //PDF拆分---执行拆分Button //读取Listbox的列表,循环列表,按x页/每个文档的方式拆分, 如:按3页/每个文档 ,将输出:原文件名_1_3.pdf、原文件名 ; // 例如,每个文档拆分为5页 // 遍历ListBox中的所有PDF文件 foreach (string pdfFile in listBox2.Items) { //

    2.7K10编辑于 2024-04-18
  • 来自专栏萝卜大杂烩

    Python自动化办公之PDF拆分工具

    需求 需要从 PDF 中取出几页并将其保存为新的 PDF,为了后期使用方便,这个工具需要做成傻瓜式的带有 GUI 页面的形式 选择源 pdf 文件,再指定下生成的新的 pdf 文件名称及保存位置,和需要拆分的 操作,我这里选择了 pypdf2 库 我们先硬编码一个输入输出的示例 from PyPDF2 import PdfFileWriter, PdfFileReader infile = "Input.pdf , "wb") 下面一个比较复杂的点就是需要拆分 pdf,提取页面并保存在列表中 page_ranges = (x.split("-") for x in page_range.split(",")) (p - 1)) output.write(output_file) 下面来构建 GUI 界面 对于这个拆分 PDF 的小工具,需要具有如下功能: 可以通过标准文件浏览器选择 pdf 文件 可以选择输出文件的位置及文件名称 : app.stop() 好了,这样我们就完成了一个简易的 GUI 拆分 PDF 文件的工具喽

    61310编辑于 2022-04-06
  • 来自专栏ascii0x03的安全笔记

    免费开源的PDF文件工具整理【压缩合并拆分

    /tmp/a.pdf   #把pdf转化为图片 图片为a1.png a2.png a3.png .... gs -dQUIET -dNOSAFER -dBATCH -sDEVICE=pngalpha “-sOutputFile=“后面接输出文件,最后/tmp/a.pdf是输入文件。 2. PDFSam 简单的操作就用它吧,有设计良好的GUI。 PDFsam Basic 是 免费 和 开源 的桌面应用程序,用于拆分、合并、提取页面、旋转和混合 PDF文件。 3. PDFBinder 合并PDF用的,非常小巧,在发现PDFSam之前一直用它做PDF合并。 PDF拆分使用Adobe免费版最原始的方法,分页打印成PDF…… 转载请注明出处:https://www.cnblogs.com/ascii0x03/p/13258685.html By Ascii0x03

    2.7K30发布于 2020-07-08
领券