首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏oktools

    PDF图片,在线PDFJPGPNG

    在线DEMO 原理 使用pdf.js预览图片,pdf.js将pdf通过canvas将每一页渲染出来,然后我们通过canvas的toDataURL方法保存为jpg或png格式。 pdf.js是Mozilla开源的一个js库,无需任何本地支持就可以在浏览器上显示pdf文档。唯一的要求就是浏览器必须支持HTML5。 依赖 需要pdf.min.js和pdf.worker.min.js两个js文件 全部代码实现 pdfjsLib.GlobalWorkerOptions.workerSrc = 'https://cdn.bootcss.com /pdf.js/2.2.228/pdf.worker.min.js'; const preview = document.getElementById('preview'); const loadingTask = pdfjsLib.getDocument(url); loadingTask.promise.then(function (doc) { pdf

    17.2K40发布于 2019-08-30
  • 来自专栏GhostCN_Z

    PDF图片

    经过测试,fitz是目前PDF图片相对较简单快捷且无bug的一个方法,不会出现转换图片时白屏的情况。弊端是转换较慢。 fitz——高质量PDF 安装 pip install traits pip install fitz pip install PyMuPDF 示例 import os import fitz import (file_path) # 日志模块 logger.add('pdf2png.log', format="{time} {level} {message}", level="INFO") # pdf_image (r"E:\PyPro\小功能\PDF切割图片\PDF\0700000062.pdf", r"E:\PyPro\小功能\PDF切割图片\PNG\\", 2, 2, 0) def pdf_image(pdfPath 文件 pdf = fitz.open(pdfPath) # 逐页读取PDF for pg in range(0, pdf.pageCount):

    4.7K30发布于 2021-08-04
  • 来自专栏小小码农一个。

    pdf 图片

    artifact/org.apache.pdfbox/pdfbox compile group: 'org.apache.pdfbox', name: 'pdfbox', version: '1.8.16' pdf 单页图片 合并一张的工具库 前往aspose-words word图片 下载使用 /** * 将pdf转成一张图片 * @param pdffile * @return * @throws /文件上传路径 String parent = file.getParent(); PDDocument doc = PDDocument.load(inputStream); //获取pdf )); if(png == false){ return "转换失败"; } //关闭流 inputStream.close(); return "转换成功"; } pdf 每页图片 放到文件夹内 转换成压缩包 也可以不放压缩包 随意 压缩包工具类 java实现文件压缩,文件夹压缩,以及文件和文件夹的混合压缩 // 将pdf 转化为 图片分页 压缩包 public

    5.3K00发布于 2020-06-08
  • 来自专栏IT民工的代码世界

    wordpdf

    在日常代码开发中经常用到的功能就是wordpdf,下面就来介绍两种的方式 第一种:Aspose.word aspose的开源组件非常多,比如excel的导出,支持的合并单元等功能非常好用,这里用到的是 Aspose.Words.Document doc = new Aspose.Words.Document(inputFileName); //aspose.words将docpdf ref paramMissing); //EpointLog4Net.Info(BizLogic.LogName, "docpdf catch (Exception ex) { //EpointLog4Net.Error(BizLogic.LogName, "docpdf catch (Exception err) { //EpointLog4Net.Error(BizLogic.LogName, "docpdf

    3.4K30编辑于 2023-07-19
  • wordpdf

    import comtypes.client import os from datetime import datetime def convert_word_to_pdf_comtypes(word_file , pdf_file): try: word = comtypes.client.CreateObject('Word.Application') word.Visible = False doc = word.Documents.Open(word_file) doc.SaveAs(pdf_file, FileFormat=17) # 17 代表 PDF 格式 doc.Close() word.Quit() timestamp = datetime.now().strftime("%Y- = os.path.join(folder_path, os.path.splitext(filename)[0] + ".pdf") convert_word_to_pdf_comtypes

    34010编辑于 2025-07-16
  • pdf图片

    pdf图片把 PDF 转成图片是个很简单的事,可以让你更方便地分享、查看或编辑页面。很多人需要把 PDF 的页面做成图片去发到网站、放到演示文稿里,或发送到不支持 PDF 的设备。 当你只需要单页而不是整个 PDF 时,图片也很方便。还有些查看器和编辑器只接受图片文件不接受 PDF,转换能增加使用选择。 另外我也见过人用磨针工具软件在 Windows 上快速批量图,设置好分辨率一键导出,挺方便的。 有人推荐过磨针工具软件的网页版,可以直接上传小文件快速,使用体验挺直观的,不过别上传敏感文件。质量和文件大小小贴士更高的分辨率会得到更清晰的图片,但文件会更大。 图片能再转回 PDF 吗?可以。大多数系统和应用能把多张图片合并成一个 PDF,方法有打印为 PDF、图片查看器或命令行工具(如 ImageMagick)。

    55500编辑于 2025-10-10
  • 来自专栏python前行者

    pdfmarkdown

    六个开源的PDFMarkdown项目 ✨ 1: gptpdf gptpdf 是一个利用VLLM解析PDF为Markdown的工具,几乎完美支持数学公式、表格等。 --max 设定要转换的PDF文件最大数量。省略此参数将以转换文件夹内的所有PDF。 --min_length 是从PDF中提取字符的最小数量,达到这个限制后PDF才会被考虑处理。 处理大量PDF时,推荐设置以避免对主要由图像组成的PDF进行OCR(这会减慢处理速度)。 --metadata_file 是一个可选的JSON文件路径,包含有关PDF的元数据。 格式如下: { "pdf1.pdf": {"languages": ["英语"]}, "pdf2.pdf": {"languages": ["西班牙语", "俄语"]}, ... } ✨ 3 : PDF-Extract-Kit PDF-Extract-Kit 提供高质量PDF内容提取,支持布局检测、公式识别和OCR功能 版面检测:使用 LayoutLMv3 模型进行区域检测,如检测图片、

    2.5K10编辑于 2024-11-24
  • 来自专栏技术研究和应用

    MarkdownPDF

    markdownpdf是比较常见的需求,有许多成熟的工具可以实现,比如pandoc和wkhtml2pdf,很多工具都是对这些的进一步包装。 fc-list :lang=zh如果遇到更多字体相关问题,参考:https://github.com/jgm/pandoc/wiki/Pandoc-with-Chinese(4)代码示例Markdown字符串pdf delete=False) as temp_pdf: temp_pdf_path = temp_pdf.name process = subprocess.Popen( 'rb') as pdf_file: pdf_bytes = pdf_file.read() return pdf_bytespdfkitmarkdownpdf的流程如下:使用markdown $E=mc^2$$ 'markdown_checklist.extension', # checklist,- [ ]和- [x] 'pymdownx.magiclink', # 自动超链接

    2.2K10编辑于 2024-09-02
  • 来自专栏InvQ的专栏

    JAVA开源的htmlpdf、pngpdf项目

    总览 Open HTML to PDF是一个纯Java库,用于使用CSS 2.1(以及更高版本的标准)对合理子集的格式良好的XML/XHTML(甚至一些HTML5)进行布局和格式化,输出为PDF或图像。 使用该库生成漂亮的PDF文档。但请注意,您不能将现代HTML5+直接应用于该引擎并期望获得出色的结果。 特性 使用维护良好且开源(兼容LGPL)的PDFBOX作为PDF库,而不是iText。 提供适当的支持生成无障碍PDF(Section 508,PDF/UA,WCAG 2.0)。 提供适当的支持生成符合PDF/A标准的PDF。 新的、更快的渲染器意味着对于非常大的文档,该项目可以快几倍。 更好地支持CSS3变换。 自动视觉回归测试PDF,有许多端到端测试。 OPEN HTML TO PDF已经在OpenJDK 8、11和17(早期版本)上进行了测试。至少需要Java 8才能运行。 不,你不能在Android上使用它。 你应该能

    1.7K10编辑于 2024-07-31
  • PDF怎么Excel?PDF免费Excel工具来啦

    有粉丝私信我问pdf怎么excel,的确这算是一个很常见的需求了,我找了好几个pdfexcel的工具,但用下来效果都不太满意,最终找到了这款pdftoexcel。 这个工具用起来也没什么好说的,只要把需要转换的PDF放进一个文件夹里,再点击浏览选择这个文件夹,就会自动把它变成excel了。 PDFExcel工具获取链接:https://tool.nineya.com/s/1j2vkf3b9闲聊几句:睡了一会又醒了,也不知道是怎么醒的,感觉有点上火了

    41410编辑于 2025-08-19
  • 来自专栏全栈程序员必看

    java的pdf永中_永中pdfword下载|

    永中pdfword是永中软件推出的一款网页版在线pdfword转换器工具,这款软件之所以能在众多同类型软件中脱颖而出,是因为有这几个亮点,一个是免费且无需下载,二是不限使用次数,再就是转换后无乱码、 有些小伙伴把PDF的内容通过复制粘贴到Word中去,格式、内容往往惨不忍睹,还有些小伙伴会下载pdfword的软件转换后再编辑,但是市面上大部分PDFWord工具都是收费的,价格不低还不一定管用,极少数免费的效果又不行还限制页数 那有没有即能免费用,又不用下载客户端的PDFWord工具呢? 当然有! 永中PDFWord就能帮您解决这种难题。 永中pdfword在线转换器使用说明 1.下载打开记事本中地址,打开网页版”永中PDFWord” 2.选择需要转换的PDF文件; 3.点击开始转化按钮; 4.转换完成,点击”下载”按钮,即可获取转换后的 最近自己发现了一个新的PDFWORD转换器——永中PDFWORD在线转换器,这个转换器没有转换数量、转换文件大小方面的限制,大家可以放心的使用。

    7.5K10编辑于 2022-08-30
  • 来自专栏椰果笔记

    pdfword图片word

    通常情况下,我们需要将pdf格式的文件或者图片格式的文件转换为可编辑的word格式,之前多数人都使用OCR识别软件来进行转换,现在教大家一种方法,百试不爽。 1.2 安装完成后使用破解软件进行破解,如果你需要破解软件,只需要在微信公号会话界面向我发送,“pdf”3个小写字母,我马上发给你,如下界面就是注册机软件界面了。 破解界面: ? 破解(试用的也可以,只有30天的使用时长)完后打开选择需要转换的图片或者PDF文件。 右键使用Adobe PDF软件打开。 ? 点击左上角的“文件—另存为(s)”即可存储为其他文件格式;如:word ,pdf等可编辑文件格式,另存到自定义的路径就可以了,有个别文字会出现错误的情况,对照一下源文件修改一下即可。

    11.2K50发布于 2019-07-23
  • 来自专栏带你回家

    word,ppt,excelpdf,pdfhtml工具类搭建

    我看到很多需求要求word,excel,ppt,pptxpdf等工具类。还有就是pdf图片html这里介绍一个这个工具类。 logger.info(ex); } } } return true; } /** * wordpdf logger.info(ex); } } } return res; } /** * pptpdf html * * @return */ public static boolean pdfToHtml(String pdfPath, String htmlPath 图片 * * @param pdfPath * @param imgPath * @return */ public static String

    4.6K10发布于 2019-11-07
  • 来自专栏全栈程序员必看

    wordpdf的java实现_java实现wordpdf

    文章时间:2020-12-5 16:38:54 解决问题:java实现wordpdf 目前发现可用的实现方式有两种,一种是使用e-iceblue的免费版api,此方法最为简单但存在限制,导出页数不能超过三页 方式一 e-iceblue的免费版api 官方文档https://www.e-iceblue.cn/spiredocforjavaconversion/java-convert-word-to-pdf.html \dev\\Desktop\\template.docx”; // word文件生成路径 String generateUrl =”C:\\Users\\dev\\Desktop\\generate.pdf ”; Document document = new Document(); document.loadFromFile(generateUrl); //保存生成的pdf document.saveToFile (generateUrl, FileFormat.PDF); 方式二 openoffice转换 官方文档:http://www.openoffice.org/why/index.html openoffice

    6.7K20编辑于 2022-06-27
  • 来自专栏全栈程序员必看

    .net pdfword_pdf to word

    ; import com.aspose.pdf.SaveFormat; import com.aspose.pdf.Document; import java.io.ByteArrayInputStream margin-right: 20px;text-align: right"> <button type="button" class="btn btn-primary" onclick="docToPdf()">WordPDF </button> <button type="button" class="btn btn-info" onclick="pdfToDoc()">PDFWord</button>

    < --wordpdf--> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-word</artifactId> <version --pdfword--> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-pdf</artifactId> <version

    8.7K20编辑于 2022-11-17
  • 来自专栏python3

    python 图片 pdf

    reportlab.lib.pagesizes import A4, landscape from reportlab.pdfgen import canvas ''' 遍历当前目录下所有的jpg文件,并按照文件夹名称合并成pdf h) = landscape(A4)    #遍历当前目录     for root,dirs,files in os.walk(os.getcwd()):          #根据根目录名创建一个pdf         c = canvas.Canvas(os.path.basename(root)+".pdf", pagesize = landscape(A4))         #print(os.path.basename (root)+".pdf")     #用于存放jpg文件         jpg_list=[]     #从文件列表中取出jpg文件放入到list中         for p in files:

    4K20发布于 2020-01-06
  • 来自专栏AI-vell

    python pdf image

    前言 最近项目需要pdf中提取内容,pdf是扫描版,想通过转成图片,通过图像识别区分出段落,然后进行ocr识别,得到结构化数据 所以第一步需要搞定的就是pdf图片了 环境:Mac 10.12.6 (16G29 python 脚本 from wand.image import Image # Converting first page into JPG with Image(filename="/thumbnail.pdf

    5.5K430发布于 2018-10-29
  • 来自专栏Lan小站

    Python PDF图片

    # pip install PyMuPDF -i https://pypi.douban.com/simple def pyMuPDF_fitz(pdfPath, imagePath): pdf_doc = fitz.open(pdfPath) for pg in range(pdf_doc.pageCount): page = pdf_doc[pg] rotate pix.save(imagePath + '/' + 'images_%s.png' % pg) # 将图片写入指定的文件夹内 if __name__ == "__main__": # 1、PDF 地址 pdfPath = 'file.pdf' # 2、需要储存图片的目录 imagePath = './' pyMuPDF_fitz(pdfPath, imagePath

    2.3K10编辑于 2022-07-13
  • 来自专栏Python小二

    Word 批量 PDF

    现实中我们大多数人都做过将 Word 文件转成 PDF 文件的工作,如果需要转换的文件较少时,我们自己手动没什么问题,但如果需要转换的文件比较多时,手动转起来也是一个不小的工作量,这时我们就需要找一个更加便利 我们使用 Python 就能实现将 Word 文件批量转成 PDF 文件,因此,当我们需要转换的文件比较多时,就可以考虑使用这种方式了。 filename.endswith((".doc", ".docx"))] for wordname in wordname_list: # 分离 Word 文件名称和后缀,转化为 PDF 名称 pdfname = os.path.splitext(wordname)[0] + ".pdf" # 如果当前 Word 文件对应的 PDF 文件存在,则不转化 看一下转换后的 PDF 文件: ? 我们可以看到,无论是文字样式还是图片,转换的效果都比较好。

    3.9K30发布于 2020-08-18
  • 来自专栏P轴

    Vuepress文章pdf

    前言 vuepress原始文件是markdown文件,生成的web页面时html,如果想保存为pdf有2类方法。 版本说明: "vuepress": "^1.9.7" https://www.npmjs.com/及github上搜索的工具/插件 #1. md文件pdf #vuepress2pdf 不能使用 https #vuepress-plugin-export-pdf https://www.npmjs.com/package/@condorhero/vuepress-plugin-export-pdf 本地转换 ,速度快 导出的是整个站点docs目录下所有的文章合并为一个pdf文件 样式比较乱,有些vuepress特有的语法不支持 #2. htmlpdf 样式可以与网页显示一致 #mr-pdf推荐 支持docusaurus , vuepress, mkdocs https://github.com/kohheepeace/mr-pdf 注意: 本地开发url要使用http://127.0.0.1:端口号 标题不支持中文,

    3.5K60编辑于 2022-11-14
  • 领券