首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏马洪彪

    LIMS系统仪器数据采集-使用xpdf解析pdf内容

    解析PDF文本,可使用xpdf,该工具为一命令行工具,因此可通过java或.net调用命令行执行。 而使用xpdf,则可以指定-layout参数,将其按照页面显示的布局方式输出。 下图为PDF样式: ? 下图为pdfBox、itextsharp解析出的内容样式: ? 下图为xpdf设置了layout后的解析样式: ?  可以看出,使用xpdf解析出的内容较容易识别出有意义的数据项。 例子中的中文没有解析出来,可通过配置PDF中文字体解决,xpdf的另一个强项功能,就是它支持配置pdf字体,有些PDF内容通过itextsharp解析不出来的情况下,使用xpdf在配置了正确字体后可以解析出内容

    2.2K40发布于 2018-04-12
  • 来自专栏网站教程

    centos 安装swftools

    语言包,下载xpdf-chinese-simplified.tar.gz文件,解压到/usr/share/xpdf下,编辑add-to-xpdfrc文件,如下:     tar zxvf xpdf-chinese-simplified.tar.gz /CMap/     cd /usr/share/xpdf/xpdf-chinese-simplified     vi add-to-xpdfrc     内容如下:     cidToUnicode   Adobe-GB1       /usr/share/xpdf/xpdf-chinese-simplified/Adobe-GB1.cidToUnicode     unicodeMap     /xpdf/xpdf-chinese-simplified/CMap     toUnicodeDir                      /usr/share/xpdf/xpdf-chinese-simplified 8.测试 pdf2swf -s languagedir=/usr/share/xpdf/xpdf-chinese-simplified -T 9 -s poly2bitmap -s zoom=150

    41520发布于 2021-09-06
  • 来自专栏北京马哥教育

    Linux系统六个最佳PDF文档阅览器,看看哪款更适合你

    XPDF是一项老牌的开源PDF浏览器,针对X window系统,能够支持Linux和其他类Unix操作系统。 除了PDF浏览功能外,XPDF还提供了文本提取器、PDF-to-PostScript转换器和其他实用工具。 正因为XPDF的历史比较长,所以它的界面看上去古板老气,因此注重界面效果的用户很可能不会喜欢它。 同样,可以用apt-get或yum安装方式来安装XPDF: $ sudo apt-get install xPDF 或 # yum install xPDF ? 出于和XPDF同样的原因,它的图形用户界面现在看来已经过于老气了。

    6.1K50发布于 2018-05-04
  • 来自专栏数据科学(冷冻工厂)

    Linux 下的 10 个 PDF 软件

    要在 Linux 中安装 XpdfReader PDF 阅读器,请运行: $ sudo apt install xpdf [On Debian, Ubuntu and Mint] $ sudo yum install xpdf [On RHEL/CentOS/Fedora and Rocky/AlmaLinux] $ sudo emerge -a sys-apps/xpdf [On Gentoo Linux] $ sudo apk add xpdf [On Alpine Linux] $ sudo pacman -S xpdf [ On Arch Linux] $ sudo zypper install xpdf [On OpenSUSE] 6. 它源自 Xpdf 项目,已成为许多 Linux 应用程序的首选库,提供高效的性能、广泛的格式支持以及社区的持续开发。

    3.1K10编辑于 2023-09-18
  • 来自专栏hotarugaliの技术分享

    Linux下PDF转图片

    Xpdf Xpdf 是一款 PDF 阅读器,但它也带有 pdftopng 工具,因此可以使用该工具来将 PDF 转为 png 图片: pdftopng -alpha -f <sn> -l <en> intput.pdf Poppler Poppler 是一个基于 Xpdf 的 PDF 渲染库,如果你的 Linux 发行版上没有该命令,需要安装 poppler-utils(Debian 系)或 poppler(Arch

    5.8K10编辑于 2022-02-28
  • 来自专栏智慧协同

    Ubuntu安装Swftools的方法

    安装xpdf解决中文乱码问题 sudo apt-get install xpdf

    89940发布于 2019-06-13
  • 来自专栏全栈程序员必看

    怎样免费完美的把PDF转Word?

    效果最好,样式完全一样 免费,不限页数 在线工具,手机,Windows,Mac都能用 缺点 要上传下载,需要有网络 总结 这个是目前最好的PDF转Word工具,没有之一,强烈推荐 https://xpdf.net 方便,支持手机,PC 缺点 所有OCR都没有办法做到一字不差,还是需要校对 总结 这款已经是全网最好的图片型PDF转Word工具了,没有其他更好的办法了,期待OCR技术的进一步提升吧 https://xpdf.net

    3.4K20编辑于 2022-08-24
  • 来自专栏人人都是架构师

    Go每日一库之149:PDF处理相关库

    五、PDF转图片 mupdf xpdf 1. 使用mupdf操作pdf转图片 MuPDF is a lightweight PDF, XPS, and E-book viewer. 使用xpdf操作pdf转图片 xpdf是一个免费的PDF工具包,包括文字解析,图片转换,html转换等 下载该软件包后,可以得到一系列的工具: pdfdetach pdffonts pdfimages pass -o output.pdf input.pdf 七、PDF识别 经常会遇到一些场景,比如识别一个文件是不是pdf文件,识别pdf中的文字,识别pdf中的图片等 1.识别pdf中的文字 这里使用xpdf 九、识别一个pdf文件的字体信息 有时候要使多个pdf文本字体保持一致,免不得要去分析pdf中都使用了哪些字体,这时候可以使用xpdf/pdffonts进行字体分析 $ pdffonts input.pdf 希望这些总结能够对读者有所帮助 参考: wkhtmltopdf xpdf cpdf qpdf unidoc pdflib/tet pdfwriter mupdf pdfcpu

    3.4K40编辑于 2023-10-02
  • 来自专栏Hongten

    java开发_模仿百度文库_SWFTools_源码下载

    pdf2swf.exe -t \"" + sourcePath + "\" -o \"" + destPath + "\" -s flashversion=9 -s languagedir=D:\\xpdf \\xpdf-chinese-simplified "; 93 System.out.println("命令操作:" + command + "\n开始转换..."); 94 1352107155307.pdf" -o "e:/hello/test_1352107155307_1352171476399.swf" -s flashversion=9 -s languagedir=D:\xpdf \xpdf-chinese-simplified 2 开始转换... 3 转换结束... 4 转换共耗时 :[1226]ms 5 转换文件成功!!

    69220发布于 2018-09-13
  • 来自专栏产品运营分享

    超好用的工具类网站分享,打工人必备!

    收集了各种有趣实用的 AI 工具和资源,旨在让更多人了解 AI 原理和使用 AI 提升工作效率,包括生成艺术图、生成视频和音乐、视频编辑、生成代码、生成文案等等 图片 超级PDF https://xpdf.net

    75330编辑于 2023-05-16
  • 来自专栏信数据得永生

    Matplotlib 中文用户指南 4.7 使用 LaTeX 渲染文本

    更好的解决方法需要 Poppler 或 Xpdf,可以通过将ps.usedistiller rc设置更改为xpdf来激活。

    4.7K20编辑于 2022-12-01
  • 来自专栏生信菜鸟团

    如何将pdf转换为word 2.0

    2.超级pdf网站 网址为:https://xpdf.net/pdf-to-word ? 需要先微信扫码关注公众号登录 ? 它的优点是可以识别图片型pdf,且功能丰富 ?

    3.9K40发布于 2020-06-04
  • pdf2swf用法和一些不能解决问题

    (example: pages=1-100,210-) zoom=<dpi> the resultion (default: 72) languagedir=<dir> Add an xpdf

    13000编辑于 2025-07-18
  • 3.4K star!全能PDF处理神器开源!文档转换/OCR识别一键搞定

    task_id = client.upload("年度报告.pdf").convert_to("pptx")同类项目推荐PDF.js - Mozilla出品的PDF渲染库,适合需要深度定制阅读器的开发者XPDF

    1.2K10编辑于 2025-03-03
  • 来自专栏python3

    ubuntu7.10安装到3D开启

    ----------- 解决PDF电子文档的中文乱码 sudo apt-get install xpdf-chinese-simplified xpdf-chinese-traditional ----

    2K80发布于 2020-01-10
  • 来自专栏山行AI

    AI文档智能助理都是如何处理pdf的?

    地址:https://pythonhosted.org/PyPDF2 4. xpdf 这个文本介绍了Xpdf,一个免费的PDF浏览器和工具包。

    3.3K20编辑于 2023-08-10
  • 来自专栏执笔绘倾城

    Linux 最小化安装时,是没有 tab 命令补全的,需要自己手动安装。

    rgview complete -F _filedir_xspec realplay complete -F _filedir_xspec xine complete -F _filedir_xspec xpdf

    2.7K30编辑于 2022-09-28
  • 来自专栏FreeBuf

    wholeaked:一款能够追责数据泄露的文件共享工具

    pdftotext的安装步骤如下: 1、Linux系统需要下载“Xpdf”命令行工具,下载地址:https://www.xpdfreader.com/download.html; 2、提取压缩包,并切换到

    2.1K10编辑于 2022-06-08
  • 来自专栏机器人课程与技术

    ROS1云课→18一键配置

    rosdemos_ws.zip git clone https://gitcode.net/ZhangRelay/ros_book.git 解压缩: unzip ~/rosdemos_ws.zip 安装xpdf : sudo apt install xpdf 然后融合到一起,lqros_init.sh: echo "Mission begins." \u6b63\u5728\u9009\u4e2d\u672a\u9009\u62e9\u7684\u8f6f\u4ef6\u5305 xpdf\u3002 \u6b63\u51c6\u5907\u89e3 /xpdf_3.04-1ubuntu1.1_amd64.deb ... \u6b63\u5728\u89e3\u5305 xpdf (3.04-1ubuntu1.1) ... \u6b63\u5728\u8bbe\u7f6e xpdf (3.04-1ubuntu1.1) ...

    1.1K10编辑于 2022-09-28
  • 来自专栏叨叨软件测试

    Linux 提高操作效率之 tab 命令补全

    rgview complete -F _filedir_xspec realplay complete -F _filedir_xspec xine complete -F _filedir_xspec xpdf

    3.3K30发布于 2020-04-14
领券