首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从PDF中,从命令行中提取带有页码的突出显示。

从PDF中,从命令行中提取带有页码的突出显示。
EN

Stack Overflow用户
提问于 2022-07-04 18:22:30
回答 1查看 54关注 0票数 0

有没有办法从PDF中从命令行中提取带有相应页码的突出显示段落?我找到了两个工具,但它们并不完全符合我的需要:pdf-高光-提取器允许我提取带有页码的突出段落,但它没有命令行界面,只有图形界面。DyAnnotationExtractor有一个命令行界面,但只给我突出显示的段落,而不是页码。有什么工具能满足我的需要吗?顺便说一下,我在Linux上。

提前感谢您的帮助!

EN

回答 1

Stack Overflow用户

发布于 2022-11-15 12:39:56

我推荐使用漂亮的小Python库帕夫诺茨,它具有您正在寻找的功能。

代码语言:javascript
复制
$ pdfannots document.pdf

如果与其他一些Bash命令相结合,它可以生成格式良好的输出。例如:

代码语言:javascript
复制
$ pdfannots document.pdf --no-condense | \
# Removing duplicate lines:
cat -n | sort -uk2 | sort -nk1 | cut -f2- | \
# Improving output formatting:
awk '{$1=$1};1' | sed 's/^\(> \)//g' | sed 's/* Page #/\n&/'
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72860724

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档