首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在PDF中查找单词

在PDF中查找单词
EN

Stack Overflow用户
提问于 2019-03-27 04:21:13
回答 2查看 2K关注 0票数 0

我想找到一些词后,转换PDF。

1)我在C路有2份PDF:\TRM\PDF 1.pdf和2.pdf

  • 1.pdf有单词"ICG00058“
  • 2.pdf有单词"ICG00065“

2)已将Pdf转换为${detail_1}的Txt。

3)假设,我不知道1.pdf中的单词,我想检查1.pdf是否有ICG00058或ICG00065。

很抱歉,如果问题不清楚的话。请为我调查这个问题,因为这对我的工作至关重要。

代码语言:javascript
复制
*** Settings ***
Library         Selenium2Library
Library         String
Library         Pdf2TextLibrary


*** Test Cases ***
Read PDF

    ${detail_1}     Convert Pdf To Txt              C:\\TRM\\PDF\\1.pdf
    LOG     ${detail_1} 
    ${ID_1}     Get Regexp Matches        ${detail_1}          ICG00058
    ${ID_2}     Get Regexp Matches        ${detail_1}          ICG00065
 Run Keyword And Ignore Error          $ID_1[0] in $detail_1      LOG   ${ID_1}
 Run Keyword If                        $ID_2[0] in $detail_1      LOG   ${ID_2}

错误:计算表达式'RF_VAR_ID_2 0 in RF_VAR_detail_2‘失败: IndexError:超出范围的列表索引

EN

回答 2

Stack Overflow用户

发布于 2019-03-27 04:46:06

如果您想要在机器人脚本中运行python,则需要调用评估关键字,这就是您看到所提到的错误的原因。

但是,在您的情况下,您可以使用从列表中获取索引列表应该包含值关键字:

代码语言:javascript
复制
${matched_id_1}=    Get Index From List     ${ID_1}     0
Run Keyword And Ignore Error    List Should Contain Value    ${detail_1}    ${matched_id_1}

${matched_id_2}=    Get Index From List     ${ID_2}     0
Run Keyword And Ignore Error    List Should Contain Value    ${detail_1}    ${matched_id_2}

如果要将List Should Contain Value关键字用作断言,只需删除答案中的运行关键字并忽略错误关键字即可。

票数 0
EN

Stack Overflow用户

发布于 2019-03-27 04:51:23

我使用pdfgrep,就像grep一样,您可以在pdf中搜索regex表达式,而无需任何中间步骤。

我使用它在pdfs中查找ISBN数字,并自动重命名文件名以包含找到的ISBN,或者将文件名和ISBN写入MySQL数据库。

如果您不知道如何编写regex,那么就有一些在线工具可以在线测试regex,直到找到合适的工具才能使用。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55369767

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档