首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从命令行使用cTAKES?

如何从命令行使用cTAKES?
EN

Stack Overflow用户
提问于 2015-10-04 23:40:51
回答 2查看 3.2K关注 0票数 5

我想知道如何从命令行使用Apache cTAKES

例如:

  • 我有一个note.txt文件,其中包含了一些文字,比如“病人血糖升高,但检测证实没有糖尿病。病人的父亲患有成人糖尿病。”
  • 我想使用提供的分析引擎\apache-ctakes-3.2.2-bin\apache-ctakes-3.2.2\desc\ctakes-clinical-pipeline\desc\analysis_engine\AggregatePlaintextUMLSProcessor.xml

我怎样才能得到分析引擎的输出(即。使用命令行(即不使用图形用户界面,如UIMA、CAS、Visual或集合处理引擎)?我更喜欢使用提供的JAR文件,而不是编译代码。

这个问题很简单,但我在cTAKES自述汇合点上找不到这些信息。

EN

回答 2

Stack Overflow用户

发布于 2015-10-07 03:38:16

请尝试以下步骤从命令行使用cTAKES CPE (键类为"org.apache.uima.examples.cpe.SimpleRunCPE"):

  1. 将目录更改为$CTAKES_HOME/desc/ctakes-clinical-pipeline/desc/collection_processing_engine/
  2. 将test_plaintext.xml复制到另一个文件(例如,"test_plaintext_test.xml")。
  3. 编辑"test_plaintext_test.xml“以设置输入目录;找到名称= "InputDirectory”的"nameValuePair“,并将值字符串设置为输入目录。下面的示例将输入目录设置为"$CTAKES_HOME/note_ input ": InputDirectory note_input
  4. 同样,编辑"test_plaintext_test.xml“以设置输出目录(以下示例中的”$CTAKES_HOME/result_ output“): OutputDirectory result_output
  5. 保存"test_plaintext_test.xml“并将目录更改为$CTAKES/bin。
  6. 将runctakesCPE.sh复制到另一个文件(例如,"runctakesCPE_CLI.sh")。
  7. 编辑"runctakesCPE_CLI.sh";替换最后一行("java .“)下面一行("USER“和"PW”应替换为您的UMLS用户名和密码,内存设置Xms和Xms可根据计算机上的内存大小进行调整): $CTAKES_HOME/lib/*:$CTAKES_HOME/desc/:$CTAKES_HOME/resources/ -Dlog4j.configuration=file:$CTAKES_HOME/config/log4j.xml $CTAKES_HOME/desc/ctakes-clinical-pipeline/desc/collection_processing_engine/test_plaintext_test.xml -Dctakes.umlsuser=USER -Dctakes.umlspw=PW -cp -Xms2g -Xmx3g org.apache.uima.examples.cpe.SimpleRunCPE
  8. 保存"runctakesCPE_CLI.sh",然后创建输入目录("$CTAKES_HOME/note_ input ")和输出目录("$CTAKES_HOME/result_ output ")。
  9. 将您的note.txt放到输入目录(例如,"$CTAKES_HOME/note_ input /note.txt"),然后运行"runctakesCPE_CLI.sh“。
  10. cTAKES CPE将在命令行模式下开始运行,生成的文件将在输出目录中生成(例如,"$CTAKES_HOME/result_ output /note.txt.xml")。

实际上,我使用您的note.txt来运行上面的步骤,下面是生成的note.txt.xml的前几行:

代码语言:javascript
复制
    <?xml version="1.0" encoding="UTF-8"?><CAS version="2">
        <uima.cas.Sofa _indexed="0" _id="3" sofaNum="1" sofaID="_InitialView" mimeType="text" sofaString="Patient had elevated blood sugar but tests confirm no diabetes. Patient's father had adult onset diabetes.&#10;"/>
        <org.apache.ctakes.typesystem.type.structured.DocumentID _indexed="1" _id="1" documentID="note.txt"/>
        <uima.tcas.DocumentAnnotation _indexed="1" _id="10" _ref_sofa="3" begin="0" end="107" language="x-unspecified"/>
        <org.apache.ctakes.typesystem.type.textspan.Segment _indexed="1" _id="15" _ref_sofa="3" begin="0" end="107" id="SIMPLE_SEGMENT"/>
        <org.apache.ctakes.typesystem.type.textspan.Sentence _indexed="1" _id="21" _ref_sofa="3" begin="0" end="63" sentenceNumber="0"/>

希望这会有所帮助:)

票数 6
EN

Stack Overflow用户

发布于 2017-06-13 08:32:51

java -Dctakes.umlsuser=USER -Dctakes.umlspw=PW -cp $CTAKES_HOME/lib/*;$CTAKES_HOME/desc/;$CTAKES_HOME/resources‌​/ - Dlog4j.configuration=file:$CTAKES_HOME/config/log4j.xml -Xms2g -Xmx3g to_replace $CTAKES_HOME/desc/ctakes-clinical-pipeline/desc/collection_p‌​rocessing_engine/tes‌​t_plaintext_test.xml

将"to_replace“替换为

org.apache.ctakes.ytex.tools.RunCPE or org.apache.ctakes.core.cpe.CmdLineCpeRunner

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32939527

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档