首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将txt文件导入到mallet时出错

将txt文件导入到mallet时出错
EN

Stack Overflow用户
提问于 2014-01-29 05:59:02
回答 1查看 425关注 0票数 0

我在把一些txt文件转换成mallet时遇到了麻烦。我一直在想:

线程"main“java.lang.IllegalStateException异常:第39843行与正则表达式不匹配:

Line#39843上写道: 24393584 |标题验证extremities.The多伦多肢体挽救评分(TESS)问卷中丹麦版的
肉瘤患者多伦多肢体挽救评分问卷TESS是一份自我管理的问卷,旨在评估接受过肢体手术的患者的身体残疾。这项研究的目的是验证“TESS”的丹麦译本。《TESS》是根据国际准则翻译的。共有22名参加常规门诊控制计划的连续患者被招募进行研究。为了测试他们对问卷的理解,他们被要求描述TESS中随机选择的五个问题的含义。对TESS丹麦版的心理测量学特性进行了效度和信度检验。为了评估测试的可靠性,患者在完成第一份TESS问卷一周后额外填写了一份TESS问卷。患者对问卷的理解程度较好。由Cronbach's alpha测量的上、下两份问卷具有良好的内部一致性。BlandAltman图显示,在测试中,两份问卷的一致性都是可接受的。两份问卷的组内相关系数也都很好。TESS与QLQC30比较,上肢和下肢的效度分别为0.89和0.90。丹麦TESS的心理测量学特性显示出良好的效度和信度。与relevant.not无关。

很多行都会发生这种情况,当我删除该行时,文件的其余部分就会导入到mallet中。这一行中的哪个正则表达式可能是问题所在?

谢谢,Priya

EN

回答 1

Stack Overflow用户

发布于 2014-04-03 17:30:28

由于糟糕的编程,Mallet在处理某些机器符号方面存在问题。尝试运行

代码语言:javascript
复制
tr -dc [:alnum:][\ ,.]\\n < ./inputfile.txt > ./inputfilefixed.txt

在运行mallet之前。这将删除所有非字母数字符号,这通常会为我解决问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21417809

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档