我有一个有编号的单词文档,例如1 ,2,等等。我想从文档中提取句子。我使用斯坦福CoreNLP 4.0.0和StanfordCorenlpModels-current.jar语句的正常提取,将数字检索为不同的句子。假设文档
句子抽取1作为句子,Abcd efgh作为另一句。
同样,2作为一个句子和Ijkl mnop作为另一个句子。
我尝试使用具有不同模式的boundariesToDiscard属性,但得到相同的结果,并且在本例中得到错误的实体提及。
请帮助解决这个问题。
提前谢谢。
发布于 2020-07-15 08:25:26
我解决了问题。我只是设置了以下属性
props.setProperty("ssplit.eolonly", "true");https://stackoverflow.com/questions/62499708
复制相似问题