我想使用LSAfun包中的genericSummary函数。这是一个德语示例文本。
library("LSAfun")
text = " Gegen die Firma wurde während der letzten Woche ein Zwangsvollstreckungsverfahren eingeleitet. Darüber witzeln die Konkurrenten."我的文本编码是"UTF-8“。实际上,这个示例文本的编码是"latin1“。因此,我转换为utf8
text = enc2utf8(text)当我打电话的时候
genericSummary(text, k=2)我得到以下错误:
Error in FUN(X[[i]], ...) :
[lsa] - could not open file C:\Users\MA\AppData\Local\Temp\RtmpcRnDPw\file16c81a35d06/sentence1.txt due to encoding problems of the file.有人知道怎么解决这个问题吗?
发布于 2018-02-26 16:54:20
也有同样的问题。看起来像'ü‘和'ä’这样的特殊字符是这里的原因。通过将它们替换为“ue”和“ae”,编码将起作用。
试试这个: genericSummary(text,k=2,language=“德语”,breakdown=T)
细分选项将完成此工作,另请参阅此功能的R-help。
亲切的问候,迈克尔。
https://stackoverflow.com/questions/47071621
复制相似问题