我正在使用tm包来清理Twitter语料库。然而,该软件包无法清除表情符号。
下面是一个复制的代码:
July4th_clean <- tm_map(July4th_clean, content_transformer(tolower))
Error in FUN(content(x), ...) : invalid input 'RT ElleJohnson Love of country is encircling the globes ������������������ july4thweekend July4th FourthOfJuly IndependenceDay NotAvailableOnIn' in 'utf8towcs'有人能指出正确的方向来删除使用tm包的表情符号吗?
谢谢,
路易斯
发布于 2017-07-03 22:21:07
https://stackoverflow.com/questions/44893354
复制相似问题