我有一个数据框,其中的列名和值都包含西里尔字母(俄文),需要使用model.matrix进行转换。
model.matrix将这些变量转换为unicode字符,例如。有没有办法将它们转换回来,或者从一开始就避免转换?
library(tibble)
x <- tribble(~"тест", ~value1, ~value2,
"тест", 5, 10,
"тест2", 6, 11)
m <- model.matrix(value1 ~ ., data = x)预期的结果是一个包含UTF8格式字符的model.matrix。
发布于 2019-07-02 15:41:06
使用stringi解决了该问题
library(stringi)
colnames(m) <- stri_unescape_unicode(gsub("<U\\+(....)>",
"\\\\u\\1",
colnames(m)))https://stackoverflow.com/questions/56831568
复制相似问题