首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >西里尔字母使用model.matrix编码错误

西里尔字母使用model.matrix编码错误
EN

Stack Overflow用户
提问于 2019-07-01 15:29:16
回答 1查看 39关注 0票数 0

我有一个数据框,其中的列名和值都包含西里尔字母(俄文),需要使用model.matrix进行转换。

model.matrix将这些变量转换为unicode字符,例如。有没有办法将它们转换回来,或者从一开始就避免转换?

代码语言:javascript
复制
library(tibble)
x <- tribble(~"тест", ~value1, ~value2,
         "тест", 5, 10,
         "тест2", 6, 11)
m <- model.matrix(value1 ~ ., data = x)

预期的结果是一个包含UTF8格式字符的model.matrix。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-07-02 15:41:06

使用stringi解决了该问题

代码语言:javascript
复制
library(stringi)
colnames(m) <- stri_unescape_unicode(gsub("<U\\+(....)>",
                                    "\\\\u\\1",
                                    colnames(m)))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56831568

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档