似乎我的数据库中有一些以UTF-8格式存储的西里尔字符串。但是,我需要使用R恢复西里尔文。
例如,在数据库中,它存储为:"õÆ¿ª®Ï"。我需要的是Москва。
我尝试了一些使用iconv的东西,但不确定是否需要首先对字符串进行双重转换:
1. iconv(x, "UTF-8", "CP1251") # I get NA
2. iconv(x, "CP1251", "UTF-8") # I get ûûû \"òƸл°¸»ª¿-õƸƺ±Ð\"我假设我需要首先将字符串从UTF-8恢复为西里尔字母,但我得到的是NA。
感谢您的帮助
发布于 2017-12-21 22:43:20
enc2native和enc2utf8将字符向量的元素分别转换为本机编码或UTF8,并将任何标记的编码都考虑在内。它们是原始函数,旨在进行最小限度的复制。
https://stackoverflow.com/questions/47921870
复制相似问题