我不知道该如何处理这个编码。我得到了这个文件中最常见的5k个俄文单词,数据如下:
1 36358.94 Ë misc
2 27792.36 ‚ prep
3 20689.51 ÌÂ misc
4 18942.62 ÓÌ pron
5 16588.14 ̇ prep
6 15631.11 ˇ pron
7 12546.08 ˜ÚÓ misc...我知道每一行的第三个单词是西里尔字母,但是我不知道如何把这些字符转换成西里尔字母。如果有人能帮忙,那就太好了。
发布于 2016-03-11 21:58:17
您可以尝试windows-1251编码,它应该会有所帮助。
https://stackoverflow.com/questions/35950539
复制相似问题