我制作了一个电报机器人,在Ubuntu上的Google服务器上启动了它。但俄语中的机器人(西里尔语)在编码上存在问题。
用于机器人的文本工作者的配置保存在UTF-8中,用于RU的语言包安装在服务器上。
有人怀疑,在服务器上,文件中的编码中断了,google云服务器的问题与机器人有关,而不是与机器人有关。有什么问题吗?

发布于 2020-12-23 23:53:38
从图片上看,我无法验证单个字节的十六进制值,但这看起来可能实际上是UTF-8被错误地解释为其他东西。
也许有些东西发送了错误的元数据,比如将字符集指定为一些遗留的8位字符集,而接收方会相信这一点,而不是自动检测它为UTF-8?
或者字符集没有在某些配置文件中指定,不管是什么创建元数据(例如HTTP服务器输出的Content标头中的字符集)都会应用一些旧的愚蠢的默认值,比如ISO-8859-1?
https://serverfault.com/questions/1047196
复制相似问题