通过手动编辑模板文件中的MIME内容类型字符集来更正msgfmt “invalid multibyte sequence” error on a Polish text。是否有针对xgettext、msginit、msgfmt序列的命令或选项来设置MIME类型?
cat >plt.cxx <<EOF
// plt.cxx
#include <libintl.h>
#include <locale.h>
#include <iostream>
int main (){
setlocale(LC_ALL, "");
bindtextdomain("plt", ".");
textdomain( "plt");
std::cout << gettext("Invalid input. Enter a string at least 20 characters long.") << std::endl;
}
EOF
g++ -o plt plt.cxx
xgettext --package-name plt --package-version 1.2 --default-domain plt --output plt.pot plt.cxx
sed --in-place plt.pot --expression='s/CHARSET/UTF-8/'
msginit --no-translator --locale pl_PL --output-file plt_polish.po --input plt.pot
sed --in-place plt_polish.po --expression='/#: /,$ s/""/"Nieprawidłowo wprowadzone dane. Wprowadź ciąg przynajmniej 20 znaków."/'
mkdir --parents ./pl_PL.utf8/LC_MESSAGES
msgfmt --check --verbose --output-file ./pl_PL.utf8/LC_MESSAGES/plt.mo plt_polish.po
LANGUAGE=pl_PL.utf8 ./plt发布于 2010-09-25 08:19:58
只需提供完整的语言环境名称,msginit就可以正确设置字符集
msginit --no-translator --input=xx.pot --locale=ru_RU.UTF-8结果:
"Language: ru\n"
"Content-Type: text/plain; charset=UTF-8\n"发布于 2009-07-23 15:28:49
直接设置输出字符编码没有参数,但实际上这应该不是问题,因为您的PO编辑器在保存PO文件(支持翻译中使用的所有字符)时会自动使用适当的字符编码,并将文件中的CHARSET替换为编码的名称。如果没有,就提交一个bug。
唯一的问题是POT文件是否包含非ASCII字符,但是xgettext确实有一个--from-code参数来指定输入文件的编码。如果输入包含非ASCII字符,并且--from-code设置为正确的编码,则输出POT文件的字符编码将设置为UTF-8 (这不必等于输入字符编码)。但是,如果输入文件只包含ASCII字符,则--from-code=UTF-8将不起作用。
事实上,msginit会自动将字符编码设置为与所选目标语言环境相“合适”的内容。但是,区域设置到字符编码对的列表似乎过时了;UTF-8现在确实是所有语言的最佳选择。
另一种方法是使用pot2po而不是msginit。这始终自动使用UTF-8,AFAICS。但是,与msginit不同的是,它不会自动填写PO文件的复数形式,这可能是问题,也可能不是问题(有些人认为这是PO编辑器的工作)。
https://stackoverflow.com/questions/1084191
复制相似问题