首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >正确显示(抛光)字符

正确显示(抛光)字符
EN

Stack Overflow用户
提问于 2015-06-14 13:20:22
回答 1查看 4.5K关注 0票数 7

我正在阅读一个xml文件,其中包含德语、法语、西班牙语、英语和波兰语文本。

为了处理波兰的信件(这造成了最大的麻烦),我试着这样做:

代码语言:javascript
复制
File file = new File(path);
InputStream is = new FileInputStream(file);
Reader reader = new InputStreamReader(is, charset);

InputSource src = new InputSource(reader);
src.setEncoding(charset.name());

SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser saxParser = factory.newSAXParser();

saxParser.parse(src, handler);

我遇到的问题是,默认字符集中没有一个正确显示文本。其中有些有问题标记,有些则有其他字符的组合,例如Ö。

为了将其分解,我编写了另一个代码片段来测试哪个字符集工作:

代码语言:javascript
复制
public static void main(String[] args){
        Charset charset = StandardCharsets.UTF_8;
        String chars = "śłuna długie";
        System.out.println(new String(chars.getBytes(charset), charset));
}

又一次测试了每一个,但都没有用。我希望你有个主意。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-06-14 14:48:57

我的解决方案:更改ide的编码

我使用了我的ide (intellij)的默认编码,它是"windows-1252",因为我在这台pc上使用windows。

所以我把它改成了UTF-8,这个简短的测试代码对我来说很好。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30829866

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档