首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >阅读网站来源:�characters

阅读网站来源:�characters
EN

Stack Overflow用户
提问于 2013-03-20 08:38:55
回答 1查看 129关注 0票数 0

我试图从浏览器中读取源代码,但是当代码包含ã,á,à,ó这样的字符时,我得到的是�。

我尝试在读取行上应用java.nio.Charset.encode,但是没有结果:同样的事情也发生了。

我的代码是:

代码语言:javascript
复制
URLConnection connection = ...;
BufferedReader reader = new BufferedReader(connection.getInputStream());
String s = null;

while ((s = reader.readLine()) != null) {
  // got new source line...
}

我正在尝试阅读的网站是this one (PT-BR)。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-20 08:44:12

根据meta标记,该页面上的字符集是ISO-8859-1。尝试使用:

代码语言:javascript
复制
Scanner scanner = new Scanner(connection.getInputStream(), "ISO-8859-1");
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15513189

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档