首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >字符串中的其他空格已使用FileInputStream将文本文件读取为字符串

字符串中的其他空格已使用FileInputStream将文本文件读取为字符串
EN

Stack Overflow用户
提问于 2010-05-08 08:13:02
回答 1查看 411关注 0票数 0

我正在尝试将一个文本文件读入一个字符串变量。文本文件有多行。打印字符串以测试“读入”代码后,每个字符之间有一个额外的空格。当我使用字符串来生成字符二元语法时,空格使样本文本变得无用。代码是

代码语言:javascript
复制
try {
  FileInputStream fstream = new FileInputStream(textfile);   
  DataInputStream in = new DataInputStream(fstream);     
  BufferedReader br = new BufferedReader(new InputStreamReader(in));

  //Read corpus file line-by-line, concatenating each line to the String "corpus"
  while ((strLine = br.readLine()) != null) {
    corpus = (corpus.concat(strLine));    
  }

  in.close();    //Close the input stream  
}
catch (Exception e) { //Catch exception if any
  System.err.println("Error test check: " + e.getMessage());
}

如果有任何建议,我将不胜感激。

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2010-11-18 05:41:55

您的文本文件可能采用UTF-16 (Unicode)编码。UTF-16需要两个或四个字节来表示每个字符。对于大多数西方文本文件,“中间”字节是不可打印的,看起来像空格。

您可以使用second argument of InputStreamReader指定编码。

或者,修改文本文件(在Unix上为图标,另存为..Windows记事本中的对话框):

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2792387

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档