我正在尝试读取一个包含乌尔都语数据的文件。当我在Notepad++中查看文件时,它有乌尔都语中的数据。但是,当我在eclipse中查看它时,它会显示某种类型的编码(可能是它有一些缺省值)。
原始乌尔都语数据(Notepad++):
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے فی کلو ہوگیا","Entertainment"日食:
"10","کراچی میں ٹماٹر Ú©ÛŒ قیمت میں کمی،25روپے Ù�ÛŒ کلو Û�وگیا","Entertainment"现在,这是奇怪的,在默认情况下,会发生一些编码。我是否可以获得原始形式的数据,以便在对其进行一些处理并将其写入文件中时,我希望以原始的乌尔都语形式处理数据,而不是任何编码。
这是密码。
public class DataProcessing {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
DataProcessing dataProcessingObj = new DataProcessing();
dataProcessingObj.readDataFromFile("small_dataset.txt");
}
private void readDataFromFile(String fileName)
{
BufferedReader br = null;
try{
br = new BufferedReader(new FileReader(fileName));
String line = "";
while( (line = br.readLine()) != null )
{
System.out.println(line);
}
}
catch(Exception ex){
ex.printStackTrace();
}
}
}如果你能帮我,我会感谢你的。
发布于 2016-10-27 19:10:33
不要使用FileReader/FileWriter,因为它们是使用默认平台编码的旧实用程序类。您希望指定编码,可以是UTF-8,也可以是Windows-1256。(Notepad++将显示正确的编码。)
private void readDataFromFile(String fileName)
{
Path path = Paths.get(fileName);
Charset charset = StandardCharsets.UTF_8;
try (BufferedReader br = Files.newBufferedReader(path, charset)) {
String line;
while( (line = br.readLine()) != null )
{
System.out.println(line);
}
}
catch(Exception ex) {
ex.printStackTrace();
}
}或者在java 8中:
private void readDataFromFile(String fileName) throws IOException
{
Path path = Paths.get(fileName);
Charset charset = Charset.forName("Window-1256");
Files.lines(path, charset).forEach(System.out::println);
}https://stackoverflow.com/questions/40292056
复制相似问题