首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用java读取Urdu文件

用java读取Urdu文件
EN

Stack Overflow用户
提问于 2016-10-27 18:48:47
回答 1查看 999关注 0票数 4

我正在尝试读取一个包含乌尔都语数据的文件。当我在Notepad++中查看文件时,它有乌尔都语中的数据。但是,当我在eclipse中查看它时,它会显示某种类型的编码(可能是它有一些缺省值)。

原始乌尔都语数据(Notepad++):

代码语言:javascript
复制
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے فی کلو ہوگیا","Entertainment"

日食:

代码语言:javascript
复制
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے �ی کلو �وگیا","Entertainment"

现在,这是奇怪的,在默认情况下,会发生一些编码。我是否可以获得原始形式的数据,以便在对其进行一些处理并将其写入文件中时,我希望以原始的乌尔都语形式处理数据,而不是任何编码。

这是密码。

代码语言:javascript
复制
public class DataProcessing {

    /**
     * @param args
     */
    public static void main(String[] args) {
        // TODO Auto-generated method stub
        DataProcessing dataProcessingObj = new DataProcessing();
        dataProcessingObj.readDataFromFile("small_dataset.txt");
    }

    private void readDataFromFile(String fileName)
    {
        BufferedReader  br = null;
        try{
            br = new BufferedReader(new FileReader(fileName));
            String line = "";
            while( (line = br.readLine()) != null )
            {
                System.out.println(line);
            }
        }
        catch(Exception ex){
            ex.printStackTrace();
        }
    }
}

如果你能帮我,我会感谢你的。

EN

回答 1

Stack Overflow用户

发布于 2016-10-27 19:10:33

不要使用FileReader/FileWriter,因为它们是使用默认平台编码的旧实用程序类。您希望指定编码,可以是UTF-8,也可以是Windows-1256。(Notepad++将显示正确的编码。)

代码语言:javascript
复制
private void readDataFromFile(String fileName)
{
    Path path = Paths.get(fileName);
    Charset charset = StandardCharsets.UTF_8;
    try (BufferedReader br = Files.newBufferedReader(path, charset)) {
        String line;
        while( (line = br.readLine()) != null )
        {
            System.out.println(line);
        }
    }
    catch(Exception ex) {
        ex.printStackTrace();
    }
}

或者在java 8中:

代码语言:javascript
复制
private void readDataFromFile(String fileName) throws IOException
{
    Path path = Paths.get(fileName);
    Charset charset = Charset.forName("Window-1256");
    Files.lines(path, charset).forEach(System.out::println);
}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40292056

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档