首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >重转换txt文件(从Windows到Unix)

重转换txt文件(从Windows到Unix)
EN

Stack Overflow用户
提问于 2017-05-10 01:11:49
回答 1查看 38关注 0票数 0

我的大学项目是用Java编写的,从Twitter上获取推文并对其进行分析。

在第一阶段,我使用tweet;我必须在Windows机器上这样做,在我把它放到我的Linux服务器程序上之后,我用它来分析带有用户反馈系统的tweet。

当我在Linux机器上打开txt文件时,它会问我是否想在UTF-8中进行转换,然后单击“是”。但是,由于这种操作,有些特殊字符的格式不正确。如果我试图以原始格式(可能是CP1252)重新转换,它会返回一个由特殊字符引起的错误。

我知道不可能重新转换这些字符,因为任何特殊字符都是它们可能是的字符的总和,但是我可以使用一种文本预测字符来重写该字符?

例如,如果我有because,而e是一个特殊的字符,我看到这个词类似于这个becaus?,如果我删除了?字符,我如何重新放置e?我试过使用Word,但是txt太大了,因此这个问题有大量的单词,而对于Word,您必须手动检查每个单词。

EN

回答 1

Stack Overflow用户

发布于 2017-05-10 01:25:10

您应该使用dos2unix将文件更改为linux格式。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43882087

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档