首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如果文件编码为utf-16le,则获取垃圾字符

如果文件编码为utf-16le,则获取垃圾字符
EN

Stack Overflow用户
提问于 2021-01-07 16:19:57
回答 1查看 44关注 0票数 0

用于编码为utf-16le的csv文件。当我尝试读取csv的数据时,它会显示垃圾字符

要获得文件编码,我使用以下命令

代码语言:javascript
复制
 file -bi test.csv

它为我提供text/plain;charset=utf-16le

要读取文件数据,请使用以下命令

代码语言:javascript
复制
head -n1 test.csv | tr '^' ','

它给我提供了Colon1,colon2,colon3,��

为什么它给了我垃圾字母表

EN

回答 1

Stack Overflow用户

发布于 2021-01-07 18:32:25

由于csv文件采用UTF-16LE编码,因此文件以BOM (字节顺序标记)、0xff和0xfe开头。您可以使用以下命令来标识它:

代码语言:javascript
复制
head -n1 test.csv | xxd

现在最常用的是UTF-8,而UTF-16则越来越少使用(包括Windows)。您的区域设置也将默认为UTF-8。因此,请尝试:

代码语言:javascript
复制
iconv -f UTF-16LE -t UTF-8 test.csv | head -n1 | tr '^' ','

它将csv文件转换为UTF-8编码。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65608828

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档