在前面的问题和我的问题的答案中找不到正确的答案: 1.我有一个2.3 GB的csv文件,其中包含240万行希伯来语文本,目前以ASCII编码。既然我们讨论的是大文件,那么fread会更好,但是编码呢?你知道如何读取用ASCII编码的csv文件以避免著名的"embedded nul in string“错误吗?
谢谢
发布于 2015-10-16 22:08:17
自8月25日起,case linked by David Arenburg已关闭,该功能已包含在当前可用的data.table版本中。现在可以在调用fread时使用编码参数:
text <- fread(file, encoding = 'UTF-8')ASCII不是显式编码选项,但ASCII是有效的UTF-8,因此当您想要读取希伯来语文本时,可以指定UTF-8。
https://stackoverflow.com/questions/29939478
复制相似问题