首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在R中读取arff文件

在R中读取arff文件
EN

Stack Overflow用户
提问于 2012-03-31 00:12:09
回答 3查看 2.9K关注 0票数 2

我想使用R从带有Amazon评论的UCI中阅读一个数据集。

数据集的格式为ARFF (.arff)。

我使用以下脚本:

代码语言:javascript
复制
require("foreign")
setwd("H:/DataSet/amazon")
reviews <- read.arff("amazon.arff")

我得到了以下错误

Read.arff中的错误(“amazon.arff”):无效的属性规范。

谢谢你的帮助。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-03-31 11:28:09

我想您是指UCI机器学习库中的"Amazon评论集数据集“。就连Weka也不能打开这个数据集,他说

"...not被识别为'Arff数据文件‘文件。.属性名并不是唯一的。“

如果您查看该文件,就会看到许多类似于

代码语言:javascript
复制
@attribute '\'\'\'\'\'\'\'\'\'\'r\'\'\'\'\'\'\'\'\'\'\'' numeric

所以文件出了问题,这不是R或任何“Arff”读取例程的错误。您应该询问dataset创建者,该创建者的名称和电子邮件地址都提供在描述页上。

票数 4
EN

Stack Overflow用户

发布于 2015-04-29 16:13:30

我找到了让Weka打开.arff文件的解决方案。

无法确定结构为arff (原因: java.lang.illegalArgumentException:属性名不是唯一的!)原因:不‘我’类‘))。

它不是类似于@attribute "'\'\'\'\'\'\'\'\'\'\'r\'\'\'\'\'\'\'\'\'\'\'‘数值的属性“。

如果您在文本编辑器中打开arff文件(我使用了TextMate),您将找到罪魁祸首。(在文本伴侣中,他们显示< NUL >)

  • @ g_b数字@属性T数值@属性@数字@属性T数值@属性rne数值@属性T数值@属性T数值

您可以使用control搜索'I‘'T’和'Th‘的属性,但是为了加快搜索速度,这里有3个易于搜索的属性,它们接近问题站点。

我要搜索“t_wo”,

“Th”搜索“ff_”

对于'T‘搜索'x_’(这个属性将在上面)

您不能简单地删除它们,因为无法知道哪些数字适用,所以我建议将它们重命名为T2-4,I2-4 Th2-4。还需要将属性“class”重命名为“class1”

票数 2
EN

Stack Overflow用户

发布于 2019-05-05 18:53:03

在您的特殊情况下,dataset有一些问题,我无法读取它。

不确定它是否有用,但是如果您想使用R读取.arff文件,则可以使用RWeka包来完成另一种方法。

包有一些依赖关系: rJava (注1)和RWekajars。

然后,通过使用以下脚本,您将能够读取数据集(注2):

代码语言:javascript
复制
library(rJava)
library("RWeka")
x <- read.arff(file= "amazon.arff")

我还没有对您的数据集进行专门的尝试(由于数据集的问题),但是在使用iris.arff数据集时,它运行得很好(当然,需要更改文件的名称)。

Notes

  1. 如果您在rJava包中有任何错误,我对另一个问题的回答可能对你有帮助。
  2. 确保在文件所在的文件夹中运行脚本。一种方法是在RStudio中创建一个新项目,将数据集保存在项目的目录中,然后运行所需的脚本。
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9951839

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档