我花了一些时间在谷歌上搜索,但找不到任何有用的东西。
如何在脚本中选择OpenRefine中单个列的所有值
似乎所有的操作都是逐行的。
尤其是,我希望在列中找到最高值和最低值。
发布于 2015-10-27 13:50:44
facet将给出列中所有值的列表,因此获取列中最低/最高值的最简单方法是在列上创建一个方面,并查看得到的方面中的最高/最低值以得到答案。
但是,我不确定这是否符合“在脚本中”选择值的标准。这里我假设您的意思是您希望能够访问GREL表达式中的最低/最高值?
您可以这样做,但您必须强制OpenRefine将项目中的所有行作为单个记录的一部分。最简单的方法通常是在项目开始时添加一个列,除了第一个包含值的单元格之外,该列是空的。
完成此操作后,可以使用如下语法访问列中的所有值:
row.record.cells["Column name"].value还请参阅我对OpenRefine -在单元格之间填充,但不在列表末尾的回答,它使用了相同的技术
进一步解释:

此时,使用像row.record.cells“列1”这样的语法,.value将为您提供“列1”中所有值的数组。然后,您可以使用GREL表达式来操作它--包括排序或比较值。
发布于 2015-10-27 13:52:15
默认情况下,OpenRefine功能对计算是有限的。统计扩展使每个列都有基本的统计数据(最小、最大、平均、中等.)。
发布于 2015-10-28 15:12:23
文本方面有一个很好的无文档选项,可以为您提供一个可以复制和粘贴的列中的聚合结果。
(如果您只想获取单个列的所有值,那么请使用Exporter ->自定义表格导出程序,然后单击复选框选择“选择并命令列导出”,然后单击“下载”选项卡选择导出格式,然后单击“下载”按钮。)


https://stackoverflow.com/questions/33367804
复制相似问题