d、选择GREL(谷歌优化表达语言)转换日期。 ? # 原始数据 Wed May 21 00:00:00 EDT 2008 # 修改后数据 2008-05-21T00:00:00Z # 使用GREL语句 substring(value, 4, 10) 用一句GREL表达式处理数据,提取出city_state_zip中的城市名。 '''表达式解析''' value.match("(.*?) CA.*?") 另外,在OpenRefine里GREL语法是比较重要的,也是一种编程语言,具体语法请查看GREL-Functions Github地址:https://github.com/OpenRefine/OpenRefine /wiki/GREL-Functions 【完】
我们还是希望拆分它们,在下文“用正则表达式与GREL清理数据”中,我们将看到如何提取这些信息。交易价格也有缺失—我们将在“估算缺失值”中估算这些价格。 1. 举个例子,如果文本数据的格式类似2008-05-21这样,我们只需调用GREL(Google Refine Expression Language)的.toDate()方法,OpenRefine会替我们转换好 在打开的窗口中,使用GREL转换日期: ? 这里的value变量代表选中列(sale_date)中每个单元格的值。 04 使用正则表达式与GREL清理数据 清理并准备使用数据时,可能需要从文本字段中提取一些信息。有些时候,我们只需要用些分隔符将文本字段拆开。