如下面的链接所述,Geospark采用CSV或Tab分隔格式的数据。我们可以从HDFS获取数据,将其转换为CSV,并将其传递给Geospark进行处理。
我们能直接在HDFS上使用Geospark并进行处理吗?
https://github.com/DataSystemsLab/GeoSpark
GeoSpark支持逗号分隔值(CSV)或标签分隔值(TSV)作为输入格式。当调用构造函数时,用户只需要将输入格式指定为Splitter,空间信息的开始列以一个元组作为偏移量。
发布于 2016-08-30 00:30:59
是。您可以使用GeoSpark来完成它。GeoSpark支持与Apache相同的数据源。在格式上,GeoSpark支持CSV、TSV、WKT和GeoJSON。
https://stackoverflow.com/questions/36691177
复制相似问题