首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >MemSQL火花作业

MemSQL火花作业
EN

Stack Overflow用户
提问于 2015-12-10 21:30:09
回答 1查看 366关注 0票数 2

我正在尝试使用MemSQL抽取器在Spark作业中读取一个CSV文件,并使用转换器进行一些充实,并使用Java加载到MemSQL数据库。

我看到了memsql火花接口jar,但没有找到任何有用的Java文档或示例。

我已经开始写提取器从CSV读,但我不知道如何进一步。

代码语言:javascript
复制
public Option<RDD<byte[]>> nextRDD(SparkContext sparkContext, UserExtractConfig config, long batchInterval, PhaseLogger logger) {
        RDD<String> inputFile = sparkContext.textFile(filePath, minPartitions);
    RDD<String> inputFile = sparkContext.textFile(filePath, minPartitions);

    RDD<byte[]> bytes = inputFile.map(ByteUtils.utf8StringToBytes(filePath), String.class); //compilation error

    return bytes; //compilation error

}

如果有人能给我指点开始工作的方向的话.

谢谢..。

EN

回答 1

Stack Overflow用户

发布于 2022-08-08 12:05:04

首先,使用以下代码在java中配置火花连接器:

代码语言:javascript
复制
SparkConf conf = new SparkConf();
conf.set("spark.datasource.singlestore.clientEndpoint", "singlestore-host")
spark.conf.set("spark.datasource.singlestore.user", "admin")
spark.conf.set("spark.datasource.singlestore.password", "s3cur3-pa$$word")

运行上述代码后,spark将连接到java,然后您就可以在中读取csv。您可以根据需要转换和操作数据,然后可以将此数据写入数据库表。

还附加链接,供您参考。火花单点商店

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34212098

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档