在我的例子中,我需要加载黑斑羚数据来触发(Pyspark)。因为我想使用spark的FPGrowth。
数据是用库杜写的,是由黑斑羚制作的。直接与kudu相连的火花被相关部门拒绝。我也未能与cloudera公司生产的黑斑马jdbc连接。
所以我最后的选择是
ImpalaTable转换为spark的Dataframe但我找不到办法。
我想错了吗?
发布于 2021-10-28 01:02:11
https://stackoverflow.com/questions/69718007
复制相似问题