首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >模块Datastax Spark Cassandra连接器导入错误

模块Datastax Spark Cassandra连接器导入错误
EN

Stack Overflow用户
提问于 2016-02-14 17:47:31
回答 1查看 624关注 0票数 1

我尝试使用以下命令运行python spark-shell:

代码语言:javascript
复制
 bin/pyspark --packages datastax:spark-cassandra-connector:1.5.0-RC1-s_2.11,org.apache.spark:spark-streaming-kafka_2.10:1.6.0

以下命令的输出显示它能够找到spark-cassandra-connector包:

代码语言:javascript
复制
resolving dependencies :: org.apache.spark#spark-submit-parent;1.0
   confs: [default]
   found datastax#spark-cassandra-connector;1.5.0-RC1-s_2.11 in spark-packages
   found org.apache.cassandra#cassandra-clientutil;2.2.2 in central
   found com.datastax.cassandra#cassandra-driver-core;3.0.0-rc1 in central
   found io.netty#netty-handler;4.0.33.Final in central
   found io.netty#netty-buffer;4.0.33.Final in central
   found io.netty#netty-common;4.0.33.Final in central

但是,当我尝试使用以下任何命令导入程序包时,我得到import Error:

代码语言:javascript
复制
from com.datastax import *
from com.datastax.spark.connector import *

输出:

代码语言:javascript
复制
ImportError: No module named com.datastax
ImportError: No module named com.datastax.spark.connector

有没有人能建议一下这里出了什么问题?

EN

回答 1

Stack Overflow用户

发布于 2016-02-14 21:45:45

据我所知,Cassandra Connector没有一行Python代码,更不用说命名奇怪的Python模块了。Python互操作性是通过数据源API实现的,无需任何额外的导入即可使用。

代码语言:javascript
复制
sqlContext.read.format("org.apache.spark.sql.cassandra").options(...).load(...)

即使它这样做了,--packages也仅用于分发JVM依赖项。外部依赖项(Python,R)必须以依赖方式分发或安装,例如使用PyFiles

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35390396

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档