我编写这段代码是为了获取指定表中count的整数值:
sc = SparkContext("local", "spar")
hive_context = HiveContext(sc)
hive_context.sql("use zs_trainings_trainings_db")
df = hive_context.sql("select count(*) from ldg_sales")发布于 2017-05-04 07:50:23
以下任一项:
hive_context.table("sales").count或
hive_context.sql("select count(*) from ldg_sales").first()[0]发布于 2017-05-04 12:16:20
将dataframe转换为rdd,这样您就可以在其上运行map任务来提取行值,如-
df = hive_context.sql("select count(*) as cnt from ldg_sales")
count = df.rdd.map(lambda _ : _.cnt).collect()[0]https://stackoverflow.com/questions/43776574
复制相似问题