文章/答案/技术大牛

发布

社区首页 >问答首页 >如何将spark数据框保存为excel格式？

问如何将spark数据框保存为excel格式？
EN

Stack Overflow用户

提问于 2017-04-11 15:41:28

回答 2查看 3K关注 0票数 0

我想要保存一个火花DataFrame到Excel。

对于csv，我已经这样做了:将csv文件保存在每个节点中，并使用DataBricks spark-csv库将其附加到服务器中。

我不知道在Excel中该怎么做。有人能给我建议和点子吗？

apache-spark

spark-excel

回答 2

Stack Overflow用户

发布于 2017-04-22 06:29:42

您可以在Spark：https://github.com/zuinnote/hadoopoffice中使用HadoopOffice库的数据源

但是，如果要存储的数据量非常大，那么它就没有多大意义，因为Excel本身在处理大型数据文件方面存在问题。

票数 0

Stack Overflow用户

发布于 2020-12-02 02:00:18

%sh pip install XlsxWriter

spark.conf.set("spark.sql.execution.arrow.enabled", "true")

import shutil, sys ,os
import pandas as pd
import xlsxwriter


df = spark.createDataFrame(
    [
        (1, 'foo'), # create your data here, be consistent in the types.
        (2, 'bar'),
      (3, 'bar1'),
      (4, 'bar2'),
    ],
    ['id', 'txt'] # add your columns label here
    )

    adls_path="/dbfs/mnt/"
       pd_df=df.toPandas()
       pd_df.to_excel('test.xlsx',engine='xlsxwriter')
       shutil.move('test.xlsx', adls_path)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43339653

复制

相似问题

问如何将spark数据框保存为excel格式？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将spark数据框保存为excel格式？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将spark数据框保存为excel格式？
EN