问在Spark中读取Apache Arrow文件
EN

Stack Overflow用户

提问于 2022-12-04 18:03:38

回答 1查看 12关注 0票数 0

我正在使用Pyspark，我想读取Apache类型的文件，这些文件的扩展名是".arrow“。不幸的是，我找不到任何办法来做这件事，我会感激你的帮助。

apache-arrow

pyspark

回答 1

Stack Overflow用户

发布于 2022-12-04 18:48:14

要在PySpark中读取Apache文件，可以使用spark.read.parquet()方法，它支持读取Apache文件。.parquet()方法以Arrow文件的路径作为参数，并返回一个DataFrame。例如，要读取位于/path/ to /file.箭头的Apache Arrow文件，可以使用以下代码：

df = spark.read.parquet("/path/to/file.arrow")

如果您想读取以.arrow结尾的所有文件，则可以使用“*”

df = spark.read.parquet("/path/to/*.arrow")

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/74679453

复制

相似问题

问在Spark中读取Apache Arrow文件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Spark中读取Apache Arrow文件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Spark中读取Apache Arrow文件
EN