首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对象中没有属性“map”错误的pyflem2.4.4中的

对象中没有属性“map”错误的pyflem2.4.4中的
EN

Stack Overflow用户
提问于 2019-09-22 16:54:07
回答 1查看 353关注 0票数 0

我正在使用python2.7运行Spark2.4.4,IDE是py魅力。

输入文件在列中包含编码值,如下所示。

代码语言:javascript
复制
.ʽ|!3-2-704A------------ (dotted line is space)

我想得到结果就像

3-2-704 a

我试过下面的代码。

代码语言:javascript
复制
from pyspark.sql import SparkSession
spark = SparkSession \
    .builder \
    .appName("Python Spark") \
    .config("spark.some.config.option", "some-value") \
    .getOrCreate()

df = spark.read.csv("Customers_v01.csv",header=True,sep=",");
myres = df.map(lambda x :x[1].decode('utf-8'))

print(myres.collect())

错误:

代码语言:javascript
复制
    myres = df.map(lambda x :x[1].decode('utf-8'))
  File "C:\spark\python\pyspark\sql\dataframe.py", line 1301, in __getattr__
    "'%s' object has no attribute '%s'" % (self.__class__.__name__, name))
AttributeError: 'DataFrame' object has no attribute 'map'

我不知道是什么导致了这个错误..。帮帮忙吧。还有别的办法吗。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-09-22 19:03:17

地图可在弹性分布式数据集(RDD)上使用

代码语言:javascript
复制
from pyspark.sql import SparkSession




spark = SparkSession.builder.appName("Python Spark").getOrCreate()

df = spark.read.csv("Customers_v01.csv", header=True, sep=",", encoding='utf-8')
myres = df.rdd.map(lambda x: x[1].encode().decode('utf-8'))

print(myres.collect())
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58051426

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档