首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python中的Apache Beam,beam.io.TextFileSource错误

Python中的Apache Beam,beam.io.TextFileSource错误
EN

Stack Overflow用户
提问于 2017-02-24 07:52:08
回答 2查看 886关注 0票数 0

我正在尝试在GCP代码库上运行数据科学中的代码,并不断地在Beam代码中遇到错误。

这是给出错误的行: beam.Read(beam.io.TextFileSource('airports.csv.gz')

下面是我得到的错误: AttributeError:'module‘对象没有'TextFileSource’属性

下面是完整的文件:https://github.com/GoogleCloudPlatform/data-science-on-gcp/blob/master/04_streaming/simulate/df01.py

有没有人知道怎么让它工作,或者我错过了什么?

EN

回答 2

Stack Overflow用户

发布于 2017-05-05 10:27:22

Google Dataflow正在迁移到Apache Beam标准,这意味着你应该使用apache_beam.io.textio.ReadFromText。该标准仍在发展中,因此当您升级包时,最好咨询Release Notes

票数 1
EN

Stack Overflow用户

发布于 2017-02-24 07:57:43

看起来您使用的是apache- appears /cloud-dataflow的旧版本。

执行以下操作:

pip freeze | grep dataflow

当我这样做的时候,我会得到:

google-cloud-dataflow==0.4.3

如果您得到的版本较旧,请尝试:

pip install google-cloud-dataflow

并重复pip freeze命令。如果你一直使用较旧的版本,那么你就在Python库的地狱里,我建议使用virtualenv来确保你使用的是所有包的最新版本……

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42428370

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档