文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从python中的数据流/波束中查询数据存储

问如何从python中的数据流/波束中查询数据存储
EN

Stack Overflow用户

提问于 2016-12-13 23:16:11

回答 1查看 2.1K关注 0票数 3

看起来google已经发布了对从python中的数据流/beam查询数据存储的支持。我试图让它在本地运行，但我遇到了一些问题：

import apache_beam as beam
from apache_beam.io.datastore.v1.datastoreio import ReadFromDatastore
from gcloud import datastore

client = datastore.Client('my-project')
query = client.query(kind='Document')

options = get_options()
p = beam.Pipeline(options=options)

entities = p | 'read' >> ReadFromDatastore(project='my-project', query=query)
entities | 'write' >> beam.io.Write(beam.io.TextFileSink('gs://output.txt'))

p.run()

这给了我一个

AttributeError: 'Query' object has no attribute 'HasField' [while running 'read/Split Query']

我猜我传入了错误的查询对象(您可以从3-4 pip包导入数据存储)，但我不知道应该传入哪一个。在测试中，他们通过了原生质。这就是我要用的吗？如果我必须使用protobuf来显示一个简单的示例查询，任何人都可以这样做吗？

apache-beam

python

google-cloud-datastore

google-cloud-dataflow

protocol-buffers

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-12-14 06:00:28

字数算例使用protobufs进行查询。

看来你需要这样的东西：

from google.datastore.v1 import query_pb2
...
query = query_pb2.Query()
query.kind.add().name = 'Document'

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41132204

复制

相似问题

问如何从python中的数据流/波束中查询数据存储
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从python中的数据流/波束中查询数据存储EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从python中的数据流/波束中查询数据存储
EN