有一个第三方Scio客户端库,它为Cloud Dataflow提供了Scala API,以便访问Cloud Bigtable。因此,在这个过程中,我无法在GCP中配置Scala API。请帮帮忙。
链接:https://cloud.google.com/bigtable/docs/third-party-clients
发布于 2017-12-13 00:40:05
Scio只是一个Scala SDK,它包装了Apache Beam Java SDK。在GCP中没有Scio的“配置”。您只需使用Scio (Scala)或Scio和Apache Beam的某种组合(Scala和Java)来编写数据流作业。
我通常使用Spotify提供的Giter8模板创建一个数据流作业。这需要sbt工具。参考:https://github.com/spotify/scio-template.g8
>> sbt new spotify/scio-template.g8系统将提示您输入项目名称和包名称空间。这将自动创建一个sbt Scala项目。一旦建立了项目,您就可以像通常执行编译的Scala二进制文件一样,将管道部署到Dataflow。Giter8模板包括一个用Scio编写的示例WordCount数据流作业。
参考资料:https://github.com/spotify/scio
sbt参考:http://www.scala-sbt.org/0.13/docs/index.html
https://stackoverflow.com/questions/46967926
复制相似问题