关于Python中的SnowPark有几个问题。
发布于 2022-06-25 20:58:25
我建议从这里开始了解更多:
https://docs.snowflake.com/en/developer-guide/snowpark/index.html
发布于 2022-08-22 10:59:50
需要记住的几件事是,我们在这里讨论的是多个问题,如果有一些澄清的话,可能会更好。
斯诺公园是通过pip/conda安装的一个库,它是一个dataframe库,这意味着您将能够定义指向雪花中数据的dataframe对象(还可以使用它将数据导入雪花)。它不会将数据撤回给客户端,除非您也显式地告诉它,并且所有的计算都是在雪花端完成的。
当您对斯诺公园数据进行操作时,您使用的是Python代码,它将生成在雪花中执行的SQL,使用的机制与编写自己的SQL的机制相同。生成的SQL的执行由诸如.show()、.collect()、save_as_table()等动作方法触发。
更多信息这里
作为雪花Python支持的一部分,还有Python和Python存储过程,您不需要斯诺帕克来创建或使用这些过程,因为您可以使用SQL使用create函数/ CREATE存储过程来实现这些功能,但也可以使用斯诺part。
使用Python和Python存储过程,您可以将Python代码放入雪花中,在雪花计算上执行,它不会被转换为SQL,而是使用运行在计算节点上的Python沙箱。
为了使用Python存储过程或Python,您不需要做任何事情,它就像任何在雪花特性中内置的特性一样。
有关Python UDF和Python存储过程的更多信息。
雪花Python连接器允许您编写在雪花上执行的SQL,并将结果拖回要在那里使用的客户端,使用客户端内存等。如果希望在雪花中执行操作,则需要为此编写SQL。
发布于 2022-07-01 06:59:45
斯诺帕克python提供了雪花python连接器没有的以下优点
它允许数据工程师、数据科学家和数据开发人员以他们熟悉的方式使用自己选择的语言编写代码,并在一个平台上更快、更安全地执行管道、ML工作流和数据应用程序。
有关更多细节,请参阅文档
https://stackoverflow.com/questions/72755915
复制相似问题