使用Python-3,我试图将Excel (xlsx)表与Databricks中相同的星火表进行比较。我希望避免在Databricks中进行比较。因此,我正在寻找一种通过Databricks api读取星火表的方法。这个是可能的吗?我怎样才能继续读一张桌子: DB.TableName?
发布于 2021-10-13 20:37:15
发布于 2021-05-15 16:49:04
我可以推荐您在笔记本中编写pyspark代码,从以前定义的作业中调用笔记本,并在本地机器和databricks工作区之间建立连接。
如果你愿意的话,你可以直接使用火星或将数据帧转换成熊猫。如果noteebok将结束混乱,可能是由于特定的工作而产生的。我认为发送所有databricks表可能是不可能的,因为API限制了您要执行复杂的操作,应该使用API来发送小消息。
办公文件:https://learn.microsoft.com/en-us/azure/databricks/dev-tools/api/latest/jobs#--runs-get-output
检索运行的输出和元数据。当笔记本任务通过dbutils.notebook.exit()调用返回值时,可以使用此端点检索该值。将此API限制为返回输出的前5MB。为了返回更大的结果,可以将作业结果存储在云存储服务中。
https://stackoverflow.com/questions/66713650
复制相似问题