我正在工具/服务的Azure生态系统中寻找一个文件共享解决方案。
当前的需求是能够从运行在Databricks中的脚本编写数千个文件(每周3-4 000个),到允许其他几个非技术用户访问的存储解决方案。生成报告的脚本是Python,而不是PySpark,尽管它确实在databricks中运行(在它之前有许多PySpark作业)。存储解决方案必须允许:
1)用Python编写/保存excel和html文件。
2)用户一次查看和下载多个文件(我相信这会破坏Blob存储?)
谢谢!
发布于 2020-06-02 22:53:44
谢谢你分享你的问题。如果
Azure确实提供了您可以使用的数据共享服务。Azure数据共享允许您将您的Python写入的存储从非技术用户读取的商店中分离出来。
关于第一点,我看不出有什么问题。Azure上的存储解决方案大多与文件类型无关。从技术上讲,向任何存储解决方案写入是可能的,主要区别在于这样做的过程有多简单或多长。
在第二点,我认为你所暗示的是,你的非技术人员可以很容易地进入仓库。可以一次从Blob存储中下载多个文件,但门户可能不是最方便用户的方法。我建议您查看Azure存储资源管理器。Azure Storage提供了一个客户端应用程序,用户可以使用该应用程序从所有Azure存储解决方案中管理或下载文件。
考虑到您如何指定html文件,并一次查看多个文件,我怀疑您希望将这些文件呈现为浏览器。许多资源都有一个URI。如果在Blob存储或ADLS gen2中可以公开访问一个自包含的html文件,然后在浏览器中导航到它,则html页面将呈现出来。
https://stackoverflow.com/questions/61942464
复制相似问题