腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
数据
湖
如何存储
数据
和
格式
?
我听说
数据
湖
可以存储任何类型的
数据
:关系型,NoSql,图片/图像,Adobe,Excel。如何以无SQL
格式
或二叉树存储
数据
?还是把它像普通硬盘一样保存?如果是这样的话,他们为什么不直接称之为存储,而不是
数据
湖
呢?我正在试图找到“
数据
湖
”的确切存储机制。
浏览 0
提问于2018-09-09
得票数 2
回答已采纳
2
回答
GeoTiff光栅
数据
到德尔塔
湖
/ Parquet
格式
?
我们的组织最近一直在使用
数据
库进行ETL和
数据
集的开发。然而,我发现栅格
数据
集的库/功能非常有限。有几个光栅/火花图书馆,但他们不是很成熟。例如、和。因此,我一直在探索在Databricks平台上高效处理栅格
数据
的其他方法,该平台利用Spark / Delta表/ Parquet文件。我的一个想法是将栅格
数据
转储到简单的x,y,value列,并将它们作为表加载。如果我的其他
数据
集具有相同的分辨率(我将对它们进行预处理,使它们具有相同的分辨率),那么
浏览 11
修改于2022-09-27
得票数 0
回答已采纳
1
回答
浅谈如何在蔚蓝
数据
湖
中保持.csv
格式
我应该指出,当我手动上传我的csv文件到
湖
,这是好的。当我尝试将本地文件夹与自托管集成运行时同步时,就会发生
格式
更改。 谢谢!
浏览 0
提问于2020-03-26
得票数 0
回答已采纳
2
回答
如何使用参数文件将多个文件从BLOB导出到Azure Synapse Analytics中的
数据
湖
Parquet
格式
?
我正在尝试从blob存储导出多个.csv文件到Azure
数据
湖
存储,基于参数文件,使用ADF -for每个迭代blob中的每个文件并复制活动,从源复制到接收器(我已经尝试使用元
数据
和每个活动),因为我在
浏览 1
提问于2021-02-09
得票数 0
1
回答
如何从Azure
数据
湖
转换,将
数据
按日期文件夹分区到delta
湖
我拥有一个由datetime嵌套文件夹划分
数据
的蔚蓝
数据
湖
gen2。我想向我的团队提供增量
湖
格式
,但是我不确定我是否应该创建一个新的存储帐户,将
数据
复制成增量
格式
,或者将当前的蔚蓝
数据
湖
转换为增量
湖
格式
是否是最佳实践。 有人能提供关于这件事的任何建议吗?
浏览 2
修改于2022-10-05
得票数 0
回答已采纳
2
回答
将不同类型的文件从Azur Azur
湖
复制到具有属性的Azur Gen2
湖
(类似于上次更新)
我需要将我所有的
数据
从Azur
数据
湖
Gen1迁移到Gen2
湖
。在我的湖里,我们有不同类型的混合文件(.txt,.zip,.json和许多其他)。我们想把他们按原样搬到GEN2
湖
。此外,我们还希望维护所有文件的最后更新时间作为GEN1
湖
。 我希望在这个用例中使用ADF。但是为此,我们需要定义
数据
集,并且为了定义
数据
集,我们必须定义
数据
格式
(Avro、json、xml、二进制等)。由于我们混合了不同类型的
数据</
浏览 20
修改于2020-10-19
得票数 1
2
回答
如何使用Azure作为Azure ML的输入
数据
集?
我正在移动
数据
到Azure
数据
湖
存储和处理它使用Azure
数据
湖
分析。
数据
是XML
格式
的,我正在通过读取它。现在,我想从Azure中访问这些
数据
,看起来Azure
数据
湖
存储目前还不受直接支持。
浏览 2
提问于2016-03-21
得票数 0
回答已采纳
1
回答
如何在
数据
工厂中创建Azure
数据
湖
存储第2代
数据
集?
我想在
数据
工厂中创建一个Azure
数据
湖
存储
数据
集Gener2。我跟着台阶走: 如何创建所需的
数据
集,而不必在步骤3中选择特定的
格式
?
浏览 6
提问于2020-09-26
得票数 0
1
回答
在Azure
数据
湖
存储Gen2中将
数据
从server复制到增量
格式
我有一个复制活动,将前提sql
数据
复制到
数据
湖
gen2中的parquet
格式
。但是,我需要将sql
数据
复制到相同
数据
湖
中的增量
格式
。我试着使用
数据
流将parquet复制到delta,但是我们在这种方法中存在性能问题。我们还有其他方法可以做到这一点吗?
浏览 6
提问于2022-03-31
得票数 0
1
回答
将增量
数据
加载到蔚蓝
数据
湖
中的最佳实践& azure
数据
仓库
我需要专家的意见,如何实现增量
数据
加载使用天青
数据
湖
,天青sql
数据
仓库,天青
数据
工厂+聚基。采用哪种
格式
,我们应该将
数据
存储在天蓝色
数据
湖
等。 谢谢胡丹·帕特尔
浏览 1
提问于2017-08-10
得票数 2
回答已采纳
2
回答
(Azure)
数据
湖
的元
数据
管理
据我所知,
数据
湖
解决方案用于存储从原始
格式
的原始
数据
到经过处理的
数据
。不过,我还不能理解(Azure)
数据
湖
中的元
数据
管理的概念。在
数据
湖
中处理元
数据
的最佳实践是什么?是否有任何自动读取元
数据
的机制(例如,从头文件中读取),如果有,是否有任何方法来查看和编辑此元
数据
(可能是编程实现的API )?我担心,如果没有适当的管理,“
湖
”只会变成“
浏览 4
修改于2017-03-31
得票数 3
2
回答
使用Azure
数据
湖
时是否需要
数据
仓库?
我正在探索Azure
数据
湖
,我是这个领域的新手。我探索了很多东西,读了很多文章。基本上,我必须从不同来源的
数据
开发Power仪表板。在典型的Server栈中,我可以编写一个ETL (提取、转换、加载)进程,将我的系统
数据
库中的
数据
导入
数据
仓库
数据
库。然后利用SSAS等技术,利用Power实现
数据
仓库。但是我想使用Azure
数据
湖
,我探索了Azure和Azure ( use )。我绘制了如下的架构图。 在
浏览 1
修改于2018-03-15
得票数 3
回答已采纳
2
回答
使用Azure
数据
工厂读取日期
格式
的文件夹(YYYY)
我在
数据
湖
中有几个文件夹(例如:Test1 1容器),每个月都以这种
格式
创建YYYY(示例:2022-11),而在这个文件夹中,我没有几组
数据
文件,我希望将这些
数据
文件复制到
数据
湖
中的不同文件夹中。在接下来的一个月中,在同一个
数据
湖
(例如:Test1 1容器)中创建新文件夹,其中包含2022-12,列表继续,2023-01.等等,我想每个月将这些文件夹中的文件复制到不同的
数据
湖
文件夹中。
浏览 8
修改于2022-11-28
得票数 0
1
回答
使用Pandas从列中删除第一个单词,有时是第二个单词
我需要从列中删除第一个单词,有时还需要删除第一个和第二个单词,以便可以合并两个
数据
帧。例如,在一个
数据
框中,“球队”列的
格式
为凯尔特人、掘金队、湖人队。在我的第二个
数据
框中,“团队”列的
格式
为波士顿凯尔特人、丹佛掘金、洛杉矶
湖
人。我遇到了麻烦,因为一些球队,比如
湖
人和鲸鱼,在实际的球队名称“
湖
人”之前有两个词(洛杉矶
湖
人,新奥尔良)。
浏览 8
修改于2021-04-28
得票数 1
2
回答
使用R代码:整数
格式
转换日期20081028
在将整数值20081028转换为日期
格式
时,我编写了一个代码:到目前为止,我正在将字符转换为错误。charToDate(x)中的错误:字符串不是标准的、明确的
格式
湖人队$Date=as.POSIXct.Date(
湖
人$Date,%Y%m%d) 然后是下面的错误。$<-.da
浏览 2
修改于2017-12-09
得票数 1
1
回答
在雅典娜查询中获取S3文件创建/更新日期
我们有一个具有许多不同文件
格式
的大型
数据
湖
,很难将这些信息添加到所有这些
数据
湖
中。
浏览 3
修改于2021-07-07
得票数 0
1
回答
试图将
数据
从on SQL
数据
库移到Azure Delta
湖
时出错
我正在尝试将大量的参考
数据
从on转移到Delta
湖
,以便用于databricks的处理。为了移动这些
数据
,我尝试通过简单的复制
数据
活动使用Azure data。请注意,接收器增量表不存在于三角洲
湖
中?此错误是否意味着在将
数据
移动到增量
湖
之前,必须手动创建表?对目标副本的操作失败: ErrorCode=AzureDatabricksTableIsNotDeltaFormat,表benefit不是增量
格式
。
浏览 2
提问于2020-10-15
得票数 0
回答已采纳
1
回答
如何从库伯内特斯向三角洲
湖
写入
数据
我们的组织运行着Azure上的
数据
库,
数据
科学家和分析人员主要用于笔记本,以便进行特别的分析和探索。 我们还为不需要火花的ETL工作流运行Kubernetes集群。我们希望使用达美
湖
作为我们的存储层,其中
数据
库和库伯奈特都可以读写作为头等舱公民。目前,我们的Kubernetes作业直接将parquets写到blob存储,另外还有一个作业可以将databricks集群中的
数据
加载到Databrick的表
格式
中。这既慢又贵。我想要做的是直接从Kubernetes python写到达美
浏览 3
提问于2021-08-12
得票数 2
回答已采纳
1
回答
使用创建基于日期的文件夹(YYYY)?
我的
数据
湖
文件夹中没有几组月度文件,我希望将它们复制到
数据
湖
中的另一个文件夹中,在将
数据
复制到目标
数据
湖
文件夹时,我希望创建一个YYYY
格式
的文件夹(Ex: 2022-11),并且我希望复制该文件夹中的文件在下个月,我将再次获得新的
数据
集,并希望将它们复制到(2022-12)文件夹,等等。 我想每个月运行管道,因为我们将获得每月负载的
数据
。
浏览 7
修改于2022-11-23
得票数 0
1
回答
Azure Data Lake - .avro to SQL
我正在使用Event Hub上的capture函数将
数据
推送到
数据
湖
中。这是保存在
湖
中的.avro文件。谢谢
浏览 12
提问于2018-11-12
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券