腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Nuodb和
HDFS
作为
存储
使用
HDFS
for Nuodb作为
存储
。这会对性能产生影响吗?在
HDFS
块大小概念的基础上,保持较小的文件大小,这会在获取数据时增加网络流量。我是不是漏掉了什么?请指出同样的问题。Nuodb将如何
管理
这些延迟陷阱?
浏览 3
修改于2014-07-08
得票数 2
回答已采纳
1
回答
在Red或基础架构中集成硬盘文件系统?
我有一个由5台虚拟机组成的集群(带有KVM虚拟机
管理
程序),我希望找到集成
HDFS
的最佳方法,以便优化数据的
存储
管理
。由于
HDFS
是一个分布式文件系统,它允许客户机并行访问文件,因此我想利用这一特性。那么,是否可以在群集中安装硬盘文件系统来
管理
虚拟机的磁盘空间,或者将其集成到OpenShift中来
管理
PaaS终端用户的数据?
浏览 0
提问于2013-03-30
得票数 2
1
回答
如何使用结构化流检查点
管理
HDFS
内存
我需要了解如何在
HDFS
中
管理
/清理检查点。 作业运行良好,我能够从失败的步骤中恢复,而不会丢失数据,但是,我可以看到
HDFS
利用率每天都在增加。我找不到任何关于Spark如何
管理
/清理检查点的文档。以前,检查点
存储
在s3上,但由于要读/写大量的小文件,这被证明是非常昂贵的。kafka.bootstrap.servers", bootstrap_servers) \ .option("checkpointLo
浏览 34
修改于2019-01-07
得票数 2
回答已采纳
1
回答
如何在nfs文件系统中
存储
apache检查点
现在,当任务
管理
器重新启动时,我需要将状态和检查点
存储
在文件系统中,所有演示都应该使用“
HDFS
://namenode:4000/.”,但是现在我没有
HDFS
集群,我的Apache Flink运行在kubernetes集群中,如何在文件系统中
存储
我的检查点?这些源的例子是持久消息队列(例如Apache、RabbitMQ、Amazon、Google PubSub)或文件系统(例如
HDFS
、S3、GFS、NFS、Ceph、…)。。状态的持久
存储</em
浏览 5
修改于2020-04-09
得票数 0
回答已采纳
1
回答
我们是否将一台机器称为datanode和nodemanager?
HDFS
有两个节点名称节点和数据节点。并且YARN有一个资源
管理
器和一个节点
管理
器。我想知道这些实体是在一台机器上。就像namenode和资源
管理
器在一台机器上一样。根据我的理解,客户端请求namenode提供数据
存储
位置的信息,这类似于请求资源的资源
管理
器。如果我对
HDFS
的理解有误,请纠正我。谢谢
浏览 123
提问于2020-07-23
得票数 0
2
回答
Spark Structured Kafka偏移
管理
我正在研究在kafka中
存储
kafka偏移量用于Spark结构化流媒体,就像它对DStreams stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges我知道使用.option("checkpointLocation", checkpointLocation)的
hdfs
检查点,但我对内置的偏移量
管理
很感兴趣。我期望kafka只在内部
存储
偏移量,而不使用spark
hdfs
检查点。
浏览 10
修改于2021-01-22
得票数 3
5
回答
在外部hadoop集群中,如何通过由H/A namenodes组成的URI访问
hdfs
?
现在,我有了一些
存储
输出到
HDFS
的Spark应用程序。由于我们的hadoop集群是由namenode H/A组成的,而spark集群位于hadoop集群之外(我知道这很糟糕),所以我需要为应用程序指定
HDFS
URI,以便它能够访问
HDFS
。访问动物园
管理
员显示活动似乎很烦人,所以我想避免。 你能提出其他选择吗?
浏览 3
修改于2015-06-17
得票数 10
回答已采纳
2
回答
我是否可以使用s3作为Amazon环境之外的Hive
存储
?
我有在EC2机器中
管理
服务的情况。这台运行Hive的机器和我计划使用s3作为我的
存储
单元(而不是
hdfs
)。有可能吗?
浏览 2
提问于2015-12-03
得票数 0
回答已采纳
1
回答
HDFS
是否可以成为datanode中的孤立文件?
在删除超过60天的日志的日常日志修剪作业中,系统
管理
员将专用宿主机从4.3升级到4.6,(我知道,我知道)... 通常,日志修剪作业会释放大约40%的
HDFS
可用
存储
空间。已知的是,
HDFS
接收到了delete命令,因为
HDFS
文件/文件夹已不存在,但磁盘利用率仍未改变。我的问题是,
HDFS
是否已经从NameNode的元数据中删除了文件,而没有实际完成DataNodes中的文件块删除,从而有效地孤立了文件块?
浏览 0
提问于2013-07-17
得票数 0
1
回答
与其他分布式
存储
相比,在
HDFS
中使用Apache Spark
在Spark的FAQ中,它明确表示不必使用
HDFS
: 不是,但如果您在集群上运行,您将需要某种形式的共享文件系统(例如,NFS安装在每个节点的相同路径上)。那么,如果我不打算使用Hadoop MapReduce,那么与其他分布式文件系统(如NFS)相比,将Apache与
HDFS
结合使用有哪些优缺点呢?如果我使用NFS而不是
HDFS
来
存储
节点(用于检查点、洗牌溢出等),我会丢失一个重要的特性吗?
浏览 0
修改于2020-06-20
得票数 14
回答已采纳
2
回答
如何在Hadoop中
管理
JSON
Hadoop 如何
管理
JSON文件?FOR EACH json IN
hdfs
: IF json HAS this_attribute: x
浏览 9
修改于2021-11-16
得票数 0
回答已采纳
0
回答
来自另一个用户的Hive - Drop表
我在cloudera测试集群上工作,并禁用了权限
管理
,因此在Hive中没有ACL处理。现在我可以删除另一个用户的表了。之后,该表将不存在于Hive元
存储
中。问题是,
hdfs
中的文件还存在。因此,如果我再次创建相同的表,它将填充旧数据,因为相同的
hdfs
拼接文件。要完全删除包括
hdfs
数据在内的表,我必须进行哪些更改?最好的问候Jörn
浏览 7
提问于2017-06-21
得票数 1
2
回答
HDFS
在我的单节点实验本地设置中损坏了namenode
对于我的Hadoop实验,我在我的macbook上的localhost上设置了单节点
HDFS
。每次实验结束后,我都会关闭hadoop服务(./bin/stop-all.sh)。几乎每次当我重新启动我的设置( start -all.sh)时,我发现我的
HDFS
损坏了,我总是需要格式化我的namenode并重新启动服务才能再次访问
HDFS
。当我在启动后停止获取namenode
管理
员访问()时,我意识到了这一点。 在启动过程中,我的命名节点日志显示:"2012-11-29 15:27:43,160错
浏览 0
提问于2012-11-30
得票数 2
回答已采纳
1
回答
HDFS
存储
检查显示不同的值
我遇到了一个奇怪的情况,我从
hdfs
dfs -du命令中得到了不同的结果,以及我在cloudera
管理
器UI中看到的结果,我读到了这两个命令之间的差异,但没有任何线索可以帮助我抓住问题并解决它。我也删除了所有的快照并禁止它们,但是
存储
没有改变。以下是输出:2.3 G 5.8 G .[cloudera-scm@roor-chc101 root]$
hdfs
dfs -du -h -s
浏览 2
修改于2017-08-17
得票数 0
1
回答
星火如何选择运行w.r.tHDFS的位置
在
hdfs
文件的情况下,如何知道实际的数据部分在哪里?工作中的工具/协议是什么? 对于卡桑德拉+火花,(专用的)连接器似乎
管理
着这个数据局部性:
浏览 2
修改于2020-06-20
得票数 2
回答已采纳
1
回答
Hadoop YARN中的Docker应用程序支持
我在考虑使用Hadoop YARN和
HDFS
来处理这些数据。其思想是将所有数据摄取到
HDFS
中,然后提交Hadoop作业来处理数据。YARN将在数据附近部署处理应用程序,并对其进行处理。Google Kubernetes似乎适合我的需求(在集群中部署和
管理
docker镜像),但它不提供“
HDFS
式”
存储
(因此“将应用程序移动到数据而不是数据到应用程序”并不适合)。请让我知道是否有任何集群
管理
器框架可以在集群中部署标准应用程序包(如jar、rpm、docker容器)来访问共享/分
浏览 2
提问于2015-08-25
得票数 0
1
回答
Apache Accumulo角色分配
1服务器:
HDFS
名称节点、
HDFS
二级名称节点、
HDFS
均衡器、活动监视器、Cloudera
管理
服务、火花网关、火花源历史服务器、Yarn职务历史服务器、Yarn资源
管理
器、3服务器:
HDFS
数据节点、Kafka Broker、Spark网关、Yarn节点
管理
器、动物园
管理
员服务器 Cloudera向导要求分配以下Accumulo角色:主、Tablet、垃圾收集器、监视器、跟踪器、网关。如果将Tablet角色分配给所有
HDFS
数
浏览 0
修改于2017-09-22
得票数 1
回答已采纳
1
回答
我可以在一个配置单元外部表中创建
存储
桶吗?
我正在创建一个引用
HDFS
位置中的ORC文件的外部表。ORC文件的
存储
方式是按照日期对外部表进行分区(映射到
HDFS
上的date wise文件夹,作为分区)。然而,我想知道我是否可以在这些外部表上强制'Bucketing‘,因为底层数据/文件不是由hive’
管理
‘的。它们是在外部编写的,因此可以在Hive外部表中使用bucketing吗?但我不能理解hive如何将数据重新分配到
存储
桶中,
HDFS
上已经作为ORC文件写入了什么?我在下面的外部表中看到过类似的分区和分组表
浏览 17
提问于2020-07-30
得票数 1
回答已采纳
1
回答
使用Makefile向Postgresql添加新的源代码文件
我正在为Postgresql中的
存储
管理
器模块添加一些功能。gcc的命令是: gcc
hdfs
_test.c -I/
HDFS
_HOME/
hdfs
/src/c++/libhdfs -I/usr/lib/jvm/default-java/include -L/
HDFS
_HOME/
hdfs
/src/c++/libhdfs -L&
浏览 0
提问于2011-12-04
得票数 1
1
回答
HDFS
与ZooKeeper的差异?
在阅读动物园
管理
员的文档时,在我看来,
HDFS
与ZooKeeper一样依赖于几乎相同的分发/复制机制(广义速度)。我听到一个接一个的回音,但我还是不能区分清楚和严格的东西。据我所知,ZooKeeper是一个集群
管理
/同步工具,而
HDFS
是一个分布式文件
管理
系统,但在
HDFS
集群上是否需要ZK?
浏览 0
修改于2017-09-22
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券