搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏数据人生
Why Hadoop2
自从Hadoop2出现之后，其迅速取代了Hadoop1的地位，并丰富了Hadoop的应用场景。如果现在有公司使用Hadoop的话，往往直接采用Hadoop2了。 Hadoop2能被如此广泛的使用，肯定有其自身的优势，本文将对其进行梳理支持更多的计算框架 Hadoop1采用的计算框架是MapReduce，MapReduce是批处理计算框架，适合做海量数据的离线处理集群资源利用率更高下面两张图是twitter分别采用Hadoop1和Hadoop2时，集群资源利用率的对比 HDFS和RM单点故障的解决在Hadoop1上，HDFS和JobTracker 是存在单点故障的，主节点崩溃后，集群也随之崩溃，而在Hadoop2上，当采用HA机制后，单点故障解决了。
24020编辑于 2022-09-29
来自专栏开源部署
Hadoop2中的日志
日志是定位问题最重要的手段，Hadoop2中的日志主要有三类：系统日志；应用日志（Job）；标准输出系统日志系统日志指各个组件打印的日志，如resourcemanager、namenode等，系统日志默认在
43910编辑于 2022-06-30
来自专栏数据人生
Hadoop2 上HDFS HA 搭建过程
简介 HADOOP2的HDFS上引入HA（High Available）机制以解决单点故障，引入Fedaration机制以解决HDFS拓展性问题。
69210编辑于 2022-09-23
来自专栏数据人生
Hadoop2伪分布模式安装
参照Apache的官方文档，Hadoop2还是蛮好搭建的，但是搭建好后，MapReduce的JobHistory页面却没法进去，这是因为JobHistory没有配置正确或者服务没有启动起来。 $cp id_rsa.pub authorized_keys $ssh localhost #此时不需要输入密码，证明配置成功安装与配置安装我的安装路径为/usr/local/hadoop-2/hadoop2 ,数据的存放路径为/usr/local/hadoop-2 下面的过程是将hadoop安装包存放在/usr/local/hadoop-2/hadoop2 $cd /usr/local $sudo mkdir 配置可以参考我的配置文件进行配置https://github.com/yanghaogn/Hadoop/tree/master/Hadoop2/ConfPseudoDistributedMode，将该 /bin:/usr/local/hadoop-2/hadoop2/sbin 运行 $hadoop namenode -format #首次启动的时候需要 $sbin/start-all.sh #
33010编辑于 2022-09-29
来自专栏Hongten
hadoop2集群环境搭建
在查询了很多资料以后，发现国内外没有一篇关于hadoop2集群环境搭建的详细步骤的文章。所以，我想把我知道的分享给大家，方便大家交流。若有不正之处，还请多多谅解，并希望批评指正。 2181</value> </property> --3.3.修改hadoop的临时目录 <property> <name>hadoop.tmp.dir</name> <value>/opt/hadoop2 2181,node2:2181,node3:2181</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/opt/hadoop2 /hdfs namenode -format --格式化成功后，会在/opt/hadoop2/dfs/name/current/目录下面生成元数据文件 cd /opt/hadoop2/dfs/name /hdfs namenode -bootstrapStandby --检查是否拷贝成功： cd /opt/hadoop2/dfs/name/current/ --查看是否有元数据 ls 16.停止所有服务
1.1K30发布于 2018-12-04
来自专栏算法无遗策
Hadoop1和Hadoop2的区别
Hadoop2做出了改进，有了NameNode的热备节点。 Hadoop2引入了YARN。序列化方式 Hadoop1的RPC通信协议是使用Java的Writables序列化实现的，但在Hadoop2中是基于Protocol Buffers实现的。 2014年发布的Hadoop2版本能够识别存储设备的类型，并且应用程序可以获取到这些信息。这样，应用程序就可以通过这些信息来优化它们的数据存取和布局策略。同时，Hadoop2的I/O也进行了大量的改进。例如，在Hadoop1中，当客户端运行在某个数据节点上时，它需要通过TCP来读取本地数据。
1.2K50发布于 2019-12-23
来自专栏java大数据
Hadoop1和Hadoop2的区别是什么？
Hadoop1和Hadoop2的区别是什么？马克-to-win @ 马克java社区：原来的Hadoop1的Mapreduce又管资源管理，又管数据处理和计算。而Hadoop2中的MapReduce则只专处理数据计算。而YARN做资源管理的事。这样其他计算框架比如spark和Tez可以引进了。Hadoop生态圈发展壮大了。谁能拒绝发展呢？
1.2K30发布于 2019-05-28
来自专栏linda大数据
大数据第二天 Hadoop3.2.1
sysconfig/network 192.168.2.117 hadoop3 reboot 6.vi /etc/hosts 192.168.2.109 hadoop1 192.168.2.108 hadoop2 rsync -r /opt/hadoop hadoop2:/opt rsync必须在hadoop1 hadoop2 hadoop3都存在这个命令才可以进行传输 module创建好，并且权限赋值好 rsync -r /opt/module/ hadoop2:/opt/module rsync -r /opt/module/ hadoop3:/opt/module sudo rsync /etc/profile hadoop2:/etc/profile sudo rsync /etc/profile hadoop3:/etc/profile (5)集群但节点启动 image.png image.png image.png 以下配置需要同步到hadoop1 hadoop2 hadoop3上。
54100发布于 2020-03-31
来自专栏大数据-BigData
hdfs集群安装（单namenode和HA模式）
单namenode节点准备文件下载： jdk-8u241-linux-x64.tar.gz hadoop-3.2.0.tar.gz 节点安排： hadoop1 → 从节点 hadoop2 → 主节点 > <property> <name>fs.defaultFS</name> <value>hdfs://hadoop2:9000</value 启动journalnode 启动journalnode，hadoop1和hadoop2节点都执行 hdfs --daemon start journalnodeCopy 在hadoop2节点执行 hdfs namenode -initializeSharedEditsCopy 启动zkfc hadoop2节点执行格式化zk， hdfs zkfc -formatZKCopy hadoop2节点启动zkfc 进程 hdfs --daemon start zkfcCopy hadoop2节点启动namenode hdfs --daemon start namenodeCopy 复制namenode元数据将hadoop2
97720编辑于 2022-01-19
来自专栏Java帮帮-微信公众号-技术文章全总结
Docker部署Hadoop集群
一、主机规划 3台主机：1个master、2个slaver/worker ip地址使用docker默认的分配地址： master：主机名： hadoop2、ip地址： 172.17.0.2 slaver1 :172.17.0.4 hadoop docker exec -it hadoop2 bash $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa $ cat ~/. </value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>hadoop2:8088< :10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>hadoop2 如： a、停止容器 docker stop hadoop2 b、保存镜像 docker commit hadoop2 hadoop_me:v1.0 测试 1、端口映射集群启动后，需要通过web界面观察集群的运行情况
1.9K10发布于 2018-12-29
来自专栏开源部署
使用Docker部署Hadoop集群
一、主机规划 3台主机：1个master、2个slaver/worker ip地址使用docker默认的分配地址： master：主机名： Hadoop2、ip地址： 172.17.0.2 slaver1 :172.17.0.4 hadoop docker exec -it hadoop2 bash $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa $ cat ~/.ssh </value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>hadoop2:8088< :10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>hadoop2 如： a、停止容器 docker stop hadoop2 b、保存镜像 docker commit hadoop2 hadoop_me:v1.0 测试 1、端口映射集群启动后，需要通过web界面观察集群的运行情况
1.1K20编辑于 2022-07-14
大数据应用与服务技能竞赛之Hadoop分布式集群搭建与管理
>hadoop2:9000</value> </property> < ! 图6-2 active状态的NameNode界面在浏览器中输入网址http://hadoop2:50070，通过Web界面查看hadoop2节点的NameNode的状态，结果如图6-3所示。这里以hadoop2节点为例，具体操作如下所示。 [hadoop@hadoop1 hadoop]$ vi include hadoop1 hadoop2 hadoop3 然后将修改后的include文件同步集群其他节点(包括退役节点)，这里以hadoop2 [hadoop@hadoop1 hadoop]$ vi slaves hadoop1 hadoop2 hadoop3 然后将修改后的slaves文件同步集群其他节点(包括退役节点)，这里以hadoop2
44310编辑于 2025-10-23
来自专栏挖掘大数据
详解使用hadoop2.6.0搭建5个节点的分布式集群（附代码）
集群，同时配置NameNode+HA、ResourceManager+HA，并使用zookeeper来管理Hadoop集群 2、规划 1、主机规划 hadoop1/ 192.168.56.131 hadoop2 稳定版本 zookeeper 3.4.6 稳定版本 hadoop 2.6.0 稳定版本 3、用户规划节点名称用户组用户密码 hadoop1 hadoop hadoop 123456 hadoop2 路径所有软件目录 /usr/hadoop/app/ 所有数据和日志目录 /usr/hadoop/data/ 3、集群安装前的环境检查 1、修改主机名将5个节点分别修改为hadoop1、hadoop2 、hadoop3、hadoop4、hadoop5 修改主机名，请参考“修改主机名” 2、hosts文件检查所有节点（hadoop1、hadoop2、hadoop3、hadoop4、hadoop5 ）的hosts文件都要配置静态ip与hostname之间的对应关系 192.168.56.131 hadoop1 192.168.56.132 hadoop2 192.168.56.133
1.4K70发布于 2018-01-19
来自专栏大数据-BigData
hive-3.1.2安装以及使用tez作为执行引擎指南
/data/hive/logs 修改权限为777 chmod -R 777 /data/hive/logsCopy 5.1 配置mysql元数据库这边的mysql数据库地址为： hostname: hadoop2 /value> </property> <property> <name>hadoop.proxyuser.hive.hosts</name> <value>hadoop2 </value> </property>Copy 重启hdfs、yarn hadoop2节点执行 hdfs --daemon stop namenode hdfs --daemon start connect jdbc:hive2://hadoop2:10000/default Connecting to jdbc:hive2://hadoop2:10000/default Enter username for jdbc:hive2://hadoop2:10000/default: hive Enter password for jdbc:hive2://hadoop2:10000/default:
2.3K20编辑于 2022-01-19
来自专栏大数据学习交流
大数据入门学习之Hadoop技术优缺点
Hadoop的核心组件 Hadoop自诞生以来，主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。在继Hadoop1之后出现了Hadoop2，Hadoop2在Hadoop1的基础上做了改进。相比Hadoop1，Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2，本书使用的是Hadoop2.7.3这一版本。 Hadoop2的一个公共模块和三大核心组件组成了四个模块，简介如下。
62920发布于 2019-06-05
来自专栏Se7en的架构笔记
Hadoop 分布式集群安装
节点规划节点名称 HDFS角色 YARN角色 hadoop1 NameNode ResourceManager hadoop2 SecondaryNameNode + DataNode NodeManager profile root@hadoop3:/etc/profile 配置 host 记录编辑 /etc/hosts 文件： 192.168.1.117 hadoop1 192.168.1.118 hadoop2 WebUI 使用的监听地址--> <property> <name>dfs.namenode.secondary.http-address</name> <value>hadoop2 ------------------------------------------------- Live datanodes (2): Name: 192.168.1.118:50010 (hadoop2 ) Hostname: hadoop2 Decommission Status : Normal Configured Capacity: 53660876800 (49.98 GB) DFS Used
1.1K50发布于 2021-05-18
来自专栏加米谷大数据
Hadoop的优点和缺点有哪些？
Hadoop简介 Hadoop自诞生以来，主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。 Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2。 Hadoop2的一个公共模块和三大核心组件组成了四个模块，简介如下： (1)Hadoop Common：为其他Hadoop模块提供基础设施。 (2)HDFS：具有高可靠性、高吞吐量的分布式文件系统。
5.2K30发布于 2019-04-19
来自专栏YO大数据
Hadoop3.x搭建详细教程 | 历史服务器的配置与日志聚合
作者：“大数据小禅” 简介：随着版本的迭代，Hadoop也在不断的进行更新与增加新特性，根据生产与业务的需求，掌握最基础的环境搭建是比较重要的，之前的文章已经进行了Hadoop2的安装，Hadoop3 Hadoop2详细搭建教程： Hadoop2安装教程对应的安装包可以通过最下方公众号联系我分享。具体的配置可以参照之前发布的一篇搭建Hadoop2的文章。 3.配置核心文件跟之前配置Hadoop2的时候不同，这次的搭建还配置了历史服务器与日志的聚集。 <value>node1:19888value> workers node1 node2 node3 4.集群的启动修改完成配置文件之后，需要将hadoop的安装包分配到其他集群，这里参考Hadoop2 5.总结总的来说，Hadoop3的访问端口号与配置会与Hadoop2有些许不同，感兴趣的小伙伴也可以试着搭建一下各个版本。
82020编辑于 2022-05-19
来自专栏王小雷
超详细从零记录Hadoop2.7.3完全分布式集群部署过程
主机名/hostname IP 角色 hadoop1 192.168.193.131 ResourceManager/NameNode/SecondaryNameNode hadoop2 192.168.193.132 而主机名hostname可不同如hadoop1,hadoop2,hadoop3.或者master,slave1,slave2.在本篇博文中用hadoop1,2,3区分hostname主机名。 sshd sudo apt install openssh-server 3.2.安装ssh后，可以通过工具（putty或者MobaXterm）远程连接已经建立好的服务器（Hadoop1，Hadoop2 也可通过scp命令 #注意后面带 : 默认是/home/xiaolei路径下 xiaolei@hadoop1:~$ scp jdk-8u111-linux-x64.tar.gz hadoop2: 命令解析 #不需要输入密码 ssh hadoop2 ? 5.hadoop完全分布式集群文件配置和启动在hadoop1上配置完成后将Hadoop包直接远程复制scp到其他Linux主机即可。
2.6K100发布于 2018-01-02
来自专栏大数据学习笔记
基于Docker的Hadoop集群快速搭建
:/etc The authenticity of host 'hadoop2 (192.168.3.32)' can't be established. yes Warning: Permanently added 'hadoop2,192.168.3.32' (RSA) to the list of known hosts. root@hadoop2' The authenticity of host 'hadoop2 (192.168.3.32)' can't be established. The authenticity of host 'hadoop2 (192.168.3.32)' can't be established. [root@hadoop2 /]# 3.4 重启容器 [root@hadron ~]# docker stop hadoop2 hadoop2 [root@hadron ~]# docker stop
95820编辑于 2022-05-06

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页

点击加载更多

Why Hadoop2

Hadoop2中的日志

Hadoop2 上HDFS HA 搭建过程

Hadoop2伪分布模式安装

hadoop2集群环境搭建

Hadoop1和Hadoop2的区别

Hadoop1和Hadoop2的区别是什么？

大数据第二天 Hadoop3.2.1

hdfs集群安装（单namenode和HA模式）

Docker部署Hadoop集群

使用Docker部署Hadoop集群

大数据应用与服务技能竞赛之Hadoop分布式集群搭建与管理

详解使用hadoop2.6.0搭建5个节点的分布式集群（附代码）

hive-3.1.2安装以及使用tez作为执行引擎指南

大数据入门学习之Hadoop技术优缺点

Hadoop 分布式集群安装

Hadoop的优点和缺点有哪些？

Hadoop3.x搭建详细教程 | 历史服务器的配置与日志聚合

超详细从零记录Hadoop2.7.3完全分布式集群部署过程

基于Docker的Hadoop集群快速搭建

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐