标签 Apache Hadoop 下的文章

源码阅读准备下载Apache Hadoop-2.9.2官方源码将源码导入idea中启动idea在提示界面选择导入点击Finish等待下载和解决依赖完成,源码导入成功!!NameNode 启动流程命令启动Hdfs集群start-dfs.sh该命令会启动Hdfs的NameNode以及DataNode,启动NameNode主要是通过org.apache.hadoop.hdfs.server.namenode.NameNode类。重点关注...

阅读全文 »

软件和操作系统版本Hadoop框架是采用Java语言编写,需要java环境(jvm)JDK版本:JDK8版本集群:知识点学习:统一使用vmware虚拟机虚拟三台linux节点,linux操作系统:Centos7项目阶段:统一使用云服务器,5台云服务器节点Hadoop搭建方式单机模式:单节点模式,非集群,生产不会使用这种方式单机伪分布式模式:单节点,多线程模拟集群的效果,生产不会使用这种方式完全分布式模式:多台节点,真正的分布式Ha...

阅读全文 »

Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算框架)+Yarn(资源协调框架)+Common模块Hadoop HDFS:(Hadoop Distribute File System )一个高可靠、高吞吐量的分布式文件系统比如:100T数据存储该怎么设计?Google发表的论文翻译成中文即“分而治之”分:拆分→数据切割,100T数据拆分为10G一个数据块由一个电脑节点存储这个数据块。数据切割、制作副本、分散...

阅读全文 »