Hadoop (2) CentOS Hadoop Standalone 的設定

1. Hadoop 的運行模式:

Hadoop 是一個分散式的檔案系統,根據副本分散的方式可以把 Hadoop 的運行模式分成三種:

  • Standalone: 不指定副本數的模式。
  • Pseudo-Distributed: 假的分散模式,只運行在單機上。
  • Fully-Distributed: 建立叢集把資料副本分到各機上。

今天要介紹的是最簡單的 Standalone 模式。


2. 安裝流程:

基本上和 Ubuntu 這篇差不多 http://cooperbear2.blogspot.com/2018/07/hadoop-0-ubuntu-hadoop-hadoop-hello.html

安裝流程大致如下:

  1. 下載 Hadoop 解壓縮到 /usr/local
  2. 安裝 ant
  3. 設定環境

下載 Hadoop 和解壓跟之前那篇差不多,就不贅述了。


3. 安裝 ant

操作 Hadoop 實我們需要 jps 來觀察運行中的 process,還需要 tools.jar 等工具,所以我們要安裝 ant。

$ sudo yum update
$ sudo yum install ant

4. 編輯 bashrc:

最後來設定一下 bashrc。

$ vim ~/.bashrc

加入這些變數:

#[start-20180730-cooper(java)-add]#
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.181-3.b13.el7_5.x86_64
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
#[end-20180730-cooper(java)-add]#

#[start-20180730-cooper(hadooop)-add]#
export HADOOP_HOME=/usr/local/hadoop-2.7.6
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
#[end-20180730-cooper(hadooop)-add]#

看看系統能不能抓到 Hadoop:

$ source ~/.bashrc
$ hadoop version

留言

熱門文章