1. Modo convencional:
Foi executado download da versão stable do Hadoop (2.6.0 - atual em 13/abril/2014). Disponível em:
Logo após nós podemos descompactar:
# tar xvvf hadoop*
E mover para
/usr/local/hadoop (o local recomendado por convenção):
# mv hadoop* /usr/local/hadoop
2. Instalação em outras distribuições:
No caso, eu uso
Arch Linux. Então para instalar no Arch:
# yaourt -S hadoop
Existem maneiras simples para executar a instalação no
Debian,
Ubuntu,
Fedora etc. a partir de alguns repositórios.
3. Variáveis de ambiente:
A configuração da variável do Java (ao meu ver) é um pouco chata, então para evitar essa "maldição" podemos configurar o hadoop-env.sh:
# vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh
E faremos a seguinte alteração na linha 25:
export JAVA_HOME=[Caminho-de-instação-do-seu-Java]
No meu caso:
export JAVA_HOME=/usr/lib/jvm/default
4. Variável Hadoop
Para facilitar o manuseio dos arquivos do Hadoop, podemos criar algumas variáveis úteis ao bash, como:
HADOOP_INSTALL=/usr/local/hadoop
HADOOP_BIN=/usr/local/hadoop/bin
HADOOP_SBIN=//usr/local/hadoop/sbin
E para executarmos o Hadoop de maneira simples, podemos criar uma direta ao executável do Hadoop:
HADOOP=/usr/local/hadoop/bin/hadoop
Pronto! Seu Hadoop está instalado com sucesso, suas variáveis estão configuradas de uma maneira inteligente. Agora temos que executar um teste básico, só pra verificar como as coisas estão.
Teste:
mkdir input
cp $HADOOP_INSTALL/hadoop/etc/hadoop/*.xml input
hadoop jar $HADOOP_INSTALL/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar grep input output 'dfs[a-z.]+'
cat output/*
Se tudo aconteceu com sucesso, e apareceram algumas boas palavras na tela, parabéns, está tudo feito com sucesso.