Giới thiệu cài đặt Apache Hive trên linux mới nhất

Giới thiệu cài đặt Apache Hive trên linux mới nhất

Dưới đây là các bước cài đặt Java, Hadoop, Hive. Các bạn cần làm theo. Trong trường hợp hệ thống đã cài đặt Java rồi thì bỏ qua bước 1. Nếu đã cài Hadoop rồi thì chỉ cần quan tâm tới bước 3 thôi.

Step1: Cài Java

  •  Download java
Link: http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html
File: jdk-7u71-linux-x64.tar.gz
Unzip bằng lệnh sau
$ tar -xzvf jdk-7u71-linux-x64.tar.gz
  •  Di chuyển tới thư mục cài đặt
$ sudo mv jdk1.7.0_71 /usr/local/
  • Thiết lập môi trường
$ vi ~/.bashrc
> export JAVA_HOME=/usr/local/jdk1.7.0_71
> export PATH=$PATH:$JAVA_HOME/bin
$ source ~/.bashrc
  • Cấu hình java alternatives.
$ alternatives --install /usr/bin/java java usr/local/java/bin/java 2
$ alternatives --install /usr/bin/javac javac usr/local/java/bin/javac 2
$ alternatives --install /usr/bin/jar jar usr/local/java/bin/jar 2
$ alternatives --set java usr/local/java/bin/java
$ alternatives --set javac usr/local/java/bin/javac
$ alternatives --set jar usr/local/java/bin/jar
  • Kiểm tra java version
$ java –version
java version "1.7.0_71"
Java(TM) SE Runtime Environment (build 1.7.0_71-b13)
Java HotSpot(TM) Client VM (build 25.0-b02, mixed mode)

 Step2: Cài Hadoop

  •  Step2: Cài Hadoop
$ wget http://apache.claz.org/hadoop/common/hadoop-2.6.1/hadoop-2.6.1.tar.gz
$ tar -xzvf hadoop-2.6.1.tar.gz
$ sudo mv hadoop-2.6.1 /usr/local/hadoop/
  •  Thiết lập thông tin môi trường 
$ vi ~/.bashrc
thêm các lệnh sau
> export HADOOP_HOME=/usr/local/hadoop
> export HADOOP_MAPRED_HOME=$HADOOP_HOME
> export HADOOP_COMMON_HOME=$HADOOP_HOME
> export HADOOP_HDFS_HOME=$HADOOP_HOME
> export YARN_HOME=$HADOOP_HOME
> export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export
PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
$ source ~/.bashrc
  • Sửa JAVA_HOME Trong hadoop-env.sh
$ cd $HADOOP_HOME/etc/hadoop
$ vi hadoop-env.sh
> export JAVA_HOME=/usr/local/jdk1.7.0_71
  • core-site.xml
     
        fs.default.name 
        hdfs://localhost:9000 
     
 
  •  hdfs-site.xml
     
        dfs.replication 
        1 
     
     
        dfs.name.dir 
        file:///home/hadoop/hadoopinfra/hdfs/namenode  
     
     
        dfs.data.dir
        file:///home/hadoop/hadoopinfra/hdfs/datanode  
    
  •  yarn-site.xml
     
        yarn.nodemanager.aux-services 
        mapreduce_shuffle 
     
  •  mapred-site.xml
     
        mapreduce.framework.name 
        yarn 
     
  •  Cài đặt namenode bằng lệnh sau
 $ hdfs namenode –format
  •  Start dfs
 $ start-dfs.sh
  •  Start yarn
$ start-yarn.sh
  • Truy cập hadoop

http://localhost:50070/

  • Cluster

http://localhost:8088/

Step3: Cài Hive

  • Download
$ wget https://archive.apache.org/dist/hive/hive-0.14.0/apache-hive-0.14.0-bin.tar.gz
$ tar -xzvf apache-hive-0.14.0-bin.tar.gz
$ sudo mv apache-hive-0.14.0-bin /usr/local/hive
  • Môi trường
$ vi ~/.bashrc
> export HIVE_HOME=/usr/local/hive
> export PATH=$PATH:$HIVE_HOME/bin
> export CLASSPATH=$CLASSPATH:/usr/local/Hadoop/lib/*:.
> export CLASSPATH=$CLASSPATH:/usr/local/hive/lib/*:.
$ source ~/.bashrc
  • Cấu hình
$ cd $HIVE_HOME/conf
$ cp hive-env.sh.template hive-env.sh
$ vi hive-env.sh
> export HADOOP_HOME=/usr/local/hadoop
  • Apache Derby
$ wget http://archive.apache.org/dist/db/derby/db-derby-10.4.2.0/db-derby-10.4.2.0-bin.tar.gz
$ tar zxvf db-derby-10.4.2.0-bin.tar.gz
$ sudo mv db-derby-10.4.2.0-bin /usr/local/derby
$ vi ~/.bashrc
> export DERBY_HOME=/usr/local/derby
> export PATH=$PATH:$DERBY_HOME/bin
> export CLASSPATH=$CLASSPATH:$DERBY_HOME/lib/derby.jar:$DERBY_HOME/lib/derbytools.jar
$ source ~/.bashrc
  • Tạo thư mục metastore
$ sudo mkdir $DERBY_HOME/data
  • Cấu hình metastore
$ cd $HIVE_HOME/conf
$ cp hive-default.xml.template hive-site.xml
  • hive-site.xml
    javax.jdo.option.ConnectionURL
    jdbc:derby://localhost:1527/metastore_db;create=true 
    JDBC connect string for a JDBC metastore 
  • tạo file jpox.properties với nội dung
javax.jdo.PersistenceManagerFactoryClass = org.jpox.PersistenceManagerFactoryImpl
org.jpox.autoCreateSchema = false
org.jpox.validateTables = false
org.jpox.validateColumns = false
org.jpox.validateConstraints = false
org.jpox.storeManagerType = rdbms
org.jpox.autoCreateSchema = true
org.jpox.autoStartMechanismMode = checked
org.jpox.transactionIsolation = read_committed
javax.jdo.option.DetachAllOnCommit = true
javax.jdo.option.NontransactionalRead = true
javax.jdo.option.ConnectionDriverName = org.apache.derby.jdbc.ClientDriver
javax.jdo.option.ConnectionURL = jdbc:derby://hadoop1:1527/metastore_db;create = true
javax.jdo.option.ConnectionUserName = APP
javax.jdo.option.ConnectionPassword = mine
  • Run Hive
$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
$ cd $HIVE_HOME
$ bin/hive
hive> show tables;
OK
Time taken: 2.798 seconds
hive>

 Hy vọng bài viết sẽ giúp các bạn cài đặt thành công Hive. Trong bài tiếp theo sẽ tôi sẽ đề cập tới Hive QL, thành phần quan trọng nhất trong Hive

Bạn thấy bài viết này như thế nào?: 
No votes yet
Ảnh của Tommy Tran

Tommy owner Express Magazine

Drupal Developer having 9+ year experience, implementation and having strong knowledge of technical specifications, workflow development. Ability to perform effectively and efficiently in team and individually. Always enthusiastic and interseted to study new technologies

  • Skype ID: tthanhthuy

Tìm kiếm bất động sản

 

Advertisement

 

jobsora

Dich vu khu trung tphcm

Dich vu diet chuot tphcm

Dich vu diet con trung

Quảng Cáo Bài Viết

 
Chrome lần đầu 'ngang hàng' với Firefox

Chrome lần đầu 'ngang hàng' với Firefox

Trình duyệt mới xuất hiện 2 năm của Google lần đầu tiên đuổi kịp Firefox và dự kiến với đà tăng trưởng này, nó sẽ trở thành á quân trong tháng 11.

Google TV 2.0 chạy vi xử lí ARM ra mắt tại CES 2012

Google TV 2.0 chạy vi xử lí ARM ra mắt tại CES 2012

Thế hệ Google TV tiếp theo sẽ sử dụng bộ vi xử lí ARM sau khi nhà sản xuất chip Marvell cho biết...

Hướng dẫn drush Self Aliases

Hướng dẫn drush Self Aliases

I ran into an interesting problem with the drush @self alias today. I wanted to pull a fresh copy of the DB down from a client’s live site to my local development copy. Should be as easy as drush sql-sync @clientsite.live @self, right? I’ve done this a thousand times before.

And I’ve also ignored the warning message every time before, but today I thought I’d check it out:

Tomdesgin.vn

 

Drupal Services