티스토리 뷰

클라우데라의 QuickStartVM을 통해 하둡 어플리케이션을 살펴보고 있다. 

이번에는 Hive를 beeline과 Hue를 통해서 간략하게 알아보자. 


Hive Beeline 예제

1. 터미널을 띄우고 /etc/passwd 파일을 HDFS의 /tmp 폴더에 넣는다. 

> hdfs dfs -put /etc/passwd /tmp/
> hdfs dfs -ls /tmp/


2. Hive를 실행하기 위해 beeline을 실행한다. 

> beeline -u jdbc:hive2://


3. beeline에서 userinfo 테이블을 생성하고, /tmp/passwd 파일을 읽어서 테이블에 저장한다. 

jdbc:hive2://>> CREATE TABLE userinfo ( uname STRING, pswd STRING, uid INT, gid INT, fullname STRING, hdir STRING, shell STRING ) ROW FORMAT DELIMITED FIELDS TERMINA TED BY ':' STORED AS TEXTFILE;
jdbc:hive2://>> LOAD DATA INPATH '/tmp/passwd' OVERWRITE INTO TABLE userinfo;


4. select 명령문을 통해 생성된 userinfo 테이블의 내용을 읽어온다. 

jdbc:hive2://>> SELECT uname, fullname, hdir FROM userinfo ORDER BY uname;
jdbc:hive2://>> !q


HUE에서의 Hive 확인

클라우데라의 HUE 인터페이스에서도 Hive를 확인할 수 있다. 

Query Editor > Hive를 선택하면 다음과 같은 화면이 나타나고, 위에서 생성한 userinfo 테이블을 확인할 수 있다. 


왼쪽 테이블의 가장 우측 아이콘을 클릭하면 해당 테이블의 내용을 바로 볼 수 있다. 


마지막으로 beeline에서 입력한 select와 동일한 쿼리를 입력해서 실행하면 똑같이 맵리듀스 잡이 활성화되고 결과가 나온다. 


댓글
댓글쓰기 폼