본문 바로가기 메뉴 바로가기

루키의 보석함

프로필사진
  • 글쓰기
  • 관리
  • 루키주요글
  • 루키가 읽은 책
  • 태그
  • 방명록
  • RSS

루키의 보석함

검색하기 폼
  • 분류 전체보기 (666)
    • 사색 (293)
      • 독서 (152)
      • 칼럼 (9)
      • 세미나 (18)
      • 리뷰 (94)
      • 영어 (7)
    • Cloud&BigData (90)
      • 하둡(Hadoop) (22)
      • R (23)
      • BigData (18)
      • Machine Learing (20)
    • XML Developer (42)
      • SCORM (9)
      • XML기초 (8)
      • HTML5 (7)
      • 디자인 패턴 (12)
      • XSL (6)
    • 컴퓨터공학 (74)
      • 전산보안론 (7)
      • 소프트웨어공학 (5)
      • 디지털서비스 (18)
      • 디지털네트워크 (1)
      • 통계학 (9)
      • 프로젝트관리론 (34)
    • 프로그래밍 (151)
      • 아이폰 (15)
      • 안드로이드 (24)
      • 리눅스 (17)
      • MySQL (11)
      • Java (26)
      • Web (40)
      • 기타 (11)
    • 셀프 (0)
    • 정보시스템감리 (16)
      • 감리 및 사업계획 (16)
  • 방명록

2016/01/18 (1)
하둡 맵리듀스 Join 활용 예제

하둡 맵리듀스를 활용하다 보면 서로 다른 유형의 데이터 셋을 조인해야 하는 경우가 종종 있다. SQL에서 테이블간 조인을 생각해 보면 된다. Word Count 예제를 기반으로 맵리듀스의 조인을 고려해 보자. 특정 단어의 개수를 세는데 파일 하나는 전체 기간을 대상으로 하고, 다른 파일은 월별로 각 단어의 개수를 나타낸다고 해보자. 아래의 두 파일을 하나로 합쳐서 형태로 합쳐서 출력하는 부분을 하둡 맵리듀스로 구현해보는 것이다. join1_FileA.txt able,991 about,11 burger,15 actor,22 join1_FileB.txt Jan-01 able,5 Feb-02 about,3 Mar-03 about,8 Apr-04 able,13 Feb-22 actor,3 Feb-23 burger..

Cloud&BigData/하둡(Hadoop) 2016. 1. 18. 07:29
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 수식입력_latex
  • W3Schools Online Web Tutorials
  • 영어 학습 사이트
TAG
  • 아이폰
  • 클라우드
  • java
  • 도서
  • ms
  • 웹
  • 구글
  • 세미나
  • 책
  • 안드로이드
  • Google
  • 분석
  • Hadoop
  • 애플
  • r
  • fingra.ph
  • 자바스크립트
  • mysql
  • XML
  • 빅데이터
  • HTML
  • SCORM
  • 디자인
  • 마케팅
  • 하둡
  • 모바일
  • 자바
  • 프로젝트
  • 통계
  • 맥
more
«   2016/01   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바