본문 바로가기 메뉴 바로가기

루키의 보석함

프로필사진
  • 글쓰기
  • 관리
  • 루키주요글
  • 루키가 읽은 책
  • 태그
  • 방명록
  • RSS

루키의 보석함

검색하기 폼
  • 분류 전체보기 (666)
    • 사색 (293)
      • 독서 (152)
      • 칼럼 (9)
      • 세미나 (18)
      • 리뷰 (94)
      • 영어 (7)
    • Cloud&BigData (90)
      • 하둡(Hadoop) (22)
      • R (23)
      • BigData (18)
      • Machine Learing (20)
    • XML Developer (42)
      • SCORM (9)
      • XML기초 (8)
      • HTML5 (7)
      • 디자인 패턴 (12)
      • XSL (6)
    • 컴퓨터공학 (74)
      • 전산보안론 (7)
      • 소프트웨어공학 (5)
      • 디지털서비스 (18)
      • 디지털네트워크 (1)
      • 통계학 (9)
      • 프로젝트관리론 (34)
    • 프로그래밍 (151)
      • 아이폰 (15)
      • 안드로이드 (24)
      • 리눅스 (17)
      • MySQL (11)
      • Java (26)
      • Web (40)
      • 기타 (11)
    • 셀프 (0)
    • 정보시스템감리 (16)
      • 감리 및 사업계획 (16)
  • 방명록

2011/09/27 (1)
[Java] URLConnection으로 가져올 때 UTF8과 EUC-KR 구분하기

RSS 리더를 구현하거나 웹과 관련된 프로그램을 구성할 때, URL을 입력해서 해당 글을 가져오는 루틴이 필요한 경우가 종종 있습니다. 이 경우, 항상 문제가 되는 것이 바로 인코딩 문제인데요. 웹사이트의 경우, 인코딩을 주로 UTF-8과 EUC-KR의 두 가지를 사용해서 처리하고 있습니다. 제가 처음 RSS 리더인 RSSNym을 개발할 때 사용한 방식은 먼저 해당 URL의 텍스트를 한번 읽어온 후 인코딩 정보를 검색했습니다. 그래서 UTF-8인지 EUC-KR인지 확인하고, 인코딩을 설정해서 해당 URL의 글을 가져오는 방식을 사용했습니다. 어떤 인코딩으로 처리하든지 영문으로 된 텍스트는 깨지지 않는다는 점을 활용한 것이죠.. 하지만 이 방식은 같은 URL을 두번씩 읽어오게 되므로 효율성에 문제가 있었습..

프로그래밍/Java 2011. 9. 27. 20:15
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 수식입력_latex
  • W3Schools Online Web Tutorials
  • 영어 학습 사이트
TAG
  • 구글
  • 빅데이터
  • ms
  • 안드로이드
  • HTML
  • 마케팅
  • 디자인
  • r
  • 도서
  • 웹
  • Google
  • 자바
  • 애플
  • 맥
  • 하둡
  • SCORM
  • 세미나
  • 책
  • java
  • 아이폰
  • 분석
  • 통계
  • fingra.ph
  • 프로젝트
  • 모바일
  • 자바스크립트
  • Hadoop
  • XML
  • mysql
  • 클라우드
more
«   2011/09   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바