본문 바로가기 메뉴 바로가기

미니의 꿈꾸는 독서, 그리고 프로그래밍 이야기

프로필사진
  • 글쓰기
  • 관리
  • 미니주요글
  • 미니가 읽은 책
  • 태그
  • 방명록
  • RSS

미니의 꿈꾸는 독서, 그리고 프로그래밍 이야기

검색하기 폼
  • 분류 전체보기 (647)
    • 사색 (289)
      • 독서 (148)
      • 칼럼 (9)
      • 세미나 (18)
      • 리뷰 (94)
      • 영어 (7)
    • Cloud&BigData (90)
      • 하둡(Hadoop) (22)
      • R (23)
      • BigData (18)
      • Machine Learing (20)
    • XML Developer (42)
      • SCORM (9)
      • XML기초 (8)
      • HTML5 (7)
      • 디자인 패턴 (12)
      • XSL (6)
    • 컴퓨터공학 (74)
      • 전산보안론 (7)
      • 소프트웨어공학 (5)
      • 디지털서비스 (18)
      • 디지털네트워크 (1)
      • 통계학 (9)
      • 프로젝트관리론 (34)
    • 프로그래밍 (151)
      • 아이폰 (15)
      • 안드로이드 (24)
      • 리눅스 (17)
      • MySQL (11)
      • Java (26)
      • Web (40)
      • 기타 (11)
    • 셀프 (0)
  • 방명록

파서 (2)
jsoup을 활용해서 Java에서 HTML 파싱하는 방법 정리

모바일 개발이나 각종 사이트를 처리할 때 HTML 페이지를 가져와서 분석하는 경우가 종종 있습니다. 보통 HTML 파싱할 때 정규식을 이용해서 했었는데요. 단점이 태그와 같은 것이 중첩되어 있을 경우, 첫번째 태그까지만 찾게 되는 것이었습니다. 아무래도 정규식 자체가 문자열 매칭이기 때문에 한계가 있는 것 같구요. 결국 DOM과 같은 구조를 사용하지 않으면 안될 것 같다는 생각이 들었습니다. 예전에 Javascript에서 쓸 수 있는 HTML Parser도 한번 소개한 적이 있기는 한데요. 오늘은 Java에서 활용할 수 있는 HTML Parser인 jsoup에 대해서 이야기 해보려고 합니다. jsoup: Java HTML Parserjsoup은 실제 사용하는 HTML을 처리할 수 있는 자바 라이브러리인데..

프로그래밍/Java 2012. 5. 31. 22:49
Javascript에서 사용하는 HTML Parser라고 합니다.

Javascript에서 HTML을 파싱할 때 사용할 수 있는 라이브러리라고 합니다. http://ejohn.org/blog/pure-javascript-html-parser/ 에 방문해 보면 Pure JavaScript Html Parser라고 나와있네요.. 간단한 소스 설명도 되어 있습니다. http://ejohn.org/apps/htmlparser/ 에서 테스트를 할 수 있는데요.. 대략 테스트해보니.. XML형태로 제대로 만들어주네요~ 나중에 유용하게 사용할 수 있을 것 같습니다. htmlparser.js 파일은 http://ejohn.org/files/htmlparser.js 에서 다운로드 하세요.. js 소스도 한번 보세요.. 300줄 밖에 안되는데요.. 정규식이랑 아주 지대로 쓴것 같네요~ 혹..

프로그래밍/Java 2011. 10. 11. 17:13
이전 1 다음
이전 다음
반응형
공지사항
최근에 올라온 글
  • 불편한 편의점
  • 통계조작에 속지 않으려면...
  • 돈의 심리학 - 당신은 왜 부자가 되지 못했는가
  • 김진명 역사소설 고구려 - 소수림왕편, 고국양왕편⋯
최근에 달린 댓글
  • 안녕하세요. 아래 링크 드린 블로그에서 글쓴이님 글 훔⋯
  • 안녕하세요? 상황인식 공부하는 대학원생입니다. 검색하다⋯
  • 서평을 읽는 것 만으로도 많은 생각을 하게 되네요. 맨⋯
  • 정리해주신 내용만 봐도 정말 도움이 많이 되네요 감사합⋯
Total
3,307,331
Today
0
Yesterday
437
링크
  • 수식입력_latex
  • W3Schools Online Web Tutorials
  • 영어 학습 사이트
TAG
  • 애플
  • 디자인
  • 구글
  • r
  • 분석
  • fingra.ph
  • XML
  • 아이폰
  • 프로젝트
  • 자바
  • 마케팅
  • 안드로이드
  • 빅데이터
  • 맥
  • ms
  • 통계
  • Google
  • 하둡
  • 책
  • java
  • Hadoop
  • 모바일
  • HTML
  • 세미나
  • 자바스크립트
  • 클라우드
  • 도서
  • mysql
  • 웹
  • SCORM
more
«   2023/04   »
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
글 보관함
  • 2022/12 (2)
  • 2022/11 (1)
  • 2022/10 (3)
  • 2022/09 (5)
  • 2022/08 (5)

Blog is powered by Tistory / Designed by Tistory

티스토리툴바