Javascript에서 HTML을 파싱할 때 사용할 수 있는 라이브러리라고 합니다. http://ejohn.org/blog/pure-javascript-html-parser/ 에 방문해 보면 Pure JavaScript Html Parser라고 나와있네요.. 간단한 소스 설명도 되어 있습니다. http://ejohn.org/apps/htmlparser/ 에서 테스트를 할 수 있는데요.. 대략 테스트해보니.. XML형태로 제대로 만들어주네요~ 나중에 유용하게 사용할 수 있을 것 같습니다. htmlparser.js 파일은 http://ejohn.org/files/htmlparser.js 에서 다운로드 하세요.. js 소스도 한번 보세요.. 300줄 밖에 안되는데요.. 정규식이랑 아주 지대로 쓴것 같네요~ 혹..
HTML 태그를 제거하고 순수하게 텍스트만 가져오는 부분이 필요해서 관련 소스를 정리해봤습니다. 정규식에 대해서는 개념은 들어보셨을 겁니다. 나중에 기회가 되면 정규식에 대해서도 한번 정리해 보도록 하구요.. 오늘은 간단하게 원하는 기능을 구현한 소스를 보여드리도록 하겠습니다. 정규식을 6개 정도 적용하고 있는 간단한 소스입니다. 각각 HTML의 스크립트 태그와 내용, 스타일 및 내용, 태그들, 엔터티, 공백문자들을 제거하는 정규식 표현입니다. private String getText(String content) { Pattern SCRIPTS = Pattern.compile("]*>.*?",Pattern.DOTALL); Pattern STYLE = Pattern.compile("",Pattern.DOT..
HTML5 활용 - 마크 필그림 지음, 현동석.강유훈 옮김/에이콘출판 HTML5에 대한 관심이 생겨 자료를 살펴보던 중 만난 책입니다. 제목 처럼 구글 개발자를 통해 HTML5의 구성이 어떻게 이루어져 있으며, 실제 활용하는 방법까지 충실하게 설명되어 있습니다. 1장을 "HTML이 지나온 길"을 읽으면서 어렴풋이 알고 있던 HTML의 역사에 대해 보다 확실하게 이해하게 되었습니다. 이 책을 잘 보면 video를 설명할 때도 그렇고 해당 주제에 대한 보다 깊이 있는 설명을 자주 하고 있습니다. 이런 면에서 매우 잘 만들어진 책이라는 느낌을 받았네요.. 프로그래머가 아닐지라도 IT 관련 업무를 한다면 1장은 꼭 읽었으면 하는 생각이 들었습니다. 2장 "HTML5 지원 감지 여부"는 HTML5의 주요 기능을 ..
제 홈페이지와 동시에 연재하려고 옮겨 봅니다. 요즘 HTML5에 대한 이야기들을 종종 볼 수 있습니다. 상당히 흥미를 가지고 있었던 주제인데요.. 이번에 새롭게 정리해 보려고 합니다. HTML5의 정의 HTML5는 HTML, XHTML, HTML DOM에 대한 새로운 표준으로 W3C(World Wide Web Consortium)와 WHATWG(Web Hypertext Application Technology Working Group)의 상호 협의로 만들어진 것입니다. W3C는 XML, XHTML등의 표준을 작성한 곳으로 이미 여러번 설명했었구요.. WHATWG는 web form과 application에 대한 표준을 만들던 곳이라고 합니다. 중간에 XHTML이 나오기는 했지만, HTML의 XML 버전에 ..
6. XSL & XML 안녕하세요.지난 강좌까지 XML 문서와 DTD 문서에 대해서 간단히 알아 보았습니다. 오늘은 기초 강좌의 마지막으로 XSL에 대해서 또 간략하게 알아보도록 하겠습니다. 사용될 예제는 지난번에 사용된 cds.xml을 확장해서 사용합니다. 역시 소스는 자료모음 에서 받으면 됩니다. 지난번에 설명했듯이 XML은 문서의 구조를 표현하는 것과 문서를 보여주는 것(포매팅)이 서로 분리 되어 있다고 했습니다. 이렇게 XML 문서를 보여주기 위해서 사용되는 것이 XSL과 CSS가 있습니다. CSS는 HTML에서도 사용되었던 것입니다. 이걸 XML에 적용한 것이구요. XSL은 SGML에 있었던 DSSSL을 확장한 것이라 생각하면 됩니다. 간단한 XML 문서의 경우 CSS를 사용할 수 있지만 제대로..