티스토리 뷰

HTML 태그를 제거하고 순수하게 텍스트만 가져오는 부분이 필요해서 관련  소스를 정리해봤습니다. 
정규식에 대해서는 개념은 들어보셨을 겁니다. 
 
나중에 기회가 되면 정규식에 대해서도 한번 정리해 보도록 하구요.. 
오늘은 간단하게 원하는 기능을 구현한 소스를 보여드리도록 하겠습니다.
 
정규식을 6개 정도 적용하고 있는 간단한 소스입니다.
각각 HTML의 스크립트 태그와 내용, 스타일 및 내용, 태그들, 엔터티, 공백문자들을 제거하는 정규식 표현입니다.


관심있는 분들은 한번씩 테스트 해보시기 바랍니다. ^^ 
예전에 URL을 지정하면 해당 텍스트를 분석해서 자동으로 태깅 정보를 제공하는 것을 개발할 때 사용한 부분입니다. ~

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함