예전에 공개 소프트웨어 하면 리눅스를 가장 먼저 떠올렸었는데요. 최근 스마트폰의 등장과 함께 안드로이드나 빅데이터 세계에서의 하둡이 나타나면서 오픈소스에 대한 관심도 높아지는 것 같습니다. 국내에서도 7번째를 맞는 공개SW 개발자 대회(http://project.oss.kr/)가 시작되었습니다. 이와 관련하여 지난 5월 16일 공개SW 개발자 대회 그랜드 오프닝 세미나가 열렸었습니다. "오픈 소스를 활용한 Big Data & Analytics"라는 주제로 저도 발표를 했었는데요. Big Data와 Analytics의 개념과 오픈소스 하둡(Hadoop)에 대한 기본적인 내용을 설명했고, 현재 제가 수행하고 있는 모바일 분석 플랫폼인 Fingra.ph를 소개하면서 Big Data 분석이 실제로 어떻게 사용되..
1993년 출간된 책이라고 하는데요. 지금 읽어봐도 좋은 마케팅 전략이라고 생각합니다. 물론 개인적으로 전부 다 동의하는 것은 아니지만 알 리스와 잭 트라우트가 이야기하는 22가지 마케팅 불변의 법칙을 정리해 보도록 하겠습니다. 사례들은 책을 한번 읽어보시기 바랍니다. 1. 리더십의 법칙 (Leadership) 더 좋기 보다는 최초가 되는 편이 낫다. 자기 회사가 더 좋은 제품이나 서비스를 갖고 있다는 사실을 소비자에게 확신시키는 것이 마케팅의 기본이라고 생각하는 사람들이 너무 많다. 그러나 마케팅의 기본은 바로 최초가 될 수 있는 영역을 만들어내는 것이다. 지금과 같은 레드오션 환경에서는 성공한 제품과 유사한 미투(me-too) 제품이 이윤을 낳는 성공적인 브랜드가 될 가능성은 매우 희박하다. 어떤 영..
불확실성에 대한 일어날 가능성을 모델링하는 것이 Probability Theory라고 하고, 이런 불확실한 상황에서 추론에 근거해 결정을 내리는 것을 Decision Theory라 합니다. 그렇다면 Information Theory는 이러한 불확실성을 평가하는 것이라고 정의할 수 있습니다. 먼저 Information Theory에 대한 기본 개념을 쉽게 이해하기 위해서 aistudy.co.kr에 있는 예제를 기반으로 설명해 보도록 하죠.. 다음과 같이 가로, 세로 4장씩의 카드가 놓였다고 할 때, 여러분이 한 장의 카드를 선택했다고 해 보죠. 다음과 같은 질문 과정을 거쳐서 선택한 카드를 맞출 수 있습니다. 상단에 있습니까? 예 그럼 상단의 오른쪽 반에 있습니까? 아닙니다. 그럼 왼쪽 반의 상단에 있습니..
앞에서 확률이론과 Bayesian & Frequentist에 대해서 살펴봤습니다. 기계학습의 목표는 이러한 이론들을 활용해서 주어진 입력값 x에 대한 타겟인 t를 예측하는 것이었습니다. 불확실성에 직면해서 결정을 내려지 않으면 안될 경우, 어떤 결정을 해야 하고, 어떤 정보를 이용해야 하는지에 대해서 다루는 것이 바로 의사결정이론 (Decision Theory)입니다. Decision Theory 병원에서 암을 진단하기 위해 X-ray 사진이 주어졌다고 생각해 봅시다. X-ray 사진을 보고 암에 걸렸는지 아닌지 결정해야 할때, Decision Theory를 활용할 수 있습니다. 암일 경우를 클래스 1(C1)이라고 하고, 암이 아닌 경우를 클래스 2(C2)라고 할 때, 주어진 X-ray 사진(x)이 특정..
기계학습(Machine Learning)에 대해서 관심이 높아지는 것 같습니다. 하지만 관련된 자료가 많지 않은 듯 해서 올려봅니다. 먼저 최근 Facebook 친구가 되신 분의 타임라인에 올라와서 확인한 자료인데요. 빅데이터에서의 기계학습(Machine Learning on Big Data)로서 잘 구성된 것 같습니다. 이 자료에 대한 설명과 함께 들으면 좋겠다는 생각이 들기도 하네요.. Machine Learning on Big Data from Max Lin 그리고 스탠포드 대학의 Andrew Ng 교수의 Machine Learning 강의도 훌륭합니다. iTunes University에서 "Machine Learning"으로 검색해도 나오구요. Coursera에서도 무료로 볼 수 있습니다. (ht..
예전에 소크라테스하면 "너 자신을 알라", "악법도 법이다"라는 말이 가장 먼저 떠올랐습니다. 사람들에게 무지함을 일깨우고 독이 든 성배를 마셔 법을 준수하는 모습을 보였다고 하는 소크라테스.. 그의 제자인 플라톤의 책 "소크라테스의 변명"을 통해서 살펴볼 수 있었습니다. 지난번 읽은 소크라테스 이전 철학자보다 훨씬 읽기도 편하고 쉽게 느껴지는 책입니다. ^^ 소크라테스의 변명 통독: 2013.04.19 ~ 2013.04.22 소크라테스가 법정에 서게 된 이유부터 최후 변론까지 정리된 글입니다. 소크라테스가 자연을 탐구하는 자라는 고소 내용중의 하나에 대해 그는 자연철학자를 경멸하지는 않지만 스스로 자연에 대한 사색과는 관계가 없다고 말합니다. 실제로 소크라테스는 자연보다는 인간을 탐구하는 것이 더 중요..
빅데이터의 등장과 함께 Analytics에 대한 관심도 높아지고 있습니다. 넓은 의미의 Analytics는 의사 결정권자에게 실행할 수 있는 인사이트를 제공해주는 것이라 할 수 있습니다. 좁은 의미로는 사용자에게 데이터로부터 패턴을 파악해서 제공할 수 있는 기술이나 프로세스를 말합니다. 일반적으로 IT와 관련된 용어들은 여러가지 측면에서 의미를 부여할 수 있습니다. 보통 비즈니스 측면과 기술적 측면으로 나눠 볼 수 있는데요. Analytics도 넓은 의미는 비즈니스 측면이고 좁은 의미는 기술적인 측면이라고 말 할 수 있겠죠. 넓은 의미의 Analytics 일반적으로 데이터를 분석하는 목표는 비즈니스를 성공적으로 이끌어내기 위함입니다. 즉, 넓은 의미의 Analytics는 비즈니스 자체에 목적을 두고 있다..
이전에 살펴본 베이즈 확률(Bayesian Probabilities)과 가우스 분포(Gaussian Distribution) 에서 Frequentest와 Bayesian에 대해서 정리를 했었습니다. 실제 Curve Fitting에서 이 두가지 방식이 어떻게 적용되는지 살펴보도록 하죠. Curve Fitting에 대해서는 기계학습 첫 강좌에서 설명했었습니다. 주어진 입력값 x에 대한 타겟을 t라고 했을 때, x에 대응하는 값 y(x, w)에 대해 다음과 같은 관계가 성립한다고 합니다. 다음 그림을 옆으로 보면 y(x,w)에 대해 정규 분포의 형식을 가지고 있는 것을 알 수 있습니다. 정규분포를 따르므로 y(x,w)는 평균, β−1은 분산이 된다는 것을 알 수 있습니다. 앞서 정리한 가우스 분포(정규 분포)..
확률에서 많이 사용하는 베이즈 정리는 "확률 - 일어날 가능성을 측정하는 방법"의 끝부분에도 간략하게 정리했었습니다. 이번에는 베이즈 정리를 좀 더 깊이있게 알아보도록 하죠. 베이즈 확률 (Bayesian Probabilities) 실생활에서 베이즈 정리는 스펨 메일 필터링이나 유전자 검사 등에서 활용한다고 했습니다. 기계학습에서도 이런 베이즈 정리를 많이 사용하는데요. 이전의 기계학습 예제를 설명할 때, Training Set에서 주어진 X에 대해 적절한 곡선을 만들어 주는 것을 Curve fitting이라고 했었습니다. 이러한 Curve fitting을 하는 방법이 보통 두가지가 있는데요. 하나는 Frequentist treatment이고 나머지 하나가 Bayesian treatment입니다. 여기에..
통독: 2013.01.01 ~ 2013.04.06 올해부터 인문고전이나 철학책을 틈틈이 읽어보려고 합니다. 그 첫번째로 선택한 책이 바로 "소크라테스 이전 철학자들의 단편 선집"입니다. 그리스 철학이라고 하면 소크라테스-플라톤-아리스토텔레스를 이야기 하는데 그 이전의 철학자들의 관심과 생각들이 궁금해서 선택하게 되었습니다. 그런데 역시 어렵네요.. ^^ 통독을 하는데 무려 3개월여가 걸렸습니다. 이 책만 들고 있으면 졸기도 하고 이해도 안되는 부분도 상당히 많았습니다. 하지만 그 시대에 모두들 신이 세상을 만들었다는 신화적 사고에서 벗어나지 못하고 있을 때, 자연과 인간에 대한 탐구를 통해 새로운 생각들을 만들어 낸 초기 철학자들의 모습을 과거의 단편적인 인용 속에서 살펴볼 수 있었던 점은 좋았습니다. ..