빅데이터, 경영을 바꾸다 - 함유근.채승병 지음/삼성경제연구소 데이터를 얻는 능력, 즉 데이터를 이해하는 능력, 처리하는 능력, 가치를 뽑아내는 능력, 시각화하는 능력, 전달하는 능력이야말로 앞으로 10년간 엄청나게 중요한 능력이 될 것이다. - 할 배리언, 구글 수석 경제학자 과거를 돌이켜 보면 세상을 바꾸는 기술들이 분명히 있었습니다. 80년대 후반 처음 봤던 개인용 컴퓨터, 90년대 중반부터 사용하기 시작한 인터넷, 2000대 후반의 스마트폰 등.. 그러나 업계의 모든 기대를 받았지만 떠오르지 못하고 사라진 기술들도 많습니다. 하지만 잘 안되던 기술들이 다른 이름으로 융합되고 새롭게 나타나서 다시 성공하기도 하는 것 같습니다. 스마트폰도 2000년대 초반 PDA등의 실패가 지금 성공의 기초가 되었다..
평균(average)이란 것은 워낙 많이 사용해서 잘 알고 있다고 생각하기 쉽습니다. 학교 성적의 평균, 제품의 평균 가격 등 실생활에서도 많이 사용하기 때문이죠. 그런데 평균(average)에도 우리가 알고 있는 평균값(mean)이외에도 다른 종류의 평균이 존재합니다. 이에 대해서 간략하게 정리해 보도록 하죠. 평균값(mean) 가장 일반적인 평균값(mean) 계산 공식은 다음과 같습니다. 즉, 모든 수를 더한 다음에 총 개수로 나누면 평균값(mean)이 완성됩니다. 만약 도수가 있다면 다음과 같이 계산하면 됩니다. 각 수에 도수를 곱한 다음에 그 결과를 모두 더하고 도수의 합으로 나누는 것이죠. 그런데, 만약 값이 극단적으로 한쪽으로 치우쳐 있는 경우에 평균값(mean)은 왜곡될 경우가 있습니다. 예..
미분적분, 수치해석, 확률통계~ 고등학교 때부터 대학교 초기까지 배웠던 통계 관련 과목들입니다. 그동안 별로 관심을 가지지 않고 지냈었는데.. 최근 프로젝트와 맞물려서 다시 공부를 해야 겠다는 생각을 했네요. 역시 사람은 뭐든지 필요할 때가 되어야 비로소 진정한 의미를 알고 다시 시작하는 건가 봅니다. ^^ 앞으로 꾸준히 통계 부분에 대해서는 공부를 하면서 가끔 정리해 볼 계획입니다. 제가 뭐 통계학자도 아니고, 수학을 전공한 사람도 아니기에 제가 이해하는 수준에서 나중에 참고할 수 있도록 부담없이 정리하려고 합니다. 혹시 제가 잘못 이해하고 있는 것을 본 전문가들은 가감없이 댓글 달아주시면 좋겠습니다. 통계의 중요성먼저 통계가 무엇인지부터 정리를 해야 할 것 같네요. Head First Statisti..
지난 일주일 동안 중국 광저우에서 열린 China Mobile에서 개최한 GDC(Global Developer Conference) 2012에 다녀왔습니다. 작년에 비해서는 규모가 작았다고 하는데요. 그래도 중국 답게 행사장은 무지 크더군요.. 베이징 등 여러 지역에서 모인 걸 보니 모바일 분야에 대한 중국 내 관심을 알수 있었습니다. HTC는 NFC 결제와 관련된 데모를 중심으로 전시를 했구요. 앵그리버드, 닌자후르쯔 등을 중국내 퍼블리싱하는 게임업체를 비롯해 대만의 모바일 관련 업체인 M-Factory등을 살펴봤구요. 벽면을 가득 메운 모니터 마다 중국 내 업체들이 모바일 게임, 모바일 서비스 등을 전시하고 있었습니다. 저희는 이번에 모바일 앱의 통계 분석 솔루션인 Fingra.ph 서비스로 행사에 ..
새로운 미래가 온다 - 다니엘 핑크 지음, 김명철 옮김, 정지훈 감수/한국경제신문 세계적인 석학 다니엘 핑크(Daniel Pink)의 유명한 책으로 몇 년 전에 처음 읽었었는데요. 좌뇌와 우뇌에 대한 이야기라는 기억만 남아있는데 다른 책들에서 여러 부분의 인용이 많이 되고 있어 이번에 다시 한번 읽어봤습니다. 좌뇌와 우뇌 이야기 지금까지는 좌뇌에 기반한 논리적 절차적 사고가 중심이었다면 새로운 미래에는 우뇌 중심의 감성적인 요소가 필요하며 좌뇌와 우뇌를 함께 사용할 수 있는 능력이 필요하다고 말합니다. UCLA의 폴 에크먼(Paul Ekman) 교수는 실험을 통해 다음과 같은 결과를 얻어냈다고 합니다. 문화가 서로 다르다고 해서 하나의 표정을 놓고 서로 다른 감정을 떠올리는 경우는 없었다. 또한 캘리포니..
마흔, 논어를 읽어야 할 시간 - 신정근 지음/21세기북스(북이십일) "불혹" ― 어떠한 유혹에도 쉽게 넘어가지 않는다는 나이 마흔 ― 30대에 김광석의 "서른 즈음에"를 열심히 불렀던 것과 달리, 40대에 "논어", "소크라테스"와 같은 철학 책을 많이 보게 되네요. 저자인 신정근 님은 이미 "논어"와 관련된 많은 책을 쓰셨던 분입니다. "논어"하면, 어려운 한자가 제일 먼저 떠오릅니다. 하지만, 현대 사회 이슈와 비교해 설명하기 때문에, 기존 논어 책과 달리 쉽게 읽을 수 있습니다. 또한, 기("입문") - 승("승당") - 전("입실") - 결("여언")의 네부분으로 나누어, 하나의 주제를 단계적으로 잘 설명하고 있습니다. 전체적으로 다음 주제를 중심으로 6개의 강의로 구성되어 있습니다. 1강: 행..
빅데이터 비즈니스 - 스즈키 료스케 지음, 천채정 옮김/더숲 일본에서 경제경영 베스트셀러에 오른 책이라고 해서 잔뜩 기대를 하고 살펴봤습니다. 하지만 너무 번역체의 느낌이 나서 읽기가 쉽지는 않았습니다. 그래도 끝까지 읽어보니 내용 자체는 꽤 좋았다는 생각이 드네요. 빅데이터에 처음 관심을 가져본 분이라면 전체적인 개념을 잡기 위해서 한번쯤 읽어보셔도 좋을 것 같습니다. 빅데이터의 진정한 가치는 커다란 데이터 자체에 있는 것이 아니라 여기에서 추출할 수 있는 새로운 사회적 가치가 있는지 여부에서 나타난다. 먼저 1장에서 빅데이터 비즈니스란 무엇인가?를 다루고 있습니다. 빅데이터와 관련해서 스즈키 료스케는 이용사업자와 지원사업자의 관점에서 이야기를 시작합니다. 즉, 빅데이터를 활용하여 사업의 부가가치를 증..
오늘 블로그를 들어가고 깜짝 놀랐네요. 보통 크롬을 웹 브라우저로 자주 사용하고 있는데.. 빨간색 바탕에 다음과 같은 화면이 나오더군요.. ㅠㅠ 무슨 문제인지 확인하기 위해 "이 웹사이트 관련 문제점 세부사항"을 클릭해 봤습니다. 내용을 살펴보니 멀웨어를 배포한다고 하는데 중계 역할을 알라딘 사이트에서 수행하는 것 같았습니다. 그래서 일단 알라딘 ttb2를 가져오는 스크립트를 제거했습니다. 아마도 알라딘의 ttb2 서버에 문제가 있는 것 같네요. 하지만 스크립트를 제거해도 여전히 크롬에서는 악성코드 페이지로 나옵니다. 그래서 위 화면의 하단의 "Google 웹마스터 도구"를 클릭해서 구글로 "검토 요청을 보내야 합니다. 일단, 검토 요청은 보내놨는데.. 내일 중으로 다시 한번 확인해 봐야겠네요.. 개인 ..
빅데이터를 위해서는 크게 세가지 분야의 기술이 필요합니다. 첫째, 데이터의 획득 및 생성하기 위한 센서나 디바이스에 적용할 기술이 있습니다. 둘째, 데이터를 축적하기 위해 병렬처리와 같은 아키텍처나 스토리지가 관련 기술이 필요합니다. 마지막으로 축적된 데이터를 분석하기 위해 하둡과 같은 기술들이 필요하겠죠. 이번에는 축적된 빅데이터를 분석하는 기술에 대해서 한번 정리해 보려고 합니다. 흔히 빅데이터 = 하둡 이라고 생각을 많이 합니다. 전혀 틀린 이야기는 아니지만 하둡이 만능은 아니라는 점을 확실히 이야기 하고 싶습니다. 하둡은 다음과 같은 장점 때문에 빅데이터의 분석 기술로 각광받고 있습니다. 대용량 비정형 데이터를 기반으로 함.HDFS와 맵리듀스를 활용하여 쉽게 분산 처리가 가능함.PC급의 하드웨어 ..
올해부터 빅데이터에 관심이 부쩍 높아진 것 같습니다. 클라우드 환경이 대중화되고 하둡 등 분산 처리 기술이 일반화 되면서 자연스럽게 빅데이터에 대한 관심도 늘어나는 것 같습니다. 하지만 아직도 빅데이터를 단순히 대용량 데이터로만 생각하는 경향이 있어서 빅데이터의 의미와 실제 사례를 간략하게 정리해 보려고 합니다. 빅데이터 확장 배경 왜 빅데이터에 관심을 가지게 되었을까요? 먼저 하드웨어가 발달하고 ERP, CRM과 같은 것을 통해 데이터가 충분히 축적되었다는 것입니다. 이렇게 축적된 데이터를 통해 비즈니스에 기여할 수 있는 인사이트를 만들 수 있을까? 하는 고민이 빅데이터의 시작이라고 생각합니다. 모든 IT 관련 이슈들이 그러하듯 빅데이터란 것도 하루아침에 나타난 것이 아닙니다. 예전에 데이터베이스에서도..