미니 서평 약팀이 강팀을 이기는 드라마 같은 스토리… 데이터에 기반해 문제를 해결해나가는 흥미진진함에 단숨에 읽어버렸다. 등장하는 선수들의 실제 메이저리그 성적을 확인해 볼 수 있다는 것도 하나의 재미요소다. 브래드 피트 주연의 영화로도 만들어진 이 책은 오클랜드 애슬레틱스의 빌리 빈 단장이 재정이 악화되어 트레이드를 할 수 밖에 없는 상황에서 통계 기반 세이버매트릭스를 활용하여 2002년 시즌을 성공적으로 만들어낸 실화를 바탕으로 하고 있다. 책을 보고 나면 야구에 대한 이해도가 높아진다. 예를 들면, 국내 프로야구도 2000년대 부터 OPS를 도입하기 시작했었다. 단순히 OPS가 "출루율 + 장타율"인 것만 알았다. 그러나 타율과 타점 보다 타자를 평가하는데, 정확하게는 경기를 승리하는데 기여하는 정..
미니 서평 이제는 사물인터넷 시대가 주목받고 있다. 모든 사물이 인터넷으로 연결되는 시대의 모습은 어떨까? 에릭슨에서 2012년 10월 공개한 영상을 보면, 주인공이 집안의 사물들과 메신저로 대화 하고, 각 사물들은 서로 의사소통하면서 집안 관리를 하는 것을 볼 수 있다. 스마트폰의 등장이 새로운 시장을 만든 것 이상으로 사물인터넷은 대규모의 매력적인 시장을 창출할 것으로 기대하고 있다. 헬스케어, 스마트홈, 보안, 육아 등 우리 생활 자체를 대상으로 하는 분야이기 때문이다. 그러나 PDA 시절의 모바일이 그랬듯이 사물인터넷도 애플이나 구글과 같은 플랫폼을 장악하는 벤더가 나올 때까지 많은 시행착오를 겪게 될 것이다. 빅데이터가 과거의 데이터웨어하우스, 데이터 마이닝에서 출발한 것처럼 사물인터넷도 유비쿼..
엑셀을 활용하여 선형 회귀 분석을 만드는 방법을 살펴봤다. 분산형 차트를 통해 선형 그래프를 그릴 수 있었다. 아래 그림을 보면, y= 0.002x - 0.6 이라는 수식이 보인다. 이것이 선형 회귀 분석에서 가장 필요로 하는 기본 수식이다. 선형 회귀 분석은 새로운 X 값이 주어졌을 때, Y 값을 예측하는 용도로 주로 사용한다. 위 예제는 "노출에 따른 클릭 수"로서 "만약 노출이 1500번 일어났다면, 클릭은 몇번 일어날까?" 같은 질문에 답을 줄 수 있다. 위 수식에서 x 대신 1500을 대입하면 된다. y = 0.002 x 1500 - 0.6 = 2.4 즉, 1500번 노출이 발생하면 2.4의 클릭이 일어날 것이라고 할 수 있다. 이런 수식을 선형 회귀 분석에서는 어떻게 구할까? "최소 자승법"이..
엑셀은 장부 정리와 같은 기본적인 스타일시트 툴로 잘 알려져 있지만, 분석(Analysis) 측면에서도 정말 괜찮은 프로그램이다. 오늘은 엑셀을 이용해서 선형 회귀 분석을 수행하는 방법을 정리해 보려고 한다. 선형 회귀 분석(Linear Regression)… 말이 어려워 보일 뿐, 중고등학교 시절 수학 시간에 배운 X축, Y축의 선형 그래프를 생각해 보면 된다. 엑셀로 선형 회귀 분석을 하기 위해서 간단한 데이터를 만들어 보자. 광고 노출과 클릭간의 관계를 살펴볼 수 있는 데이터를 가상으로 구성한다. (다음 글에서 실제 광고 노출/클릭 데이터를 가지고 회귀분석을 해 볼 계획이다.) 다음과 같은 결과를 만드는 것이 최종 목표이다. 분산형 차트 활용 먼저 엑셀에서 출력할 위 데이터를 모두 선택한 후, "삽..
- Total
- Today
- Yesterday
- SCORM
- java
- 통계
- 마케팅
- mysql
- 아이폰
- HTML
- 디자인
- 자바스크립트
- 도서
- 빅데이터
- 애플
- 구글
- ms
- Hadoop
- 세미나
- 모바일
- r
- 안드로이드
- 하둡
- XML
- 웹
- 맥
- 분석
- 클라우드
- fingra.ph
- 책
- 프로젝트
- 자바
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |