'통계' 태그의 글 목록

통계조작에 속지 않으려면...

미국의 저널리스트인 대럴 허프는 "통계 용어를 올바르게 이해하고 정직하게 사용하는 발표자와, 사용된 용어의 뜻을 올바르게 이해할 수 있는 대중들이 함께 하지 않는다면 그 결과는 황당한 말장난에 불과"하다고 말한다. 그래서 그는 "새빨간 거짓말, 통계"란 책에서 통계 수치를 그대로 믿으면 안된다고 말한다. 표본의 크기, 비율에 따라 통계 결과가 달라지기도 하고, 산술평균값, 중앙값, 최빈값 등 어떤 평균을 사용하느냐에 따라 의미가 달라지기도 하고, 그래프 축의 간격만 바꿔도 시각적으로 전혀 다른 모습을 보여줄 수도 있기 때문이다. 이러한 통계 조작에 속지 않으려면 다음의 5가지 질문으로 통계 자료를 찔러봐야 한다고 저자는 말한다. 1. "누가 발표했는가?" 즉 통계의 출처를 살펴봐야 한다. 통계를 사용하는..

컴퓨터공학/통계학 2022. 12. 13. 08:41

머니볼 - 불리한 게임을 승리로 이끄는 기술

미니 서평 약팀이 강팀을 이기는 드라마 같은 스토리… 데이터에 기반해 문제를 해결해나가는 흥미진진함에 단숨에 읽어버렸다. 등장하는 선수들의 실제 메이저리그 성적을 확인해 볼 수 있다는 것도 하나의 재미요소다. 브래드 피트 주연의 영화로도 만들어진 이 책은 오클랜드 애슬레틱스의 빌리 빈 단장이 재정이 악화되어 트레이드를 할 수 밖에 없는 상황에서 통계 기반 세이버매트릭스를 활용하여 2002년 시즌을 성공적으로 만들어낸 실화를 바탕으로 하고 있다. 책을 보고 나면 야구에 대한 이해도가 높아진다. 예를 들면, 국내 프로야구도 2000년대 부터 OPS를 도입하기 시작했었다. 단순히 OPS가 "출루율 + 장타율"인 것만 알았다. 그러나 타율과 타점 보다 타자를 평가하는데, 정확하게는 경기를 승리하는데 기여하는 정..

사색/독서 2014. 11. 30. 17:34

R 예제: 연관성 측정

두 변수 간의 통계적인 관계 측정 방식으로 사용하는 상관관계 측정으로 피어슨 상관계수, 스피어만 상관계수 등이 있다고 합니다. 피어슨 상관계수는 두 변수 X와 Y가 함께 변하는지와 따로 변하는지의 비율로 계산하는 것으로 가장 많이 사용된다고 합니다. X와 Y가 완전히 동일하면 +1, 완전히 다르면 0, 반대방향으로 동일하면 -1 값을 가진다고 하네요. 스피어만 상관계수는 자료의 값 대신 순위(랭킹)을 기준으로 상관관계를 계산하는 방식이라고 합니다. 이 값은 -1과 1 사이의 값을 가지는데, 두 변수의 순위가 완전히 일치하면 +1, 완전히 반대면 -1이 된다고 합니다. 스피어만 상관계수와 같이 순위를 기준으로 값을 측정하는 캔달의 타우도 있다고 하네요. 이번에 살펴볼 R 예제는 기온과 기압과 같은 시계열 ..

Cloud&BigData/R 2013. 11. 4. 08:47

통계를 왜 배워야 하는가?

미분적분, 수치해석, 확률통계~ 고등학교 때부터 대학교 초기까지 배웠던 통계 관련 과목들입니다. 그동안 별로 관심을 가지지 않고 지냈었는데.. 최근 프로젝트와 맞물려서 다시 공부를 해야 겠다는 생각을 했네요. 역시 사람은 뭐든지 필요할 때가 되어야 비로소 진정한 의미를 알고 다시 시작하는 건가 봅니다. ^^ 앞으로 꾸준히 통계 부분에 대해서는 공부를 하면서 가끔 정리해 볼 계획입니다. 제가 뭐 통계학자도 아니고, 수학을 전공한 사람도 아니기에 제가 이해하는 수준에서 나중에 참고할 수 있도록 부담없이 정리하려고 합니다. 혹시 제가 잘못 이해하고 있는 것을 본 전문가들은 가감없이 댓글 달아주시면 좋겠습니다. 통계의 중요성먼저 통계가 무엇인지부터 정리를 해야 할 것 같네요. Head First Statisti..

컴퓨터공학/통계학 2012. 12. 14. 08:30

웹에서 사용할 수 있는 무료 그래프 툴에 대하여

웹 사이트를 개발하다보면 통계나 각종 차트에 대해서 그래프를 출력해야 하는 경우가 있습니다. Flash나 Ajax를 이용해서 그래프를 출력할 수 있는 툴 들이 있어서 소개하도록 하겠습니다. 제가 직접 사용해 본 그래프 툴을 소개할 예정인데요. Fotographer INNO 님의 웹 디자인에 유용한 차트 & 그래프를 보니 정말 다양한 툴이 있는 것 같습니다. 좀 더 다양한 그래프를 보고 싶으신 분은 위 링크를 한번 방문해 보시기 바랍니다. Highcharts - Ajax로 모바일까지 지원하는 그래프 툴Highcharts는 Ajax로 되어 있는 그래프 툴로서 상용이 아닌 경우, 무료로 사용할 수 있구요. 상용 버전도 1개발자에 약 40만원 정도로 그리 비싸지 않습니다. 일단 Ajax로 구성되어 있어서 모바일..

프로그래밍/Web 2012. 6. 25. 00:52

2011년 디지털미디어 트랜드 보고서와 2012년 소매 유통 쇼핑몰 전망 자료

항상 새로운 기획이나 사업계획을 할 때 통계 자료를 찾아 헤매던 기억이 있네요. 트위터를 보다가 이런 자료들을 올려 놓은 분들이 계셔서 나중에 활용할 수 있을까 해서 올려봅니다. 1. 2011년 디지털미디어 트랜드 보고서 http://www.dmcmedia.co.kr/marketinginsight/2012/01/2011_digitalmedia_trendreport.pdf 광고 플랫폼과 관련된 업무를 하시는 분들에게는 도움이 될 것 같습니다. 광고나 트래픽 관련 각종 통계자료가 잘 나와 있구요 디지털 미디어의 이슈에 대해서도 모바일이나 SNS, 스마트 TV까지 정리되어 있습니다. 특히 요즘 Hot Issue인 모바일 광고에 대해서도 플랫폼이나 광고 업체별로 정리되어 있네요. 가장 도움이 되는 자료인 것 같..

사색/리뷰 2012. 1. 17. 08:13

모바일 어플리케이션 분석 툴이면서 (실제로는 광고 플랫폼인) Flurry

모바일 앱을 서비스하다 보면 다양한 통계 데이터를 보고 싶은 경우가 많습니다. 앱스토어에서는 단순히 다운로드 숫자만 볼 수 있는데요. 다운로드 이외의 사용자 접속이나 PV, UV 등의 데이터를 보고 싶은 경우가 있죠. 이럴 때 개별적으로 통계를 구축하기에는 서버도 필요하고 개발을 추가해야 하는 부분도 있습니다. 그러나 Flurry(http://www.flurry.com)라는 SDK를 이용하면 이런 문제를 해결할 수 있게 됩니다. 안드로이드의 경우, 특정 이벤트마다 OnStartSession()을 호출하고 종료될 때 OnEndSession()을 호출하면 쉽게 통계를 쌓을 수 있습니다. 특히 사용자가 빠르게 이벤트들을 지나가는 것을 체크하기 위해 10초 이내에 이어지는 것은 Start Session을 유지하..

사색/리뷰 2012. 1. 4. 08:45

2011년 블로그 결산

2011년 한 해가 저물어 가네요~항상 끝은 새로운 시작을 의미한다고 내일부터는 2012년 새해가 시작되네요. 올 한해 프로젝트를 정리해 보면서 1월에 계획했던 자료를 보니 느낌이 새로웠습니다. 또 다시 한해를 기획하고 내년 말에도 똑같은 감정을 느끼게 되겠죠. 이번에는 블로그도 한번 정래 보려고 합니다. 올 9월 부터는 블로그에 내가 생각하는 점이나 궁금해서 찾아본 자료들을 정리해서 올리는 형태로 운영을 꾸준히 해 봤습니다. 꾸준이 글을 올리니 아주 조용했던 블로그가 오히려 제 홈페이지보다 더 활성화가 되더군요. 그 어떤 것보다 꾸준히 노력하는 것이 중요하다는 점을 다시 한번 생각해 보게 되었습니다. 현재까지의 총 방문자 수가 26만명을 넘었네요.. 특히 10월부터는 방문자 수가 1만명 이상을 넘어서고..

사색/리뷰 2011. 12. 31. 08:41

이전 1 다음

이전 다음

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

루키의 보석함

티스토리툴바