티스토리 뷰
엑셀은 장부 정리와 같은 기본적인 스타일시트 툴로 잘 알려져 있지만, 분석(Analysis) 측면에서도 정말 괜찮은 프로그램이다.
오늘은 엑셀을 이용해서 선형 회귀 분석을 수행하는 방법을 정리해 보려고 한다.
선형 회귀 분석(Linear Regression)…
말이 어려워 보일 뿐, 중고등학교 시절 수학 시간에 배운 X축, Y축의 선형 그래프를 생각해 보면 된다.
엑셀로 선형 회귀 분석을 하기 위해서 간단한 데이터를 만들어 보자.
광고 노출과 클릭간의 관계를 살펴볼 수 있는 데이터를 가상으로 구성한다.
(다음 글에서 실제 광고 노출/클릭 데이터를 가지고 회귀분석을 해 볼 계획이다.)
다음과 같은 결과를 만드는 것이 최종 목표이다.
분산형 차트 활용
먼저 엑셀에서 출력할 위 데이터를 모두 선택한 후, "삽입" > "분산형" 그래프를 선택한다.
아래 그림과 같은 분산형 차트가 생성될 것이다.
메뉴에서 "차트도구"의 "레이아웃" > "추세선" > "기타 추세선 옵션"을 선택한다.
이 "추세션"이 바로 엑셀 회귀 분석의 핵심이다.
여기에서 "선형"을 선택하고, 하단의 "수식을 차트에 표시", "R-제곱 값을 차트에 표시"를 체크하도록 하자.
그리고 난 후, 그래프를 보면 다음과 같다.
위 데이터에 대한 선형 회귀 분석을 통한 방정식이 하나 만들어 졌고, 결정계수(R-제곱) 값도 구한 것이다.
데이터 분석 활용
대부분 엑셀에 "데이터 분석"이라는 메뉴가 있는 것을 모를 것이다.
왼쪽 상단의 로고를 선택한 후, "Excel 옵션"을 실행하자.
그리고 왼쪽 메뉴에서 "추가 기능"을 선택하고, 우측 하단의 "이동" 버튼을 클릭한다.
여기에서 "분석 도구"를 체크하고 "확인" 버튼을 적용한다.
이제 "데이터" > "데이터 분석"이 있는 것을 볼 수 있다.
"데이터 분석"을 선택하고, "회귀 분석"을 지정한 후, "확인"을 누른다.
X축, Y축을 지정하면 해당 데이터에 대한 회귀 분석 결과를 아래와 같이 만들어 준다.
선형 회귀 분석 데이터를 요약해서 보여준다.
선형 회귀 분석의 데이터를 이해하고 활용하는 부분은 다음 글에서 설명하기로 하자...
'Cloud&BigData > BigData' 카테고리의 다른 글
선형 회귀 분석의 결정계수를 통한 적합성 검증 (1) | 2014.12.29 |
---|---|
선형 회귀 분석의 데이터를 이해해 보자~ (2) | 2014.11.03 |
실시간 처리를 위한 분산 메시징 시스템 카프카(Kafka) (0) | 2014.03.03 |
빅데이터에서 실시간 처리 기술에 대한 정리 (0) | 2013.10.28 |
데이터 분석(Analytics)의 가치는 어느 정도일까? (0) | 2013.07.26 |
- Total
- Today
- Yesterday
- 하둡
- 빅데이터
- fingra.ph
- 자바스크립트
- java
- 구글
- 애플
- 클라우드
- 도서
- SCORM
- 통계
- mysql
- 맥
- HTML
- 분석
- 모바일
- XML
- 마케팅
- 아이폰
- r
- 프로젝트
- 안드로이드
- 세미나
- 책
- 디자인
- 자바
- Hadoop
- ms
- 웹
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |