R 데이터셋의 일부 데이터 가져오기

|



먼저 지난번에 설명한 R 데이터셋 처리 함수들의 일부를 살펴보자. 

table()로 일부 데이터 가져오기 

mtcars 데이터셋의 실린더 수를 가지고 str(), summary(), stem()을 적용하면 다음과 같다. 


str()을 사용하면 R 객체의 구조를 확인할 수 있고, 

summary()는 데이터에 대한 요약 정보를 보여준다고 했다. 

그리고 stem()은 줄기와 잎 형태로 데이터를 재구성해서 출력한다. 


하지만 자동차의 실린더 수에 따라 일반적으로 4기통, 6기통, 8기통으로 나눠지기 때문에

이런 이산적인 데이터에 대해서는 위와 같은 형태의 출력보다는 테이블 구조가 더 적합하다.

그래서 table()을 한번 적용해 보면 다음과 같이 출력된다. 


전체 자동차에 대해 좀더 확실하게 4, 6, 8기통으로 분류해서 확인해 볼 수 있다. 

만약 이 중에서 4기통과 6기통의 자동차에 대한 정보만 보고 싶으면 어떻게 할까? 

mtcars의 다음과 같이 조건을 주고 4, 6기통 자동차의 정보만 별도로 저장하면 된다. 

다른 정보도 잘 저장되어 있는지 확인하기 위해 str()메소드를 적용해 봤다. 


다음과 같이 조건을 테스트해보면 실린더 수가 4, 6인 것은 TRUE로 나오고 8인 것은 FALSE로 나오는 것을 알 수 있다. 

그러므로 mtcars에 해당 조건을 부여하면 TRUE인 값만 별도로 추출하게 된다. 


subset()으로 일부 데이터 가져오기

이와 유사하게 subset()을 활용할 수도 있다. 

subset()으로 조건을 지정할 수도 있고, 특정 열만 가져오도록 처리할 수도 있다. 

다음 예제를 살펴보면 쉽게 이애할 수 있을 것이다. 


mtcars1은 subset()에 조건만 부여해서 4, 6기통 자동차 정보를 가져온 것이다. 

mtcars2는 위에서 만들어진 mtcars1에 select를 통해 mpg와 cyl 열만 가져온 것이다. 

마지막으로 mtcars3는 원래 데이터인 mtcars에서 subset 조건과 select 열을 한꺼번에 지정해서 가져온 것이다. 


R 더 알아보기

R 실행을 위한 기본적인 내용들~

R 데이터 구조에 대한 정리

R 데이터셋 처리 함수들에 대한 간단한 정리~

R 데이터셋 정렬하기~


R 예제: 데이터 세트에서 관계 확인하기

R 예제: 연관성 측정

R 예제: 이산적 시계열값 예측하기

R 예제: 1이 연속으로 나오는 부분 찾기


신고



Trackback 0 And Comment 0