안녕하세요.
오늘은 R로 데이터를 불러오는 방법이에요.
R에서는 2가지 데이터를 불러올 수 있어요. 첫번째는 R에 내장된 데이터, 두번째는 내가 가진 데이터.
- 내장된 데이터 불러오기
우선 내장된 데이터를 불러와볼게요.
가장 많이 사용하는 iris 데이터셋을 불러올게요.
iris 데이터셋은 붓꽃에 대한 데이터로 꽃의 길이와 너비, 종류로 구성된 데이터에요.
data("iris")
위 코드를 입력해주시면 R에 내장된 iris 데이터를 불러와요.
오른쪽 Environment를 보시면 데이터가 총 150행, 5열 임을 확인 할 수 있어요.
이건 dim이라는 함수를 사용해도 확인 할 수 있어요.
dim(iris)
iris 데이터를 한번 보고 싶다면 아래처럼 입력해주세요.
head 함수를 사용하면 맨 위의 6개 행만 보여줘요.
head(iris)
실무에서 일하며 이 함수를 사용할때는,
데이터에 어떤 변수가 있는지 확인 할 때, 전처리가 잘 됐는지 확인 할 때에요.
또, 열의 이름만 확인할 수도 있어요.
names(iris)
names 함수를 실행하면 데이터셋의 열 이름을 쭉 보여줘요.
또 str() 함수를 사용하면
데이터의 열이 어떤 타입인지 확인 할 수 있어요.
str(iris)
iris는 데이터 프레임이고, Species(종류)만 Factor형태이고 나머지는 모두 Number 형태네요.
이런식으로 간략하게 iris 데이터를 살짝 훑어봤어요
다음 포스팅에서는 iris를 가지고 기본적인 통계값을 산출해볼게요
'[R] 기초' 카테고리의 다른 글
[R] 경로 설정하기 (Getwd, Setwd) (0) | 2022.12.25 |
---|
댓글