본문 바로가기
[R]

[R] Mytable 범주가 일부만 나올때 대처법!

by 모모바미키라리 2022. 11. 23.

mytable을 처음 사용할때, 있었던 오류가 있는데 범주형 변수로 뽑을때 일부 범주형 변수들은

테이블에 나오지 않는 오류를 경험했다. ㅠㅠ 

그래서 내가 찾은 해결책은 ! "불순물 제거하기" 이다. 

 

예를 들면.. 

d라는 데이터셋이 있다고 해보자. 사람의 나이와 학력을 나타낸 데이터 셋을 임의로 생성하였다. 

 

이 데이터를 가지고 mytable을 실행하면

 

제대로 실행이 된다. 그럼 여기서 뭐가 오류라는거냐 싶겠지만, 지금처럼 범주가 4개일때는 콤마, 공백 등 여러가지가 있어도 잘 돌아가지만, 실제로 접하는 데이터는 범주도 훨 ~ 씬 많았고 불순물(괄호,공백,바(/)등)이 많이 포함 된 데이터 였는데 범주가 적다면 괜찮지만 범주의 수가 많아질수록 오류가 나는것 같았어요.

 

예를들면 대졸(졸업 예정자, 석사/박사 포함) 이런식으로 범주의 이름 안에 공백,"/", 콤마 등이 들어가 있는형태가 

많을수록 오류가 나는것 같아요. 어디까지나 제 추측이고 경험담입니다 ㅠㅠ 

 

 

혹시 저처럼 범주가 (100개 이상 ~ ) 많으면 제가 했던것 처럼 오류가 날지도 모릅니다.

만약 오류가 난다면 불순물을 모두 제거하거나 대체해서 돌리시면 돼요 :) (gsub함수 사용)

저는 대졸(졸업 예정자, 석사/박사 포함) --> 대졸_졸업_예정_석박포함 이런식으로 변경했더니 잘 돌아갔어요! 

불순물 : 괄호, 콤마, 공백 등...

 

댓글