mytable을 처음 사용할때, 있었던 오류가 있는데 범주형 변수로 뽑을때 일부 범주형 변수들은
테이블에 나오지 않는 오류를 경험했다. ㅠㅠ
그래서 내가 찾은 해결책은 ! "불순물 제거하기" 이다.
예를 들면..
d라는 데이터셋이 있다고 해보자. 사람의 나이와 학력을 나타낸 데이터 셋을 임의로 생성하였다.
이 데이터를 가지고 mytable을 실행하면
제대로 실행이 된다. 그럼 여기서 뭐가 오류라는거냐 싶겠지만, 지금처럼 범주가 4개일때는 콤마, 공백 등 여러가지가 있어도 잘 돌아가지만, 실제로 접하는 데이터는 범주도 훨 ~ 씬 많았고 불순물(괄호,공백,바(/)등)이 많이 포함 된 데이터 였는데 범주가 적다면 괜찮지만 범주의 수가 많아질수록 오류가 나는것 같았어요.
예를들면 대졸(졸업 예정자, 석사/박사 포함) 이런식으로 범주의 이름 안에 공백,"/", 콤마 등이 들어가 있는형태가
많을수록 오류가 나는것 같아요. 어디까지나 제 추측이고 경험담입니다 ㅠㅠ
혹시 저처럼 범주가 (100개 이상 ~ ) 많으면 제가 했던것 처럼 오류가 날지도 모릅니다.
만약 오류가 난다면 불순물을 모두 제거하거나 대체해서 돌리시면 돼요 :) (gsub함수 사용)
저는 대졸(졸업 예정자, 석사/박사 포함) --> 대졸_졸업_예정_석박포함 이런식으로 변경했더니 잘 돌아갔어요!
불순물 : 괄호, 콤마, 공백 등...
'[R]' 카테고리의 다른 글
[R] mytable 범주가 숫자로 나타날 때 오류 해결 방법 (0) | 2022.11.23 |
---|---|
[R] 회귀분석 결과 테이블로 예쁘게 나타내기(feat.tab_model) (0) | 2022.11.23 |
[R] Mytable을 활용하여 데이터 표 완성하기 (평균,표준편차,P-VALUE) (0) | 2022.11.23 |
댓글