"가변수"의 두 판 사이의 차이

 
(같은 사용자의 중간 판 15개는 보이지 않습니다)
3번째 줄: 3번째 줄:
;[[假]][[變數]], [[dummy]] [[變數]]
;[[假]][[變數]], [[dummy]] [[變數]]
;가변수, 더미 변수, 지시 변수
;가변수, 더미 변수, 지시 변수
* [[원핫 인코딩]]으로 생성되는 변수
* 독립변수를 0과 1로 변환한 변수
* 독립변수를 0과 1로 변환한 변수
* 여러 집단 중에서 특정 집단을 지칭하는 변수
* 어떠한 특정 조건이 존재하는지 여부에 따라 그 값이 1이나 0이 되는 변수
* 어떠한 특정 조건이 존재하는지 여부에 따라 그 값이 1이나 0이 되는 변수
* 질적 변수를 회귀분석에 사용하기 위해 그 가부를 0 혹은 1 의 숫자 형태로 대응시킨 변수
* 질적 변수를 회귀분석에 사용하기 위해 그 가부를 0 혹은 1 의 숫자 형태로 대응시킨 변수
* 변수가 범주형일 경우 각 범주들을 지칭하기 위해 만들어진 변수로 각 범주에 속하느냐 아니냐에 따라 0이나 1의 값을 갖는 변수
* 변수가 범주형일 경우 각 범주들을 지칭하기 위해 만들어진 변수로 각 범주에 속하느냐 아니냐에 따라 0이나 1의 값을 갖는 변수
* 독립변수로 사용된다.
* 주로 회귀분석에서 독립변수로 사용된다.
* 예: 성별 (남자=0, 여자=0)
* 범주형 변수(성별, 종교, 학력, 직업, 지역 등)에 적용한다.
* 변수의 범주가 몇 개냐에 따라 가변수의 개수가 결정되는데 범주의 수(k)에서 하나를 뺀 개수만큼(k-1)의 가변수가 만들어질 수 있다.


==같이 보기==
==같이 보기==
{{z컬럼3|
* [[변수]]
* [[변수]]
* [[독립변수]]
* [[독립변수]]
* [[회귀분석]]
* [[회귀분석]]
* [[범주형 변수]]
* [[범주형 변수]]
* [[원-핫 인코딩]]
* [[데이터 전처리]]
* [[R dummy_cols()]]
}}


==참고==
==참고==
24번째 줄: 32번째 줄:
* {{네이버백과}}
* {{네이버백과}}


[[분류: 데이터 전처리]]
[[분류: 회귀분석]]
[[분류: 회귀분석]]
[[분류: 변수]]
[[분류: 변수]]
[[분류: 假]][[분류: 變]][[분류: 數]]
[[분류: 假]][[분류: 變]][[분류: 數]]

2022년 4월 29일 (금) 03:04 기준 최신판

1 개요[ | ]

dummy variable, indicator variable, design variable, one-hot encoding, Boolean indicator, binary variable, qualitative variable
變數, dummy 變數
가변수, 더미 변수, 지시 변수
  • 원핫 인코딩으로 생성되는 변수
  • 독립변수를 0과 1로 변환한 변수
  • 여러 집단 중에서 특정 집단을 지칭하는 변수
  • 어떠한 특정 조건이 존재하는지 여부에 따라 그 값이 1이나 0이 되는 변수
  • 질적 변수를 회귀분석에 사용하기 위해 그 가부를 0 혹은 1 의 숫자 형태로 대응시킨 변수
  • 변수가 범주형일 경우 각 범주들을 지칭하기 위해 만들어진 변수로 각 범주에 속하느냐 아니냐에 따라 0이나 1의 값을 갖는 변수
  • 주로 회귀분석에서 독립변수로 사용된다.
  • 범주형 변수(성별, 종교, 학력, 직업, 지역 등)에 적용한다.
  • 변수의 범주가 몇 개냐에 따라 가변수의 개수가 결정되는데 범주의 수(k)에서 하나를 뺀 개수만큼(k-1)의 가변수가 만들어질 수 있다.

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}