R 로지스틱회귀분석 (분류)

Jmnote (토론 | 기여)님의 2020년 5월 5일 (화) 21:53 판 (새 문서: ==개요== ;R 로지스틱회귀 분류 <source lang='console'> df = data.frame( Hours = c(0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

1 개요

R 로지스틱회귀 분류
df = data.frame(
  Hours = c(0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50),
  Pass = c(0,0,0,0,0,0,1,0,1,0,1,0,1,0,1,1,1,1,1,1)
)
msk = sample.split(df$Pass, SplitRatio=7/10)
Train = df[ msk,]
Test  = df[!msk,]

options(echo=TRUE)
model = glm(Pass ~ ., data=Train, family="binomial")
summary(model)
Test$Pass_predicted = ifelse(predict(model,Test)>0.5,1,0)
cat( "accuracy=", sum(Test$Pass==Test$Pass_predicted)/nrow(Test) )

2 같이 보기

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}