R regsubsets()

1 개요[ | ]

R regsubsets()

"Functions For Model Selection → 모델 선택용 함수"

library(leaps)
subsets = regsubsets(Fertility~., data=swiss)
summary(subsets)

library(leaps)
subsets = regsubsets(as.matrix(swiss[,-1]), swiss[,1])
summary(subsets)

options(echo=T)
library(leaps)

df = swiss
# 모든 조합 확인
subsets = regsubsets(Fertility ~ ., data=df, nbest=32, method="exhaustive")
summ = summary(subsets)
results = data.frame(
  p     = rowSums(summ$which)-1,
  rss   = summ$rss,
  rsq   = summ$rsq,
  adjr2 = summ$adjr2,
  bic   = summ$bic
)

# BIC 최소화하는 변수조합 선택
(idx = which.min(results$bic))
results[idx,]
coef(subsets, id=idx)

options(echo=T)
library(leaps)

df = swiss
# 모든 조합 확인
subsets = regsubsets(Fertility ~ ., data=df, nbest=32, method="exhaustive")
summ = summary(subsets)
results = data.frame(
  p     = rowSums(summ$which)-1,
  rss   = summ$rss,
  rsq   = summ$rsq,
  adjr2 = summ$adjr2,
  bic   = summ$bic
)

# BIC 최소화하는 변수조합 선택
(idx = which.min(results$bic))
results[idx,]

# lm()으로 다시 회귀분석
(vars = names(summ$which[idx,])[summ$which[idx,]][-1])
formula = as.formula(paste('Fertility ~',paste(vars,collapse='+')))
model = lm(formula, data=df)
summary(model)

2 같이 보기[ | ]

3 참고[ | ]

https://www.rdocumentation.org/packages/leaps/versions/2.1-1/topics/regsubsets