Sklearn 다항로지스틱회귀분석

Jmnote (토론 | 기여)님의 2020년 4월 12일 (일) 22:20 판 (→‎개요)

1 개요

Sklearn 다항로지스틱회귀분석
# 데이터 준비
from sklearn import datasets
iris = datasets.load_iris()
df_x = iris.data
df_y = iris.target
print( len(df_x), len(df_y) )       # 150 150

# 훈련셋/테스트셋 분리
import numpy as np
train_x = df_x[np.arange(len(df_x)) % 5 != 4]  # 매 5번째만 제외
train_y = df_y[np.arange(len(df_y)) % 5 != 4]  # 매 5번째만 제외
test_x = df_x[np.arange(len(df_x)) % 5 == 4]   # 매 5번째만 포함
test_y = df_y[np.arange(len(df_y)) % 5 == 4]   # 매 5번째만 포함
print( len(train_x), len(train_y) ) # 120 120
print( len(test_x), len(test_y) )   # 30 30

# fit model
from sklearn.linear_model import LogisticRegression
model = LogisticRegression(C=1000).fit(train_x, train_y)
print( model )

# 테스트셋 예측
predicted = model.predict(test_x)
import pandas as pd
pd.crosstab(predicted, test_y)

2 같이 보기

3 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}