Pandas groupby()

1 개요[ | ]

Pandas groupby()

2 기본[ | ]

import pandas as pd
df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',
                              'Parrot', 'Parrot'],
                   'Max Speed': [380., 370., 24., 26.]})
df

df.groupby(['Animal']).mean()

3 계층적 인덱스[ | ]

level 매개변수를 사용하여 계층적 인덱스의 여러 수준을 그룹화할 수 있다.

arrays = [['Falcon', 'Falcon', 'Parrot', 'Parrot'],
          ['Captive', 'Wild', 'Captive', 'Wild']]
index = pd.MultiIndex.from_arrays(arrays, names=('Animal', 'Type'))
df = pd.DataFrame({'Max Speed': [390., 350., 30., 20.]},
                  index=index)
df

df.groupby(level=0).mean()

df.groupby(level="Type").mean()

dropna 매개변수를 설정하여 그룹 키에 NA를 포함할지 여부를 선택할 수도 있다. 기본 설정은 True이다.

l = [[1, 2, 3], [1, None, 4], [2, 1, 3], [1, 2, 2]]
df = pd.DataFrame(l, columns=["a", "b", "c"])
df

df.groupby(by=["b"]).sum()

df.groupby(by=["b"], dropna=False).sum()

l = [["a", 12, 12], [None, 12.3, 33.], ["b", 12.3, 123], ["a", 1, 1]]
df = pd.DataFrame(l, columns=["a", "b", "c"])
df

df.groupby(by="a").sum()

df.groupby(by="a", dropna=False).sum()

4 같이 보기[ | ]

5 참고[ | ]

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html