소연이의 메모장

[Pandas] 그룹별 평균 구하기 본문

Programming/Python

[Pandas] 그룹별 평균 구하기

xoyeon 2022. 10. 24. 23:50
반응형

pandas 를 활용한 연산은 밑의 블로그에 굉장히 상세하게 나와있다. 감동.

pandas 를 활용한 기본적인 산술과 통계 적용 & 이해

# Time 별로 그룹화
data_time = data.groupby('Time')
data_time
> <pandas.core.groupby.generic.DataFrameGroupBy object at 0x00000292C58B0148>

type(data_time)
> pandas.core.groupby.generic.DataFrameGroupBy

# 열 데이터 추출
time_v1 = data_time['V1']
type(time_v1)
> pandas.core.groupby.generic.SeriesGroupBy

# time 별로 그룹화 된 데이터프레임에서 'V1'의 평균 값 구하기
time_v1.mean()
>
Time
0.0         -0.083975
1.0         -1.162313
2.0         -0.792099
4.0          1.229658
7.0         -0.769278
              ...    
172785.0     0.120316
172786.0   -11.881118
172787.0    -0.732789
172788.0     0.839562
172792.0    -0.533413
Name: V1, Length: 124592, dtype: float64

# 그룹화한 데이터 개수 세기
data_time['V1'].nunique()
> 
Time
0.0         2
1.0         2
2.0         2
4.0         1
7.0         2
           ..
172785.0    1
172786.0    1
172787.0    1
172788.0    2
172792.0    1
Name: V1, Length: 124592, dtype: int64

# unique()와 value_counts()의 차이
data_time['V1'].value_counts()
> 
Time      V1        
0.0       -1.359807     1
           1.191857     1
1.0       -1.358354     1
          -0.966272     1
2.0       -1.158233     1
                       ..
172786.0  -11.881118    1
172787.0  -0.732789     1
172788.0  -0.240440     1
           1.919565     1
172792.0  -0.533413     1
Name: V1, Length: 283726, dtype: int64