Notice
Recent Posts
Recent Comments
Link
소연이의 메모장
[Pandas] 그룹별 평균 구하기 본문
반응형
pandas 를 활용한 연산은 밑의 블로그에 굉장히 상세하게 나와있다. 감동.
★pandas 를 활용한 기본적인 산술과 통계 적용 & 이해
# Time 별로 그룹화
data_time = data.groupby('Time')
data_time
> <pandas.core.groupby.generic.DataFrameGroupBy object at 0x00000292C58B0148>
type(data_time)
> pandas.core.groupby.generic.DataFrameGroupBy
# 열 데이터 추출
time_v1 = data_time['V1']
type(time_v1)
> pandas.core.groupby.generic.SeriesGroupBy
# time 별로 그룹화 된 데이터프레임에서 'V1'의 평균 값 구하기
time_v1.mean()
>
Time
0.0 -0.083975
1.0 -1.162313
2.0 -0.792099
4.0 1.229658
7.0 -0.769278
...
172785.0 0.120316
172786.0 -11.881118
172787.0 -0.732789
172788.0 0.839562
172792.0 -0.533413
Name: V1, Length: 124592, dtype: float64
# 그룹화한 데이터 개수 세기
data_time['V1'].nunique()
>
Time
0.0 2
1.0 2
2.0 2
4.0 1
7.0 2
..
172785.0 1
172786.0 1
172787.0 1
172788.0 2
172792.0 1
Name: V1, Length: 124592, dtype: int64
# unique()와 value_counts()의 차이
data_time['V1'].value_counts()
>
Time V1
0.0 -1.359807 1
1.191857 1
1.0 -1.358354 1
-0.966272 1
2.0 -1.158233 1
..
172786.0 -11.881118 1
172787.0 -0.732789 1
172788.0 -0.240440 1
1.919565 1
172792.0 -0.533413 1
Name: V1, Length: 283726, dtype: int64
'Programming > Python' 카테고리의 다른 글
[Python] 윈도우 환경에서 아나콘다를 활용하여 파이썬 설치하기 (0) | 2023.08.28 |
---|---|
[Pandas] 그룹화된 평균값을 시각화하기 (0) | 2022.10.24 |
[Pandas] 열과 행 단위로 데이터 추출하기(loc, iloc) (0) | 2022.10.24 |
[Pandas] csv 파일 불러오기 (0) | 2022.10.24 |
[Python] warning 메시지 숨기는 방법 (0) | 2022.08.16 |