목록pandas (4)
소연이의 메모장
# python의 시각화 라이브러리 불러오기 import matplotlib.pyplot as plt # 시간별로 그룹화 data_time = data.groupby('Time') # 'V1'행 추출하여 평균 구해주기 time_v1 = data_time['V1'] time_v1_mean = time_v1.mean() # plot 메서드를 사용하여 그래프 그리기 time_v1_mean.plot()
pandas 를 활용한 연산은 밑의 블로그에 굉장히 상세하게 나와있다. 감동. ★pandas 를 활용한 기본적인 산술과 통계 적용 & 이해 # Time 별로 그룹화 data_time = data.groupby('Time') data_time > type(data_time) > pandas.core.groupby.generic.DataFrameGroupBy # 열 데이터 추출 time_v1 = data_time['V1'] type(time_v1) > pandas.core.groupby.generic.SeriesGroupBy # time 별로 그룹화 된 데이터프레임에서 'V1'의 평균 값 구하기 time_v1.mean() > Time 0.0 -0.083975 1.0 -1.162313 2.0 -0.792099..
데이터는 kaggel의 creditcard 데이터를 활용하였다. 열 단위의 데이터 추출 # 하나의 열 데이터 추출 v1 = data['V1'] type(v1) > pandas.core.series.Series v1.head() > 0 -1.359807 1 1.191857 2 -1.358354 3 -0.966272 4 -1.158233 Name: V1, dtype: float64 # 여러개의 열 데이터 추출 v3 = data[['V1','V2','V3']] type(v3) ## 하나의 열 데이터를 추출할 때와 달리 dataframe 형식임 > pandas.core.frame.DataFrame v3.head() > V1V2V3 0-1.359807-0.0727812.536347 11.1918570.266151..
판다스(Pandas)는 데이터를 쉽고 직관적이게 분석할 수 있도록 도와주는 라이브러리 ★ Pandas Documentation # pandas 라이브러리 불러오기 import pandas as pd ## 매번 pandas라고 불러오는 것이 번거롭기 때문에 짧게 'pd'로 불러온다 # 데이터 집합 불러오기 data = pd.read_csv('creditcard.csv') ## pd.read_csv('데이터 경로') # data에서 가장 앞에 있는 5개의 행 출력 data.head() # data에서 가장 앞에 있는 10개의 행 출력 data.head(10) # data에서 가장 끝에 있는 5개 행 출력 data.tail() # data에서 가장 끝에 있는 10개 행 출력 data.tail(10) # dat..