목록전체 글 (27)
소연이의 메모장
matplotlib에서 한글폰트를 사용하여 시각화를 할 때 네모네모로 글자가 깨지는 현상이 발생한다. 이걸 해결하기 위한 python 코드다. 우선 네이버의 나눔글꼴을 다운 받아야 한다. 시스템 환경이 윈도우라면 맑은고딕이 실행된다. 그리고 마이너스 폰트까지 잘 나오는지 확인하는 코드도 있다. def get_font_family(): """ 시스템 환경에 따른 기본 폰트명을 반환하는 함수 """ import platform system_name = platform.system() # colab 사용자는 system_name이 'Linux'로 확인 if system_name == "Darwin" : font_family = "AppleGothic" elif system_name == "Windows": f..
변수 (Variables) : 개인 또는 개체의 특성을 나타내며 개인(개체)별로 다른 값을 가짐 범주형(categorical) 변수 명목(nominal) 변수 : 순서 없는 범주를 가지는 변수 ex) 남/여, 서울/대구/부산/광주 ... # 막대그래프를 이용하여 펭귄의 종류를 도수분포표로 나타내기 import seaborn as sns sns.countplot(penguins['species']) 순서(ordinal) 변수 : 순서가 있는 범주를 가지는 변수 ex) 크기(소형/중형/대형), 만족도(매우 불만족/불만족/보통/만족/매우 만족) ... 양적(quantitative) 변수 연속(continuous) 변수 : 무수히 많은 다른 값을 가짐 ex) 키, 몸무게, 온도 --> 정규분포 import ma..
정부 공공데이터 1.한국 공공데이터 포털 2.일본통계국 빅데이터 포털 3.미국정부 공개자료 공공데이터 포털 4.영국 국립 데이터센터 5.EU정보플랫폼 6.중국국립데이터센터 7.홍콩정부 데이터센터 8.대만정부 정보공개 플랫폼 9.통합 공공데이터 포털 국제조직의 통계 공공데이터포털 10.경제협력개발기구(OECD) 데이터베이스 11.세계은행 공개정보 포털 12.빅데이터 포털 – 세계보건기구 기업/플랫폼 데이터 13.github 14.Google BigQuery 공개 데이터셋 15.유튜브 데이터셋 16.구글 오픈데이터 검색 17.공공데이터포털 : Google Trend Search 18.아마존 aws 19.MNIST 수기 숫자 데이터베이스 20.빅데이터포털: UCI 머신러닝 데이터베이스 항공데이터 Flightr..