[파이썬 기초] 데이터 그룹화
2020. 4. 2. 13:54ㆍ노트/Python : 프로그래밍
데이터 다운로드 : gapminder.tsv
https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv
import pandas as pd
df=pd.read_csv("gapminder.tsv",sep="\t")
데이터 그룹화
df.year.unique() #year열의 유일한 값 확인
df.head()
#년도별 기대수명의 평균
df.groupby('year')['lifeExp'].mean()
#년도, 지역별로 기대수명과 gdp갭의 평균
df.groupby(['year','continent'])[['lifeExp','gdpPercap']].mean()
# 그룹화한 데이터 갯수 세기
df.groupby('year')['lifeExp'].nunique()
df.groupby('continent')['country'].nunique()
'노트 > Python : 프로그래밍' 카테고리의 다른 글
[Kaggle] 자전거 수요 예측 분석 (bike-sharing demand prediction) (0) | 2020.04.02 |
---|---|
[파이썬기초] 주민번호 뒷자리를 별표(*)로 변경하기 (0) | 2020.04.02 |
[파이썬기초] 데이터 정보 확인 및 참조 (0) | 2020.03.31 |
[Kaggle] TED-Talk 토픽모델링 (Topic modeling) (0) | 2020.03.28 |
[파이썬] 두 점사이의 거리 구하기 코드 (0) | 2020.03.28 |