[파이썬 기초] 데이터 그룹화

2020. 4. 2. 13:54노트/Python : 프로그래밍

 

데이터 다운로드 : gapminder.tsv 

gapminder.tsv
0.08MB

https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv

 

Gapminder

 

www.kaggle.com

 

 

 

import pandas as pd
df=pd.read_csv("gapminder.tsv",sep="\t")

 

데이터 그룹화 

df.year.unique() #year열의 유일한 값 확인 
df.head()

#년도별 기대수명의 평균 
df.groupby('year')['lifeExp'].mean()

#년도, 지역별로 기대수명과 gdp갭의 평균
df.groupby(['year','continent'])[['lifeExp','gdpPercap']].mean()

# 그룹화한 데이터 갯수 세기 
df.groupby('year')['lifeExp'].nunique()
df.groupby('continent')['country'].nunique()