[파이썬기초] 데이터 정보 확인 및 참조

2020. 3. 31. 21:29노트/Python : 프로그래밍

 

데이터 다운로드 : gapminder.tsv 

gapminder.tsv
0.08MB

https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv

 

Gapminder

 

www.kaggle.com

 

 

 

import pandas as pd
df=pd.read_csv("gapminder.tsv",sep="\t")

 

데이터 확인 

df.dtypes #각 열의 데이터형식 확인 

df.columns # 열이름 확인

df.info() # 각 열의 data갯수, null값, 데이터형식 메모리크기 확인 

cdf=df['country'] #지정한 열 참조
cdf.head()

type(cdf) # 지정한 열 하나만 참조하여 대입하면 시리즈로 저장됌. 

subset=df[['country','continent','year']] # 지정한 여러 열 참조 
subset.head()

type(subset) # 여러열을 참조하여 대입하면 데이터프레임으로 저장됌 

 

 

 

데이터 참조 

df.loc[0] # 첫번째 행 데이터 참조 

df.shape # 행*열 확인 

lli=df.shape[0]-1
df.loc[lli] # 마지막 행 데이터 참조 

df.head(6) # 위에서 6번째까지 데이터 참조 

df.tail(6) # 아래에서 6번째까지 데이터 참조 

df.loc[[0,100,1000]] # 0번째, 100번째, 1000번째 행 데이터 참조 

df.iloc[[0,100,1000]] # 0번째, 100번째, 1000번째 행 데이터 참조 

type(df.loc[0]) # 시리즈 

type(df.tail(1)) # 데이터프레임 

df.loc[0]

df.tail(1)

df.loc[:,['year','pop']] # 'year'열 , 'pop'열 참조

df.iloc[:,[2,4,-1]] # 2번째열, 4번째열, 마지막 열 참조 

df.iloc[:,list(range(5))] #0,1,2,3,4 번째 열 참조

df.iloc[:,:3] # 0,1,2 번째 열 참조

df.iloc[:,0:6:2] # 0번째, 2번째, 4번째 열 참조 (2칸씩 띄어서)

df.iloc[[0,99,999],[0,2,4]] # 0,99,999 행의 0,2,4번째 열 참조 

df.loc[[0,99,999],['country','pop']] #0,99,999 행의 country, pop 열 참조