[파이썬기초] 데이터 정보 확인 및 참조
2020. 3. 31. 21:29ㆍ노트/Python : 프로그래밍
데이터 다운로드 : gapminder.tsv
https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv
import pandas as pd
df=pd.read_csv("gapminder.tsv",sep="\t")
데이터 확인
df.dtypes #각 열의 데이터형식 확인
df.columns # 열이름 확인
df.info() # 각 열의 data갯수, null값, 데이터형식 메모리크기 확인
cdf=df['country'] #지정한 열 참조
cdf.head()
type(cdf) # 지정한 열 하나만 참조하여 대입하면 시리즈로 저장됌.
subset=df[['country','continent','year']] # 지정한 여러 열 참조
subset.head()
type(subset) # 여러열을 참조하여 대입하면 데이터프레임으로 저장됌
데이터 참조
df.loc[0] # 첫번째 행 데이터 참조
df.shape # 행*열 확인
lli=df.shape[0]-1
df.loc[lli] # 마지막 행 데이터 참조
df.head(6) # 위에서 6번째까지 데이터 참조
df.tail(6) # 아래에서 6번째까지 데이터 참조
df.loc[[0,100,1000]] # 0번째, 100번째, 1000번째 행 데이터 참조
df.iloc[[0,100,1000]] # 0번째, 100번째, 1000번째 행 데이터 참조
type(df.loc[0]) # 시리즈
type(df.tail(1)) # 데이터프레임
df.loc[0]
df.tail(1)
df.loc[:,['year','pop']] # 'year'열 , 'pop'열 참조
df.iloc[:,[2,4,-1]] # 2번째열, 4번째열, 마지막 열 참조
df.iloc[:,list(range(5))] #0,1,2,3,4 번째 열 참조
df.iloc[:,:3] # 0,1,2 번째 열 참조
df.iloc[:,0:6:2] # 0번째, 2번째, 4번째 열 참조 (2칸씩 띄어서)
df.iloc[[0,99,999],[0,2,4]] # 0,99,999 행의 0,2,4번째 열 참조
df.loc[[0,99,999],['country','pop']] #0,99,999 행의 country, pop 열 참조
'노트 > Python : 프로그래밍' 카테고리의 다른 글
[파이썬기초] 주민번호 뒷자리를 별표(*)로 변경하기 (0) | 2020.04.02 |
---|---|
[파이썬 기초] 데이터 그룹화 (0) | 2020.04.02 |
[Kaggle] TED-Talk 토픽모델링 (Topic modeling) (0) | 2020.03.28 |
[파이썬] 두 점사이의 거리 구하기 코드 (0) | 2020.03.28 |
[딥러닝] 신경망 구현 코드 (0) | 2020.03.26 |