파이썬(3)
-
[추천시스템] 넷플릭스 영화 추천 시스템 구현 파이썬 코드
데이터 필요한 데이터만 첨부 코드 import pandas as pd import numpy as np # 데이터 읽어오기 movies=pd.read_csv("movies.csv") ratings=pd.read_csv("ratings.csv") # 아이템 기반 협업 필터링 data=pd.merge(ratings,movies,on="movieId") column=['userId','movieId','rating','title','genres'] data=data[column] data moviedata=data.pivot_table(index="movieId", columns='userId')['rating'] moviedata #NaN값을 -1로 변경 ( 평점을 계산할 때 양수값만 처리하면 됌) movi..
2020.04.08 -
[파이썬기초] 데이터 정보 확인 및 참조
데이터 다운로드 : gapminder.tsv https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv Gapminder www.kaggle.com import pandas as pd df=pd.read_csv("gapminder.tsv",sep="\t") 데이터 확인 df.dtypes #각 열의 데이터형식 확인 df.columns # 열이름 확인 df.info() # 각 열의 data갯수, null값, 데이터형식 메모리크기 확인 cdf=df['country'] #지정한 열 참조 cdf.head() type(cdf) # 지정한 열 하나만 참조하여 대입하면 시리즈로 저장됌. subset=df[['country','continent','year']] # 지정한 여..
2020.03.31 -
[파이썬기초] pandas 데이터 읽기
pandas.read_csv Parameters sep str, default ‘,’데이터의 구분자 지정 pd.read_table('examples/ex1.csv', sep=",") header int, list of int, default ‘infer’첫번째 행을 header로 지정하지 않도록 할 때 주로 씀. 혹은 columns이름으로 사용할 row 번호 지정 또는 시작 데이터로 사용할 행 Number 지정. pd.read_table('examples/ex1.csv', header=None) names array-like, optional columns 이름 직접 지정하고 싶을 때, pd.read_csv('examples/ex2.csv', names=['a','b','c','d','message'])..
2020.03.24