노트(211)
-
[파이썬기초] 데이터 정보 확인 및 참조
데이터 다운로드 : gapminder.tsv https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv Gapminder www.kaggle.com import pandas as pd df=pd.read_csv("gapminder.tsv",sep="\t") 데이터 확인 df.dtypes #각 열의 데이터형식 확인 df.columns # 열이름 확인 df.info() # 각 열의 data갯수, null값, 데이터형식 메모리크기 확인 cdf=df['country'] #지정한 열 참조 cdf.head() type(cdf) # 지정한 열 하나만 참조하여 대입하면 시리즈로 저장됌. subset=df[['country','continent','year']] # 지정한 여..
2020.03.31 -
[LaTex] 티스토리 수학 수식 쉽게 쓰기
티스토리 수학 수식 쉽게쓰는 방법 1. 블로그관리 홈 > 스킨편집 > HTML 편집 클릭 스크롤을 맨 아래로 내려 아래의 코드를 위에 붙여넣기 후 적용 클릭 *코드* 2. LaTeX 자주쓰는 기호 모음 1. 그리스 문자 α \alpha β \beta γ \gamma δ \delta ϵ \epsilon ζ \zeta η \eta θ \theta ι \iota κ \kappa λ \lambda μ \mu ν \nu ξ \xi o o (omicron) π \pi ρ \rho σ \sigma τ \tau υ \upsilon ϕ \phi χ \chi ψ \psi ω \omega ε \varepsilon ϑ \vartheta ϰ \varkappa ϖ \varpi ϱ \varrho φ \varphi ς \varsig..
2020.03.30 -
[Kaggle] TED-Talk 토픽모델링 (Topic modeling)
토픽 모델링 기법은 여러 이야기들의 토픽들을 뽑는 데, 주로 사용할 수 있는 모델링 기법이다. 지난 번 프로젝트 때 데이터 수집 및 전처리를 잘못해서 요상한 결과를 가지고 왔었는데, Kaggle에 잘 정제된 데이터와 분석 방법에 대한 노트북이 있어서 이를 참고하여 포스팅하고자 한다. 데이터 다운로드 아래 kaggle 링크 접속 후, 하단으로 스크롤하여 자막data와 tedtalk meta data를 다운로드 로그인 후, 다운로드 모양의 아이콘을 클릭하면 데이터를 다운로드 할 수 있다. https://www.kaggle.com/adelsondias/ted-talks-topic-models TED-Talks topic models Explore and run machine learning code with ..
2020.03.28 -
[파이썬] 두 점사이의 거리 구하기 코드
# 피타고라스 정리를 이용한, 두 점 사이의 거리 구하기 코드 2차원 공간 import math def pointDist(x1,y1,x2,y2): class Point2D: def __init__(self,x,y): self.x=x self.y=y p1=Point2D(x=x1,y=y1) p2=Point2D(x=x2,y=y2) print("p1:({},{})".format(p1.x, p1.y)) print("p2:({},{})".format(p2.x, p2.y)) dist=math.sqrt(pow(p2.x-p1.x,2)+pow(p2.y-p1.y,2)) print(dist) pointDist(30,20,50,40) >> p1:(30,20) >> p2:(50,40) >> 28.284271247461902 3차..
2020.03.28 -
[딥러닝] 신경망 구현 코드
신경망 구현 초기화 ( 입력, 은닉, 출력 노드의 수 ) 학습 (가중치 업데이트) 질의 (입력 -> 연산 -> 출력 노드에 전달) 트레이닝, 테스트 데이터 라이브러리 호출 import scipy from scipy import integrate # scipy.special 속성 오류해결 import numpy as np 신경망 클래스 생성 class neuralNetwork: #신경망 초기화 기능 def __init__(self,input_nodes, hidden_nodes, output_nodes, learning_rate): #첫번째 인수는 무조건 self self.inodes=input_nodes self.hnodes=hidden_nodes self.onodes=output_nodes self.lr..
2020.03.26 -
[파이썬기초] pandas 데이터 읽기
pandas.read_csv Parameters sep str, default ‘,’데이터의 구분자 지정 pd.read_table('examples/ex1.csv', sep=",") header int, list of int, default ‘infer’첫번째 행을 header로 지정하지 않도록 할 때 주로 씀. 혹은 columns이름으로 사용할 row 번호 지정 또는 시작 데이터로 사용할 행 Number 지정. pd.read_table('examples/ex1.csv', header=None) names array-like, optional columns 이름 직접 지정하고 싶을 때, pd.read_csv('examples/ex2.csv', names=['a','b','c','d','message'])..
2020.03.24