노트(211)
-
[케라스] Keras 모델 생성 기본 구조
케라스 모델 생성 기본 구조 1. 데이터 셋 생성 훈련을 위한 데이터 검증을 위한 데이터 테스트를 위한 데이터 2. 모델 구성 시퀀스 모델 생성한 다음 레이어를 추가( 간단한 모델 ) 복잡한 모델은 케라스 함수API를 사용. 3. 모델 학습과정 설정 Cost 함수 정의, 최적화 방법 정의 Compile 함수 사용 4. 모델 학습 트레이닝 데이터로 모델 학습 Fit 함수 사용됌 5. 훈련 셋, 검증 셋의 COST 측정, 정확도 측정 6. 모델 평가 테스트 데이터셋으로 평가 Evaluate 함수가 사용됌 7. 모델 사용 입력 -> 모델 -> 출력 (예측 .. ) Predict 함수가 사용됌 코드 import tensorflow as tf from keras.datasets import mnist from k..
2020.04.17 -
[텐서플로우] 다중회귀분석 (Multi-variable Linear Regression) 파이썬 코드
★실행 환경 tensorboard 1.15.0 tensorflow 1.15.0 tensorflow-estimator 1.15.1 Python 3.7.4 가설함수 $H(x_1,x_2) = w_1x_1 + w_2x_2 + b $ $H(x) = W^T X$ 비용함수 $cost(W,b) = { 1 \over m} \sum_{i=1}^m (H(x^(i))-y^(i))^2 $ 예제 데이터 x1data = [73,93,90,95,72] # 모의고사 점수 x2data = [80,88,92,98,66] # 모의고사 점수 x3data = [75,92,90,100,70] # 모의고사 점수 ydata = [152,185,180,195,140] # 수능 점수 변수 선언 x1 = tf.placeholder(tf.float32) ..
2020.04.17 -
[텐서플로우] 로지스틱 회귀(Logistic Regression) 분류 파이썬 코드
★실행 환경 tensorboard 1.15.0 tensorflow 1.15.0 tensorflow-estimator 1.15.1 Python 3.7.4 로지스틱 회귀 (Logistic Regression) $H(x) = {1 \over (1+ e^(-WtX) ) } $ $ cost(W) = { -1 \over m} * \sum y*\log(H(x)) +(1-y)(\log(1-H(x))$ $ W:= W - \alpha * { \partial \over \partial W}*cost(W)$ 로지스틱 회귀(영어: logistic regression)는 영국의 통계학자인 D. R. Cox가 1958년 에 제안한 확률 모델로서 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법이..
2020.04.16 -
[계리모형론] 시뮬레이션(Actuarial applications)
시뮬레이션 방식으로 난수를 생성하여 빈도와 심도를 계산해보았다. 시뮬레이션 방식에는 여러가지가 있겠지만, 가장 기본적이고 기억에 남는 방식이라 이 부분을 포스팅해보았다. 먼저 클레임 청구가 포아송 프로세스를 따라 발생한다고 가정하였다. 클레임 청구 건수가 포아송 프로세스를 따른다면, 보험사고 발생할 때까지 걸리는 시간은 같은 모수의 지수분포를 따르게 된다. 그래서 지수분포의 분포함수(c.d.f) $1-exp(-3x) = u$ 를 따른다고하면 난수 발생에 따른 시간 x= t 의 변수를 발생시킬 수 있다. 그다음 걸린 시간들을 누적분포로 쌓아올리면 1시점 내에 시점이 찍힌 수만큼 counting 해보면 첫번째 기간내에 발생한 사고 건수는 9가 나온다.( 매번 바뀐다.) 그럼 그때 발생한 보험금 크기도 난수로..
2020.04.15 -
[텐서플로우] 선형회귀분석(Linear Regression) 기본 구조 파이썬 코드
★설치 환경 pip install tensorflow==1.15.0 tensorboard 2.0.2 tensorflow 1.15.0 tensorflow-estimator 2.0.1 버젼 tensorboard 1.15.0 tensorflow 1.15.0 tensorflow-estimator 1.15.1 Python 3.7.4 텐서플러우로 예측분석 데이터 코드 # 데이터 읽기 path = "C:\\Users\\student\\Desktop\\DY\\★ 데이터\\306. carsdata" cars=pd.read_csv(path + "\\cars.csv") # 사용할 데이터 칼럼 및 xtrain , ytrain data=cars[[' cylinders',' hp']] xtrain = list(data[' cyl..
2020.04.14 -
[파이썬] 데이터변형 | 정규화와 표준화
변수들 간 척도가 다른 경우 데이터 표준화 모집단 : 전체집단, 모집단에서 표본을 추출 표본집단 : 평균, 표준편차, ... -> 통계량 모수적 방법 : 중심극한정리 : 무작위로 복원추출하면, 연속형 자료의 평균에 대한 분포는 정규분포를 띈다. - 가정 : 30개 이상의 표본의 경우에 정규분포를 따른다. 비모수적 방법 : - 10개 미만의 표본의 경우에는 모수적 방법을 사용하지 못함. - 자료를 크기로 나열 -> 순위 매김 -> 차이 비교 표준화 = $ {(각 데이터-평균(각 열)) \over 표준편차(각 열)}$ 평균까지의 거리로, 2개 이상의 대상이 단위가 다를때, 대상 데이터를 같은 기준으로 볼수있게 해줌 모집단이 정규분포를 따르는 경우에 $N(0,1)$ 인 표준정규분포로 표준화 하는 작업 1) n..
2020.04.14