노트(211)
-
[계리모형론] 경험적 베이즈 이론 (Empirical Bayes semi-parametric Methods)
경험적 베이즈 방법은 사고 빈도에 대해서는 분포를 가정하지만, 모수의 분포는 사전에 정의하지 않고 오직 경험으로 얻은 데이터에 의해서 분포를 추정해보는 방식을 의미한다. 잘 이해해보기 위해서 엑셀로 예제들을 작성해보았다. 먼저 Example 57A를 봐보면, 사전에 얻은 데이터 정보는 각 클레임수를 청구한 보험계약자의 수 정보만 있다. 이를 활용하여 다음해에 얼마나 클레임을 청구할지 뷸만 신뢰도를 이용하여 예측해볼 수 있다. 단위기간을 1년동안 관찰하였다고 하면 $EPV= 0* {461 \over 500} + 1* {30 \over 500} + 2* { 7 \over 500} +3 * {2 \over 500} $ 이며, 이 사고 빈도가 포아송 분포이기 때문에, $EPV = \mu$ 이다. $VHM$은 사..
2020.04.03 -
[Kaggle] 자전거 수요 예측 분석 (bike-sharing demand prediction)
데이터 다운로드 https://www.kaggle.com/c/bike-sharing-demand/data Bike Sharing Demand Forecast use of a city bikeshare system www.kaggle.com bike data 불러오기 이번 프로젝트는 Kaggle에 있는 공용 자전거 수요 데이터를 학습하여, 각 날짜마다 자전거 수요를 예측해보는 프로젝트에 대해 포스팅하려고 한다. 먼저 트레이닝 데이터와 테스트 데이터를 불러온다. train=pd.read_csv("train.csv", parse_dates=['datetime']) #pare_dates: 날짜 시간으로된 컬럼을 datetime으로 파싱 train.head() test=pd.read_csv("test.csv",p..
2020.04.02 -
[파이썬기초] 주민번호 뒷자리를 별표(*)로 변경하기
data=""" kim 950101-1234567 lee 970202-2345678 """ result=[] for line in data.split("\n"): word_res=[] for word in line.split(" "): if len(word)==14 and word[:6].isdigit() and word[7:].isdigit(): w=word[0:6]+"-"+"*******" word_res.append(w) result.append(" ".join(word_res)) print("\n".join(result))
2020.04.02 -
[파이썬 기초] 데이터 그룹화
데이터 다운로드 : gapminder.tsv https://www.kaggle.com/gbahdeyboh/gapminder#gapminder.tsv Gapminder www.kaggle.com import pandas as pd df=pd.read_csv("gapminder.tsv",sep="\t") 데이터 그룹화 df.year.unique() #year열의 유일한 값 확인 df.head() #년도별 기대수명의 평균 df.groupby('year')['lifeExp'].mean() #년도, 지역별로 기대수명과 gdp갭의 평균 df.groupby(['year','continent'])[['lifeExp','gdpPercap']].mean() # 그룹화한 데이터 갯수 세기 df.groupby('year')[..
2020.04.02 -
[계리모형론] 베이지안 보험료 (Bayesian Premium)
베이지안 방법 모수를 사전에 정하지 않고 오직 데이터에 의해서 모수를 추정하는 방법. 새로운 데이터가 발생했을 때마다 모수를 지속적으로 업데이트 시켜주는 통계적 방법. 계산방식 model : $f(x | \lambda)$ prior : $\pi( \lambda)$ joint : $f( x , \lambda) = f(x|\lambda) *\pi(\lambda)$ marginal : $f(x) = \int f(x|\lambda) * \pi(\lambda) $ likelihood : $ L(x) = \prod_{i=1}^N f(x|\lambda) $ posterior : $ \pi(\lambda|x) = {f(x|\lambda) *\pi(\lambda) \over f(x)} $ predictive : $f(x..
2020.04.02 -
[Excel기초] 엑셀 잔기술 및 단축키
단축키 윗 셀 복붙 (자동완성) Ctrl + d 오늘날짜 입력 : Ctrl + ; 셀 속성 Ctrl + 1 행 숨기기 Ctrl+ 9 행 숨기기 해제 Ctrl + Shift + 9 열 숨기기 Ctrl + 0 시트 추가 Shift + F11 셀 편집( 셀 값 수정) F2 (숨기기 했을 때) 화면에 보이는 셀만 선택 Alt + ; 행 삽입 Ctrl + 행 삭제 Ctrl - 숫자로 Ctrl + shift + 1 백분율로 Ctrl + Shift + 5 배경색 Alt > H > H 셀 테두리 그리기 Alt > h> b > a 테두리 윤곽선 Ctrl + shift + & 열너비를 글자수에 맞추기 Alt > o > c > a 행높이를 글자수에 맞추기 Alt > o > r > a 정렬 바꾸기 Alt > H > S > U..
2020.03.31