[계리모형론] 경험적 베이즈 이론 (Empirical Bayes semi-parametric Methods)

2020. 4. 3. 15:23노트/Actuary : 계리

 

empirical bayes methods.xlsx
0.02MB

 

 

 

 

경험적 베이즈 방법은 사고 빈도에 대해서는 분포를 가정하지만, 모수의 분포는 사전에 정의하지 않고 

오직 경험으로 얻은 데이터에 의해서 분포를 추정해보는 방식을 의미한다. 잘 이해해보기 위해서 엑셀로 예제들을 작성해보았다. 

 

먼저 Example 57A를 봐보면, 

사전에 얻은 데이터 정보는 각 클레임수를 청구한 보험계약자의 수 정보만 있다. 

이를 활용하여 다음해에 얼마나 클레임을 청구할지 뷸만 신뢰도를 이용하여 예측해볼 수 있다. 

단위기간을 1년동안 관찰하였다고 하면 

$EPV= 0* {461 \over 500} + 1* {30 \over 500} + 2* { 7 \over 500} +3 * {2 \over 500} $ 

이며, 이 사고 빈도가 포아송 분포이기 때문에, $EPV = \mu$ 이다. 

 

$VHM$은 사전에 구한 $s^2 - EPV / n$ 으로 구한다. 여기서 $n$은 관찰 단위기간 $1$이다. 

나머지는 Buhlmann Credibility 구하는 것처럼 똑같이 구하면 된다. 

 

이제 단위기간이 변화할 경우 어떻게 구하는 지 다음 예제를 통해 보자. 

 

Example 57B이다. 

 

단위기간이 3년이 된 경우에는 $EPV$와 $S^2 와 VHM$ 모두 1년기준 값으로 환산해야한다. 

데이터가 관찰기간 3년간 얻어진 총 값으로 주어졌기 때문에, 

$EPV= [0* {250 \over 500} + 1* {163 \over 500} + 2* { 64 \over 500} +3 * {23 \over 500}  ] * { 1 \over 3}$  

전체 EPV 계산한 값을 1년 단위로 환산하기위해 3으로 나눠주는 작업을 잊으면 안된다. 

 

$s^2$를 구할때에도, Number of Claims 값들을 1년 값들로 환산해주고 1년으로 환산한 EPV를 빼줘서, 표본 분산을 구해줘야한다. 

 

나머지는 뷸만 신뢰도 구하는 것처럼 똑같이 하면된다. 이때, $Z$를 구할 때, $n=3$이다. 

참고적으로 $X_4$값을 예측하기 위해서 $X_1 ~X_3$ 까지 구한 값의 표본평균 을 구하기 위해서 각 데이터에 3을 나눠야한다. (익스포져 수를 맞춰줘야 하니깐 ) 

 

 

그렇다면 이제, 그룹이 나눠져 있어서 Exposure 수가 각 그룹마다 다른 예제를 살펴본다. 

 

 

빈도 수가 Poisson 분포를 따르지만, Group의 Exposure가 다르기 때문에 $\mu$ 를 계산할때 표본평균( Hypothetical mean) 들을 가중평균해주어야한다. 따라서 $\mu = 0.1 * {10 \over 30} + 0.4 * {20 \over 30}$ 이고, 

$EPV$ 는 포아송분포여서 $\mu$와  같다. 

 

이경우에는 $VHM$을 계산하는 것이 간단한데 외워야하는 부분이다. 이거는 시험직전에 외우고 들어가면 좋을 것 같다. 표본분산에서 EPV를 빼주고 자유도를 나눠준다고 생각하면 외우기 편하다. 

 

 

다음은 N과 X의 분포가 더이상 Poisson 분포를 따르지 않는 경우이다. 

 

이 경우에는 $\mu$와 $EPV$가 달라진다. $ \mu = E(N)*E(X)$ 로 구하고,

$EPV = E(Var(N| \gamma))$ 로 구한다. 

 

문제에 어떤 데이터 형식을 주었냐에 따라 계산하는 방식을 판단하는 연습을 해야할 것 같다.! 

 

 

 

 

 

출처: ASM SOA Exam C 18th Edition Exampe 57A - 57D