お久しぶり。AIが進化しすぎてこの日記を書く気がないです。
密度関数がパラメータ\(\theta\)をもつ\(f(x;\theta)\)に基づくロス\(X\)を考えます。
ここで、ELC再保険を契約しており、受再者は、支払いが発生したロスデータだけが観測できるという状況を考えます。
フィッシャー情報量を考えてみたいと思います。
とりあえずデータが1個の場合を考えます。実際データが\(n\)個得られた場合には、
独立な分布であるなら単にそれぞれのフィッシャー情報量の総和を考えたらよいからです。
ちなスコア関数は対数尤度のパラメータ微分\(\partial_\theta \log f(X; \theta)\)で(\(X\)が確率変数なので、スコア関数も確率変数です)、フィッシャー情報量は、スコア関数の2乗の期待値\(I(X; \theta) = \int \left( \partial_\theta \log f(x; \theta)\right)^2 f(x; \theta ) dx \)です。期待値はパラメータに対してではなく\(\partial_\theta \log f(X; \theta)\)という確率変数を考えた時の\(X\)に関する期待値です。
ELCのretentionを\(d\)とします。つまり、
再保険回収額は\(\max \{X -d, 0 \}\)です。もちろん元受のロスは\(\min \{X , d \}\)です。
受再者は、支払いが発生したロスデータだけが観測できるので、実際に観測できるデータは
\begin{align*} X \mid X> d \end{align*}
です。もちろん元受側は、\(\{X -d, 0\}\)と\(\min \{X, d\}\)の両方を観測することができますが。。。
細かい話になりますが、\(X\)と\(X \mid X > d\)は考えている確率空間自体が異なります。\(X\)を確率空間
\begin{align*} \left(\Omega, \mathcal F, P \right) \end{align*}
の上で考えているとすると、\(X \mid X > d \)は
\begin{align*} \Omega^\prime = \{\omega \in \Omega \mid X(\omega) > d \} \end{align*}
と表すことにして、
\begin{align*} \left( \Omega^\prime , \mathcal F \bigcap \Omega^\prime, P( \cdot \mid \Omega^\prime ) \right)\end{align*}
という確率空間の上の確率変数です。ただし、
\begin{align*} \mathcal F \bigcap \Omega^\prime = \{F \cap \Omega^\prime \mid F \in \mathcal F \} \end{align*}
です。多分これで問題ないと思います多分。
\begin{align*} X \mid X> d \end{align*}
これをとりあえず\(X\)の切断と呼ぶことにします。\(X\)を切断するとか適当にabusiveな用語を使うことにします。
切断することで密度関数は
\begin{align*} \frac{f(x; \theta) }{S(d)}\end{align*}
となります。ただしここで、\(S(d; \theta )\)は生存関数です。
つまり切断後の対数尤度は
\begin{align*} \log f(x; \theta) – \log S(d; \theta) \end{align*}
になります。なので、スコア関数は、\(\theta\)について微分することで(で\(x\)を\(X\)に戻しておくと)、
\begin{align*} \partial_\theta \log f(X; \theta) – \partial_\theta \log S(d; \theta) \end{align*}
になります。
ある程度正則な状況を考えます。
なにかというと
\begin{align*} \partial_\theta \int f(x; \theta ) dx = \int \partial_\theta f(x; \theta ) dx \end{align*}
のようなある程度良い状況を考えます。
そうすると、
\begin{align*}\partial_\theta \log S(d; \theta) &= \int_d^\infty \partial_\theta f(x; \theta) dx
\\&= \int_d^\infty f(x; \theta) \partial_\theta \log f(x; \theta) dx \end{align*}
となります。なんでかというと、ふつうに
\begin{align*} \partial_\theta \log f(x; \theta) = \frac{\partial_\theta f(x; \theta)}{f(x ; \theta) }\end{align*}
だからです。
なので、生存関数の対数の微分は
\begin{align*} \partial_\theta \log S(d; \theta) = \frac{\partial_\theta S(d; \theta )}{S(d; \theta) }\end{align*}
なので、
\begin{align*} \partial_\theta \log S(d; \theta) = \int_d^\infty \frac{f(x; \theta)}{S(d; \theta )} \partial_\theta \log f(x; \theta) dx \end{align*}
これはよくみたら、
スコア関数\(\partial_\theta \log f (X ; \theta )\)についての条件付き期待値
\begin{align*}E\left( \partial_\theta \log f (X ; \theta ) \mid X > d \right) \end{align*}
であることがわかる。
つまり、切断のスコア関数は、
\begin{align*} \partial_\theta \log f(X; \theta) – \partial_\theta \log S(d; \theta) = \partial_\theta \log f(X; \theta) – E\left( \partial_\theta \log f(X ; \theta) \mid X>d \right) \end{align*}
となります。
念の為補足しとくと、適当な関数\(g\)に対して
\begin{align*} E(g(X) \mid X > d) = E(g(X \mid X > d ) ) \end{align*}
です。ただし、左は\(X\)についての積分で、右は\(Y = X \mid X > d\)についての積分です。
というのも、\(X\)の密度関数を\(f_X\)とし、\(Y\)の密度関数を\(f_Y\)と書くと、
\begin{align*}E(g(X) \mid X > d) = \int g(x) \frac{f_X (x) }{S(d)} dx = \int g(x) f_Y(x) dx = \int g(y) f_Y(y) dy \end{align*}
だからです。まあ最後の等号は別に意味ないですが。
と、いうことは、\(E_Y\)で確率空間\(\left( \Omega^\prime , \mathcal F \bigcap \Omega^\prime, P( \cdot \mid \Omega^\prime) \right) \)上の確率変数\(Y = X \mid X > d\)についての積分を表すことにし、\(E_X\)で普通に\(X\)に関する積分を表すことにすると、
\begin{align*} I( X \mid X > d ;\theta ) &= E_Y \left( \left( \partial_\theta \log f(X; \theta) – E\left( \partial \log f(X ; \theta) \mid X>d \right)\right)^2 \right) \\&= E_X \left( \left( \partial_\theta \log f(X; \theta) – E\left( \partial \log f(X ; \theta) \mid X>d \right)\right)^2 \mid X > d \right) \end{align*}
と\(X\)についての条件付き期待値になります。
これは明らかに、
\begin{align*} V\left( \partial_\theta \log f(X; \theta) \mid X > d \right)\end{align*}
と、\( \partial_\theta \log f(X; \theta)\)の条件付き分散であることがわかります。


コメント