ICC(群内相関係数, Intraclass Correlation Coefficient)は単に同じクラスの
次のような2階層のモデルを考えます。
\begin{align*} Y_{ij} = \mu + a_i + \varepsilon_{ij}, \quad a_i \sim \text{i.i.d.}\, N(0, \sigma^2_a), \varepsilon_{ij} \sim \text{i.i.d.}\, N(0, \sigma^2_{\varepsilon} \end{align*}
とします。このとき、Intraclass Correlation Coefficientは、\(i, j,k; j \neq k\)に対して、
\begin{align*} ICC(i; j, k) = Corr(Y_{ij}, Y_{ik})\end{align*}
により定められます。ここで、\(Corr\)は相関係数です。
つまり、
\begin{align*} ICC(i; j, k) = Corr(Y_{ij}, Y_{ik}) = \frac{ Cov(Y_{ij}, Y_{ik})}{\sqet{V(Y_{ij})}*\sqet{V(Y_{ik})}} \end{align*}
です。
ここで、実際に計算を推し進めていくと、
\begin{align*}Cov(Y_{ij}, Y_{ik}) = Cov(\mu + a_i + \varepsilon_{ij}, \mu + a_i + \varepsilon_{ik}) \end{align*}
なわけですが、\(\varepsilon_{ij}, \varepsilon_{ik}\)は独立なので(\(j \neq k\)だからです)、
\begin{align*}Cov(Y_{ij}, Y_{ik}) = Cov(a_i, a_i) = \sigma^2_a \end{align*}
であることがわかります。また同様に、
\begin{align*} \sqet{V(Y_{ij}) = \sqrt{\sigma_a^2 + \sigma_{\varepsilon}^2} \\ \sqet{V(Y_{ik}) = \sqrt{\sigma_a^2 + \sigma_{\varepsilon}^2} \end{align*}
ということがわかります。
ですので、
\begin{align*} ICC(i; j, k) &= Corr(Y_{ij}, Y_{ik}) \\&= \frac{ Cov(Y_{ij}, Y_{ik})}{\sqet{V(Y_{ij})}*\sqet{V(Y_{ik})}} \\&= \frac{\sigma_a^2}{\sigma_a^2 + \sigma_\varepsilon^2}\end{align*}
ということがわかります。
つまりナイーブに書くと
\begin{align*} \frac{群同士の分散}{\text{総分散}}\end{align*}
となります。
ICCの読み解き方
ICCの数字を見てすぐにどういうことが言えるかを考えてみましょう。
\begin{align*} ICC(i; j, k) = \frac{\sigma_a^2}{\sigma_a^2 + \sigma_\varepsilon^2}\end{align*}
ということでしたので、\(ICC = 1\)というのはつまり、\(\sigma_\varepsilon^2 =0\)ということを意味しており、同じ群内であれば分散がないということを意味しています。また一方で、\(ICC = 0\)というのは、\(\sigma_a^2 = 0\)を意味しており、群同士の分散がないということを意味しています。
コメント