nano_exit

基礎的なことこそ、簡単な例が必要だと思うのです。

ベイズの定理:薬物検査の難しさ

ベイズの定理のWikipediaで、応用例として薬物検査で陽性が出た時に本当に使用者でる確率が取り上げられている。

ベイズの定理
ベイズの定理 - Wikipedia

\displaystyle
P( B | A ) = \frac{ P( A | B ) P( B ) }{ P( A ) }

全確率の定理
Law of total probability - Wikipedia

\displaystyle
P( A ) = \sum_n P( A | B_n ) P( B_n )

感度:薬物使用者のうち99%が陽性になる。

\displaystyle
P( + | U ) = 99 / 100, \quad P( - | U ) = 1 / 100

特異度:薬物非使用者のうち99%が陰性になる。

\displaystyle
P( + | N ) = 1 / 100, \quad P( - | N ) = 99 / 100

全国民から一人無作為に選んだ結果が0.01%が薬物使用者である確率。

\displaystyle
P( U ) = 0.01 / 100, \quad P( N ) = 99.99 / 100

これから、「陽性が出た時にその人が薬物使用者である確率 P( U | + )」を求める。

\displaystyle
P( U | + )
  = \frac{ P( + | U ) P( U ) }{ P( + ) }
  = \frac{ P( + | U ) P( U ) }{ P( + | U ) P( U ) + P( + | N ) P( N ) }
\\
\displaystyle
  = \frac{ 0.99 \times 0.0001 }{ 0.99 \times 0.0001 + 0.01 \times 0.9999 }
  =  0.0098... \sim 0.01

つまり、陽性が出てもその人が薬物使用者である確率は1パーセントでしかない。
何の確証も無しに「こいつ薬やってるっぽい!」って言うのに比べて、当たる確率は100倍にはなっているが、全然検査としてダメじゃんって感じがするだろう。

薬をやっている人を、0.01%から0.1%に増やすと、

\displaystyle
P( U | + )
  = \frac{ 0.99 \times 0.001 }{ 0.99 \times 0.001 + 0.01 \times 0.999 }
  =  0.090...
同様に当たる確率も10倍程度される。そもそもの確率が高ければ、陽性のチェックの精度も高くなる。

このチェックの精度を上げるには、特異度が重要だとWikipediaに書いてある。
特異度を99.9%にすると( P( + | N ) = 0.001

\displaystyle
P( U | + )
  = \frac{ 0.99 \times 0.0001 }{ 0.99 \times 0.0001 + 0.001 \times 0.9999 }
  =  0.090...
精度が10倍近く改善された。
特異度が99.99%になると、精度は50%近くまで上がり、99.999%で90%を超える。

一方で感度はあまり重要ではなく、99.99%にしても精度は1%を超えずほぼ変化しない。

答えがわかっているものに対して近い反応が示せたとして、それを使って答えがわからないものをチェックするのは容易ではないのかがよく分かった。