★Beat Angels

サル・パラダイスよ!誰もいないときは、窓から入れ。 レミ・ボンクール

入国審査の数理(解答篇)

 

についての説明である。問題を再掲する。

 

とある国の入国審査場には10人の審査官がいる。その審査官たちの処理時間は9人は5分だが、残りの1人だけは50分と10倍である。それが誰だかはわからない。いい加減に選ぶと運悪くこの50分審査官に当たることがあり、その確率は1/10となる。


ここで、ある人が次のような審査官の選び方をしたとする。
 
ルール:
しばらく各審査官の流れる様子を観察し、進んだのが確認された審査官を選ぶ。
 
さて、この人が50分審査官を選んでしまう確率はいくらになるか?

 

 まずベイズによる条件付確率の公式を示す。 

  f:id:taamori1229:20170107172815p:plain

 ここでA,Bは事象を示す。今回の問題の場合で事象を整理すると、 

  ・事象A:ある一定の時間(T)内に審査が終わる
  ・事象B:審査官が50分審査官である

  となる。P(B/A)という表現は、条件付確率であり、事象Aが発生した条件下で事象Bが発生する確率として定義される。

 今回の問題において右辺の各項を計算する。 

 f:id:taamori1229:20170107172848p:plain

  となるので、求める確率は、

 f:id:taamori1229:20170107173004p:plain

 となる。確率の議論とするために一定の時間(T)を定義したが上記のようにこの時間は結果には現れず観測時間には依存しないことが分かる。

 この結果に示す通り、このルールに基づいて審査官を選ぶ人は50分審査官を選ぶリスクは当初の1/10からそれを1/9、つまり約一桁軽減することができるのである。

 問題では審査官の間に10倍の処理時間の差があるという条件で計算したが、N倍の場合という形で一般化してみる。同様に右辺の各項を計算してみると、  

 f:id:taamori1229:20170109103150p:plain

となり、求める確率は、 

 f:id:taamori1229:20170107173113p:plain 

となる。

 50分審査官の場合は、N=10のときである。Nが大きくなればなるほど問題の審査官を選ぶ確率(つまりリスク)は小さくなっていくことが分かる。特にN=∞(無限大)の場合は、確率="0"となる。これは問題の審査官が完全動作停止となった場合に相当し、この時に進む審査官を見つけたらそれは絶対に問題の審査官ではない、という事実に対応する。また、N=1の場合は確率は1/10となって効果がないことになるが、この場合は問題の審査官は他の審査官と処理時間の差はなく、そもそも問題が存在しない。N=0の場合は、この確率は"1"となり処理時間が"0"のこの高速監査官を絶対に選んでしまうことになるが、高速なのでそれでいい。

 

 さて、問題の解答は以上となるが、ベイズ理論においてはこのようにあらかじめ決められた確率(事前確率)に対して実際の情報、データから再度計算された確率(事後確率)が定義される。それまでの確率論は事前確率の枠組み・根拠がはっきりしている事象を対象としてきた。当然、それなりの成果を収めてきたわけであり今でも有用な分野はたくさんある。最近のビッグデータ、AIという分野においてはこの事前確率があいまい、あるいはそもそも存在しない、という前提からスタートしている。まずは得られたデータを片っ端から事後確率として解読していき、その中から事前確率を見出そうというアプローチである。この発想は人間の思考様式に非常に似ていると思うが半面、これまでの計算機に期待していた厳密さをある意味軽視、否定することに他ならない。この大きな変化はもう少し慎重に議論されてもいい。人間は歴史上数限りない失敗をしてきているからである。