今年の去る5月1日にこんなニュースが流れた。
順位は常に勝率で決まる。通常、貯金数が多い方(借金数が少ない方)が順位は上だが、試合数や引き分け数に違いがある時に、まれに逆になることがある。30日現在、ロッテの貯金が7でソフトバンクの6より多いが、勝率はソフトバンクの方が高い。このため、「マイナス0・5」というゲーム差になった。
過去のデータを紐解いてみる。パリーグ6球団について上図が貯金、下図が勝率(=順位)を示している。 黄色がソフトバンク、黒色がロッテである。
首位のソフトバンクに対して2位のロッテは4月下旬から順調に追い上げてきて、4月30日に勝利したことで貯金ではソフトバンクを追い抜いた(上図)。しかし勝率では追い抜くことができず2位のままにとどまった(下図)。
勝率は割り算で小数になり難しいのに対して、貯金は引き算で整数なので手軽である。従って計算の簡単な貯金で順位を決める手もあるかもしれないが、整数の宿命で同一順位になる可能性も高くなることが予想されるので、実際の順位の決定には勝率が用いられる。勝率も貯金も成績を比較して順位を決めるという目的では同じであるのに、どうしてこのような順位の反転が生じてしまうのか。
その条件を導き出そうというのが本稿の目的である。
▮勝率と貯金
チーム1、チーム2の2チームを考える。チーム1の勝ち数、負け数をa1、b1とする。試合数N1は、a1とb1の和に対応する。チーム2についての勝ち数、負け数、試合数を同様にa2、b2、N2とする。
この時、両チームの勝率をv1、v2、貯金をg1、g2とすると、勝率については、
が成り立つ。貯金については、
となる。厳密に言うと貯金はこれの1/2で定義されるが、大小関係のみ取り扱うので簡単のためこうしておく。また、リーグは6チームで構成されているので、2チームに関するa1, b1, a2, b2については相関がない、としておく。実際にはチーム1、2も当然試合をするので相関がないとは言えないがそれは無視する、という意味である。
またこの時点では試合数N1、N2には引き分け数を含んでいないことに注意を要する。引き分け数は最終的に大事な要素になるがそれは最後で論じる。
さらに、両チームの勝率、並びに貯金の差、Δv、Δgを定義する。
ここで、ΔN、Δaは、
で定義される。またΔvの計算で導入した「≡」は正負という条件で等価であることを意味する。今後も正負だけを議論する場合には断らずにこの手法を適用する。またこのΔgはゲーム差と呼ばれ、順位表に記載されている(正確にはその1/2)。
▮勝率と貯金の関係式
さて、ここで、ΔvΔgを定義し、上式を用いて計算して整理すると、
【勝率・貯金の差の関係式】
という関係式が得られる。この値の正負の符号について考えてみると、
・Δv Δg > 0の場合、Δv、Δgの正負の符号は等しい
・Δv Δg < 0の場合、Δv、Δgの正負の符号は逆である(今回のニュース)
となる。(= 0のケースはつまらないので考えないこととする)
この式の正負を決める条件を求めることが今回の問題を解くことになる。
まず、もっとも簡単なケースとして2チームの試合数が等しい場合を考える。この時ΔN = 0となるので、上式は、
となり、Δv、Δgの符号は常に等しく、勝率、貯金で順位の反転は生じない。これより今回のニュースのようなケースは試合数が異なる場合でのみ発生することがわかった。
再び、上記関係式に戻って分析する。
これはよく見ると、ΔNについての2次関数の形である。
ΔN > 0、つまりチーム1の試合数がチーム2よりも多い場合を考える。そしてまず、Δa < 0の場合考えると、上記の右辺の右側2項はいずれも常に正の値をとるので、常にΔvΔg > 0であることが分かる。これをグラフで表現すると、下図のようになる。
仮定よりΔN>0の部分だけを考えればいい。この場合、順位の反転は生じない。これはチーム2よりも試合数の多いはずのチーム1の勝ち数がチーム2よりも少ない場合に相当する。この場合、情状酌量の余地なく優劣は明らかである、という事実に対応している。
さて次にΔa > 0の場合を考える。この時のグラフは、下図となる。実際にはa1/N1と1/2の大小関係により二通りが考えられるのだが、チーム1が勝ち越しているというa1/N1 > 1/2の方を選ぶこととする。
Δv Δgは、x切片として、N1Δa/a1、2Δaの二つを持つ放物線である。そしてこの2つの点の間にΔNが入る場合に限り、Δv Δgは負の値となり、この時だけ、勝率と貯金の順位の反転が生じる。冒頭にあげたニュースのケースはまさにこの間に入り込んだことになる。
▮勝率と貯金の反転が起こる条件
この条件から反転の起こる条件を不等式で表現すると、
が得られる。これをa2について整理すると、
となる。とあるa1が与えられたときにこれを満たすa2が存在するか、が論点となる。a2の存在のし易さ、ということで、上式を、
と見たてた時の「B - A」の幅を計算してみる。すると、
が得られる。Δfは勝率と5割の差として定義される。例えば勝率6割の場合ならばΔf = 0.1という値となる。実際のペナントレースなどでは優勝チームは6割程度の勝率となるのが通例なので、プロ野球としてはΔf =0.1は妥当な数字である。
このB - Aの値が"1"、もしくはそれ以上になると、上式を満たすa2が存在する可能性、つまり順位反転の可能性が出てくることになる。
ΔNはペナントレース中は試合の消化数の差、雨天中止の数などに影響されるが、いざペナントレースが終わってみると単純に引き分け数だけの差となる。全チームの引き分けを含めた総試合数は等しいからである。そして上式より順位の反転はこの引き分け数の差ΔNに比例して生じやすいことが分かる。
例えば、引き分け数の差がΔN = 10程度になると、さきほどのΔf = 0.1によって、
B - Aの値は「1」程度となり、反転の可能性が出てくることになる。以上により、引き分けの数が順位の反転に影響を与えることが分かった。そしてそれは勝率が1に近いほど、つまりΔfが大きいほど顕著となる。これは2強4弱のケースで強豪2チームが高い勝率でデッドヒートを繰り広げているという白熱した優勝争いのケースで発生しやすい、というのは皮肉なことである。(実はこの文脈はa1/N1 > 1/2の方を選択したためである。もう一方(a1/N1 < 1/2)を選んで分析すると4強2弱の非常につまらない最下位争いのケースになるが、その場合でも反転はやはり起こりやすいことが分かる。)
▮まとめ
ペナントレース途中でのこうした反転は一過性のものなのだが、全試合終了後にこうした反転の状況に陥ってしまうこともある。具体事例としては、2008年のイースタン・リーグの例がある。
確かに巨人は勝ち数、貯金でも勝っているのに2位に甘んじた。確かに1位のヤクルトは引き分けの数が多くそれの巨人との差も"5"と大きい。B-Aを計算してみると、ΔN=5、Δf = 0.12であるから、B-Aの値は、0.6となり、これにより運悪く反転が起きてしまったのである。
この例だと微妙な線なの選手たちもまあ納得したと思う。しかし、これが極端になると簡単に納得できないケースが現れる。例えば、
・チーム1:全100試合中、99勝1敗、引き分けなし
・チーム2:全100試合中、1勝0敗、99試合引き分け
ずっと試合を見続けて応援してきた人たちなら当然チーム1の優勝だと実感するであろう。でも、現行ルールだとチーム2の勝利になってしまう。そしてチーム1の首位とのゲーム差は「マイナス48.5」と表示されることになる。これはさすがに不条理と認めざるを得ない。
このことは順位の決め方の妥当性への疑念を生じることにもなりかねない。それで関係者は引き分けをどうやって減らすかについていつも頭を悩ませているわけである。引き分け数を減らすことが各チームの試合数をできるだけ等しくさせることにつながり、それが順位の反転の発生確率を減らすことになるからである。
ちなみに本場アメリカのメジャーリーグではこの問題は発生しない、あるいはしにくい。
引き分けがない前提ならば、ΔNは"0"となるため、B-A =0つまり反転の可能性は"0"となる。さらに、上で示した通り、
であることより、Δv、Δgの符号は必ず等しく反転は起こらないことが保証される。この条件でいけば、ペナントレース中も常に貯金の差だけを追いかけていれば最後まで期待を裏切られることはないのである。