ペナントレース予想(2018)

セ・リーグ
■ 各チームの戦力予想

 各チームの入退団選手、予想デプスチャート、ポジション別の貢献度収支予測などについてはそれぞれ以下にまとめた。

ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp

 本エントリーでは各チームの戦力予測値をまとめ、ペナントレースの全体的な見通しについて考えてみたい。ちなみに、各チームに所属する選手のデータとしては2月上旬までのもの。

■ リーグスタッツ予測値
チーム予想勝率順位打撃走塁守備投手OffDef合計
広島.534 - .6461.793.36.018.46.499.324.8124.1
DeNA.462 - .5703.28.5-5.114.311.93.426.129.5
阪神.436 - .5473.713.63.1-36.517.016.7-19.5-2.8
巨人.432 - .5393.8-20.6-2.60.514.7-23.215.3-7.9
中日.399 - .5074.7-31.5-2.711.0-27.6-34.2-16.6-50.8
ヤクルト.366 - .4735.2-63.41.3-7.7-22.4-62.0-30.1-92.1

 各予測値は過去3シーズンの加重平均から算出している。勝率については、各予測値の合計から期待勝率を計算する方法だが、今回は幅を持たせてみた。これは、2010年からの少ないサンプルではあるが、チーム別のwRC+の予測値と実績値の差が平均すると+-6%、ERA-は+-7%になっており、これをもとに得点および失点の良かったケースと悪かったケースで期待勝率を算出し、この範囲を予想勝率とした。順位は1958年以降のNPBのデータから該当する勝率の平均順位を出し、これを順位の予測値とした。

 また、以下は予想勝率の範囲で該当する順位の割合をグラフにまとめたもの。

f:id:verdoux:20180212114314p:plain:w480

 このグラフがわかりやすいかどうか心許ないが、グラフの山が左側に来ているチームほど戦力予測値が高く、予想順位も高いということ。予測値の上ではカープが一頭地を抜いた存在で、その後をベイスターズ、タイガース、ジャイアンツが追う形、この3チームからやや遅れをとる感じでドラゴンズが続く。

ペナントレース見通し

 NPBの場合、選手の流動性が低く、どうしても前年までのチーム成績をトレースするような予測値にしかならないのだが、これらの予測値をもとにペナントレースの展開を予想するとすれば、カープによほどの大失速がない限りは昨年と同じような展開になるだろうということだ。昨年のカープの平均得点は5点を超えており、統一球導入以後で考えれば驚異的な高さだった。予測値でも最も差があるのが打撃で、もしこの差が埋まることがあり得るとすれば、主力選手に故障者やスランプに陥る選手が複数でるなどした場合だろう。フラットにみた場合、補強のみでは埋まりきらないほどの差がある。一方、ディフェンス面はどうか。こちらはオフェンスほど差は大きくない。また、カープについては、以前書いたブルペンの問題やゴロ処理率の低下などもあり、失速の可能性としてはオフェンス面よりは高いと思われる。優勝争いということでは、先発投手に強みを持つジャイアンツ、ここ数年で投手力と守備力を伸ばしているベイスターズが有力な存在となるだろう。また、タイガースはロサリオの出来と藤浪が復調できるかどうかで戦力的に大きく変わってくる。いずれにせよ、カープの連覇を阻止するチームがあるとすればこの3チームから出てくるだろうし、この3チームによるAクラス争いというのももう一つのテーマになるかもしれない。

パ・リーグ
■ 各チームの戦力予想

ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp ahoudata.hatenadiary.jp

■ リーグスタッツ予測値
チーム予想勝率順位打撃走塁守備投手OffDef合計
ソフトバンク.522 - .6321.945.5-1.019.931.544.551.495.8
西武.478 - .5912.732.113.216.6-22.545.3-5.939.3
楽天.471 - .5822.924.0-13.4-25.041.210.716.226.9
日本ハム.439 - .5513.6-2.02.413.5-29.40.5-15.9-15.4
オリックス.417 - .5254.2-50.9-5.3-10.016.9-56.26.9-49.3
ロッテ.379 - .4915.0-48.74.1-15.1-37.5-44.7-52.7-97.3

f:id:verdoux:20180212114317p:plain:w480

 表とグラフについての説明は、セ・リーグの同項目を参照。

ペナントレース見通し

 予測値をもとにした戦力的な見立てとしては、昨年同様ホークスの牙城にライオンズとイーグルスが挑む形になるだろう。また、ライオンズとイーグルスを比較した場合、野上と牧田の移籍の穴を埋めることができればライオンズが一歩リードするだろうが現時点では不透明であり、戦力的には同程度だと思われる。イーグルスは守備に課題を抱えているが現状では主要なポジションはほぼ固まっているので、大きな改善は難しいかもしれない。可能性があるとすれば、セカンドの世代交代に成功する、茂木が守備範囲で1年目と同じくらいの数値を残す、外野で若手野手が台頭してくるなど(オコエ、田中、八百坂)。あるいは、MLBのように大胆な守備シフトを導入するとか。Aクラス争いということでは、ライオンズ、イーグルスの内、想定外に失速するチームが出てくればファイターズ、バファローズにもチャンスが巡ってくるだろう。ファイターズは昨年ほどの大失速はないと思われるが、投手力が不透明。マルティネスかロドリゲスが先発として機能すれば面白くなる。バファローズはオフェンス面で上積みを作っていかなければならないが、吉田正尚稼働率とともに選手運用が重要になってくるだろう。

プロジェクション(成績予測)について

 当ブログでの成績予測について。

■ Marcel

 基本的にはMarcelという予測方法に準じている。

www.tangotiger.net

 これは最近の3シーズンの成績から近いものから順に5、4、3の重みをつけた加重平均から翌シーズンの成績を予測する方法である。また、その際に一定打席数分のリーグ平均を加え、極端な成績を補正する役割も持たせている。

■ ファーム成績と海外リーグ成績の変換

ahoudata.hatenadiary.jp

ahoudata.hatenadiary.jp

 上記エントリーでまとめたように、ファームやMLBの成績とNPBでの成績とを比較することからNPB成績への変換割合を算出して、成績予測に組み込んでいる。

■ 年度間相関と平均への回帰

 成績によっては年度間相関の高いもの、つまりは前年成績との関連が強いものとそうでないものがある。

ahoudata.hatenadiary.jp

 例えば、打者成績でいえば、本塁打や三振などは過去の成績との相関が強いが、打率は相関が弱い。ということは、過去成績から成績予測を行う際、本塁打や三振のように年度間相関の高いものは信頼度が高いが、本塁打以外の安打については信頼度が低いということになる。こういった成績の中で極端に高かったり、低かったりするものは翌年揺り戻し的に平均的な水準に戻るという現象が起こりやすい。

ahoudata.hatenadiary.jp

 Marcelでは加重平均に加えるリーグ平均は一定(1200PA)なのだが、当ブログの成績予測の計算では、本塁打など相関の強いものの場合は加重平均に含めるリーグ平均の割合が少なく、そうでないものについては多くなるようになっている。

■ 年齢曲線

 年齢による補正を加える。

ahoudata.hatenadiary.jp

■ 類似性スコア

類似性スコア - Wikipedia

 類似性スコアそのものについての説明は上記のリンク(Wikipedia)から確認していただきたいが、当ブログでは年齢と打席の左右が同じ選手の通算成績の中から、主に積み上げ型の成績ではなく打席あたりの割合で比較を行っている(例えば、三振数ではなく打席当たりの三振率など)。

 一例として、昨年までの筒香(2017)の成績が過去のどの選手の成績と近いかというと、

 となっている。94%などの数字は類似性の高さを表している。

 こうしたデータの成績予測への使用方法としては、一つは先に挙げた全体の選手からとった年齢補正データの代わりに類似性の高い選手に絞った年齢補正のデータとして使う。もう一つは過去成績の加重平均に加えるリーグ平均の代わりに類似性の高い選手の平均を加える。もちろん、これらはある程度サンプルのある選手に限られるし、これによって予測の精度が劇的にあがるということはないが、試みとしてこういうこともやっている。

■ 予測の精度

 ここまで見てきたような方法で予測された成績がどの程度の精度を持つだろうか。実は面倒な作業をしている割には、予測の精度としては前年の成績をそのまま当てはめるよりは僅かにマシという程度である。

 まず、打撃成績(wRC+)の予測では、2010年〜2017年までの前年成績と予測データの比較(250打席以上対象、サンプル551件)では、前年成績と翌年の成績との相関係数が.570に対して予測は.606。投手成績(250打席以上対象、サンプル423件)はFIP-が前年成績が.531に対して予測は.545、ERA-は前年成績が.319に対して予測が.380。年度別にみると以下のようになる。

wRC+

サンプル 前年成績 予測値
2010 70 .537 .565
2011 70 .427 .594
2012 68 .613 .671
2013 67 .476 .562
2014 71 .597 .606
2015 69 .575 .580
2016 62 .649 .700
2017 74 .741 .747
2010 - 2017 551 .570 .606

FIP-

サンプル 前年成績 予測値
2010 51 .561 .558
2011 55 .657 .702
2012 52 .555 .520
2013 49 .616 .425
2014 48 .385 .444
2015 54 .621 .683
2016 55 .575 .604
2017 59 .391 .412
2010 - 2017 423 .531 .545

ERA-

サンプル 前年成績 予測値
2010 51 .376 .457
2011 55 .264 .410
2012 52 .377 .364
2013 49 .324 .248
2014 48 .340 .287
2015 54 .322 .470
2016 55 .364 .351
2017 59 .210 .400
2010 - 2017 423 .319 .380

 打撃(wRC+)に関しては良いとは言わないもののボチボチかもしれないが、投手成績に関してはかなり厳しい。ERAは元々投手の能力のみで計れるものではないし、年度間相関も低く予測自体が難しいが、FIPの場合もそれほどという結果である。これはFIPの要素の一つである被本塁打が年度間で一定しないのと、与四球も案外ばらつきがあるせいだろうと思う。投手の成績自体が一定した傾向を持ちにくい。

 以上のように、精度については前年成績を当てはめるよりは多少マシという程度だ。ただし、こういった成績予測の眼目は精度が高いか低いかよりも(もちろん高い方が望ましいが)、ある程度合理的な方法論で選手に一貫した評価を与え、ペナントレースに対して見通しを得ることができるということが重要だと思っている。

■ チーム成績の予測

 最後にチーム成績に落とし込んで戦力の予測値を算出する。

 方法としては一つのポジションに対して600打席を上限として打席数の予測値の多い選手から順に割り振っていき、足りなければ最も打席数の多い選手以外のwOBAの平均値をリプレイスメントとして不足分を埋める。こうして各ポジションごとのwOBAとUZRの予測値が出るので、これをリーグ平均と比較して得点換算する。

 投手も同様で、先発登板数の予測値の多い選手から順に143試合になるまで埋めていき、救援投手は先発投手のイニング数とあわせて1280イニングになるまで投球回の予測値の多い選手から埋めていき、最終的にはチームのFIPをリーグ平均と比較して得点換算する。

 野手の得点換算値と投手の得点換算値を合算すればそれがそのチームの戦力値となり、ここから期待勝率を算出する。