We develop a hierarchical Bayesian model for predicting whether a specific batter reaches on-base from a matchup with a specific pitcher. Using less than 100 lines of historical matchup data from a particular batter/pitcher matchup, our proposed model allows estimating the probability of the event occurring in the matchup of corresponding players. We also show that the defense ability of pitcher's team is negatively correlated to the probability that the opponent team's batter reaches on-base and extend our model with a new variable. The proposed model is estimated from Markov chain Monte Carlo method. We compare the performance of our model to the log5 model and generalized log5 model which are commonly used methods for modeling the probability of the event in baseball.
우리는 야구 경기에서 특정 투수를 상대로 특정 타자의 출루 여부를 예측하는 계층적 베이지언 모델을 개발하였다. 본 모델은 100줄보다 적은 타자/투수 매치업 데이터를 활용하여 해당 선수들의 매치업 상황에서 특정 이벤트가 발생할 확률을 추정한다. 또한 우리는 투수 팀의 수비 능력이 반대 팀의 타자의 출루 여부와 음의 상관관계가 있다는 것을 보인 후 제안한 모델에 투수팀의 수비 지표를 새로운 변수로 추가하여 모델을 확장 시켰다. 제안된 모델은 마코프체인 몬테카를로 기법을 통하여 추정되었다. 우리는 야구에서 어떠한 이벤트의 발생 확률을 예측하기 위해 사용된 기존의 방법인 로그5 모델과 일반화된 로그5 모델과의 비교를 통해 제안한 모델의 예측 성능을 나타내었다.