서지주요정보
Improving baseball pitch type classification through clustering of pitchers = 투수 군집화를 통한 야구 구종 분류 개선
서명 / 저자 Improving baseball pitch type classification through clustering of pitchers = 투수 군집화를 통한 야구 구종 분류 개선 / Jeonghyun Choi.
저자명 Choi, Jeonghyun ; 최정현
발행사항 [대전 : 한국과학기술원, 2019].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8033644

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

MIE 19014

SMS전송 소장위치

도서상태

이용가능

대출가능

반납예정일

초록정보

In this paper, we propose a method for improving the performance of baseball pitch type classification through clustering of pitchers. Previous studies assume an individual classification model for each pitcher. This approach can reflect personal characteristics; however, it can suffer from a lack of data especially for new players. This problem can be resolved using the single unified model classification; however, it is not flexible enough to capture individual differences. To retain the advantages of both approaches while complementing their disadvantages, we propose to cluster pitchers by several homogeneous groups that share similar characteristics, such as left/right handedness and pitching form, and then build separate classification models for different clusters. We show via real-data experiments that using the proposed approach, we can increase the classification accuracy with less standard error. In particular, we achieved the best performance when the multi-layer perceptron was used as a classification algorithm, in combination with k-means clustering. We also discuss the benefits of our clustering approach in characterizing pitchers for making strategic decisions for effective team management.

본 논문에서는 투수 군집화를 통해 기존의 구종 분류 알고리즘의 성능을 높이는 방법을 제안한다. 기존의 연구들의 경우, 각 투수별로 분류 모델을 설정한다. 이 접근 방식은 개인의 특성이 반영되어 있지만 새로운 선수들에 대한 데이터가 부족하다는 문제점을 가진다. 이러한 문제점은 하나의 통합된 분류 모델을 통해서 해결이 가능하다. 하지만 이 역시 개개인의 차별성을 반영 하기가 힘들다는 단점이 있다. 우리는 이러한 두가지 방법의 장점을 유지하면서 단점을 보완하기 위하여 좌완/우완, 투구폼과 같은 유사한 특성을 공유하는 여러 동질 그룹별로 투수를 군집화 한 다음, 서로 다른 그룹에 대해 별도의 분류 모델을 사용하는 방식을 제안한다. 우리는 실제 데이터 실험을 통해 제안된 접근 방식을 사용하여, 보다 적은 표준 오류로 분류 정확도를 높일 수 있음을 보여준다. 특히 다중 레이어 퍼셉트론이 K-평균 알고리즘과 함께 분류 알고리즘으로 사용 될 경우 최상의 성능을 보였다. 우리는 또한 효과적인 팀 운영에 필요한 전략적인 결정을 내리기 위해 투수들의 특성을 분석함에 있어서 클러스터링 접근법의 이점에 대해서도 논의한다.

서지기타정보

서지기타정보
청구기호 {MIE 19014
형태사항 iii, 19 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 최정현
지도교수의 영문표기 : Heeyoung Kim
지도교수의 한글표기 : 김희영
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 산업및시스템공학과,
서지주기 References : p. 16-17
주제 deep learning
k-means
machine learning
multi-layer perceptron
principal component analysis
딥러닝
K-평균 알고리즘
기계학습
다층퍼셉트론
주성분분석
QR CODE qr code