In computer vision, deep neural networks have made significant progresses; however, they often suffer from notable performance degradation when confronted with distribution shifts between the train set and the test set. Addressing this challenge without the need for additional data collection has become a recent research focus. A primary hurdle in handling such shifts is the dataset bias, where models overly rely on the unwanted correlation between peripheral attributes and labels. This bias can lead models to learn irrelevant features, hindering their ability to generalize to various data distributions. Another challenge is the domain shift, which encompasses differences in style, object sizes, or sources of datasets. Among various techniques for addressing the domain shift, test-time adaptation (TTA) has gained traction for its practicality in mitigating these shifts. This thesis mainly tackles such two challenges in computer vision and further suggests the future work direction of addressing distribution shifts.
컴퓨터 비전에서 심층 신경망은 상당한 발전을 이루었습니다. 그러나 훈련 데이터셋과 평가 데이터셋 사이에 분포 변화가 존재할 때, 딥러닝 모델들은 현저한 성능 저하를 보여줍니다. 이러한 문제를 추가 데이터 수집 없이 해결하는 것이 최근 연구의 초점이 되었습니다. 분포 변화를 처리하는 데 있어 주요 장애물 중 하나는 데이터 편향, 즉 모델이 중요하지 않은 속성과 레이블 간의 원치 않는 상관 관계에 지나치게 의존하는 것 입니다. 데이터 편향으로 인해 딥러닝 모델들은 관련 없는 정보을 학습하게 되어 평가 데이터셋에 포함되어 있을 수 있는 다양한 데이터 분포로 일반화하는 능력이 떨어질 수 있습니다. 데이터 편향에 이어 또 다른 주요한 문제는 도메인 변화입니다. 도메인은 스타일, 물체의 크기 또는 데이터 세트 소스의 차이를 포함하는 용어입니다. 도메인 변화을 해결하기 위한 다양한 기술 중에서 테스트 시간 적응(TTA)은 그 실용성으로 인해 최근 많은 주목을 받았습니다. 본 학위 논문은 컴퓨터 비젼에서의 분포 변화에서 발생하는 두 가지 문제를 주로 다루며, 향후 연구 방향성도 제시합니다.