Closed circuit televisions (CCTVs) have been installed in many public places for its own purpose. For example, CCTV operates to prevent crimes or to manage traffics. For this and many reasons the number of CCTVs has been increasing and will increase much faster with the growth of IP cameras and Internet of Things. For these cameras to be used efficiently it is necessary for CCTVs to detect various events automatically. However, it is general to detect pre-defined events because learning detection for a specific event takes high cost.
This paper addresses a method of deep learning for automatic event detection learning with web data. Deep learning requires data, so they are collected from the web and used as training data. To search the images, search keywords are automatically generated utilizing WordNet which is a lexical database for English. With those keywords, images are retrieved from the web search results. Also, we applied unsupervised learning to downloaded image data which are noisy and applied generalization technique to learn data which are not event data. It is shown that these approaches are effective for event detection.
CCTV는 다양한 공공장소에서 특별한 용도를 위해 지금까지 많이 설치되고 있다. 예를 들어, 범죄를 예방하거나 교통 상황을 통제하기 위해서 운용되었다. 이러한 목적으로 CCTV는 그 수가 증가하고 있으며 네트워크 카메라와 사물형 인터넷의 등장으로 더더욱 빠르게 증가될 것으로 보인다. 이렇게 많은 카메라들을 효율적으로 사용하기 위해서 다양한 사건에 대한 자동 감지가 필수적이다. 그러나 하나의 사건을 감지하도록 학습하는 것은 비용이 많이 드는 일이기 때문에 미리 정의된 사건에 대해 감지를 하는 것이 일반적이다.
이 논문에서는 사건 감지를 웹 데이터를 활용하여 자동으로 학습할 수 있는 딥 러닝 방법에 대해 다루었다. 딥 러닝을 하기 위해서는 데이터가 필수인데 사건 감지 학습에 필요한 데이터들을 웹으로부터 획득하여 학습에 사용하였다. 특정 사건에 대해 웹 데이터를 모을 수 있도록 영어 어휘 데이터베이스인 워드넷을 이용하여 검색 키워드를 자동으로 생성하였고 이러한 방식을 통해 대량의 이미지를 손쉽게 얻을 수 있었다. 또한 노이즈가 존재하는 웹 데이터들을 학습에 잘 활용할 수 있도록 비지도학습을 활용하였고 이벤트가 아닌 데이터를 학습하기 위해 일반화(generalization) 기법을 적용하고 이러한 접근이 사건 감지 학습에 효과적임을 보였다.