Owing to the high complexity of the global optical flow estimation method, it is designed with a VLSI typically for real-time and low-power operation in mobile systems. Most VLSI designs for the global method focus on reducing the excessive external memory access caused by the global and iterative processes. However, to achieve this goal, considerable amounts of resources are used and the throughput is decreased. To address these issues, a multirow-based propagation approach and an efficient VLSI architecture are proposed in this dissertation. To compute the optical flow by using the small internal memory without external memory access, this approach divides an input image horizontally and vertically, and a subimage consisting of multiple rows is processed sequentially. Furthermore, to prevent the accuracy degradation that originates from the boundaries of the divided subimages, boundary conditions are imposed based on the smoothness of the optical flow, which is generally assumed in the global method. In addition, the main equations of the global optical flow method are simplified to boost the processing speed. The experimental results demonstrate that the external memory access is reduced by 96.55% with negligible accuracy degradation. Furthermore, the proposed design uses 80.4%-93.6% less internal memory and achieves 2.2$\times$-29.3$\times$ higher throughput-per-watt compared to state-of-the-art designs.
높은 복잡도의 전역적 옵티컬 플로우 추정 방법은 일반적으로 전용 VLSI 설계를 통해 모바일 시스템에서 실시간, 저전력 구동된다. VLSI 설계 대부분이 전역적, 반복적인 프로세스로 인해 발생되는 대규모 외부 메모리 접근에 집중하고 이를 감소시키기 위한 방법들을 제안하지만, 이로 인해 로직 및 내부 메모리의 사용량이 크게 증가되고 처리속도 또한 저하된다. 이 문제를 해결하기 위해, 본 논문은 다중 행 기반 전파 방식과 이를 효율적으로 지원하는 VLSI 구조를 제안한다. 제안 방식은 외부 메모리 접근 없이 작은 크기의 내부 메모리만으로 옵티컬 플로우를 계산하기 위해 입력 영상을 수평 및 수직으로 분할하여 다중 행 단위로 처리한다. 또한, 분할로 인해 경계면에서 파생되는 열화를 막기 위해 전역적 방법의 옵티컬 플로우 평탄 가정에 기반한 경계 조건을 제안한다. 추가적으로, 처리속도 향상을 위해 계산식을 단순화한다. 제안한 다중 행 기반 전파 방법을 다양한 데이터셋에서 평가한 결과, 정확도 저하가 거의 없이 외부 메모리로의 접근 데이터 양이 96.55% 감소한다. 또한, 최신 설계 대비, 제안 방법에 기반하여 설계된 VLSI의 내부 메모리 사용량은 80.4%-93.6% 감소하며 와트 당 처리량은 2.2배-29.3배 향상된다.