서지주요정보
Concept feature visualization exploiting sparse autoencoders in channels of convolutional neural networks = 희소 성질 오토인코더를 활용한 컨볼루션 신경망 내의 채널 개념 특징 시각화
서명 / 저자 Concept feature visualization exploiting sparse autoencoders in channels of convolutional neural networks = 희소 성질 오토인코더를 활용한 컨볼루션 신경망 내의 채널 개념 특징 시각화 / Sang Un Gu.
발행사항 [대전 : 한국과학기술원, 2025].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8043954

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MAI 25005

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recently, The number of applications and efficiency of Deep Neural Networks(DNN) have been increased rapidly. The explanations and interpretations on activated features internally of the DNN models are required in the field of research also in society. Following this trends, Researches on explaining Transformer-based Language Models exploit Sparse AutoEncoders(SAE) for linear decomposition of model's features. However, in the field of explaining recent image processing models such as Vision Transformers(ViT) and ConvNeXt based models, which process image inputs as Transformers Language models did, the researches cluster or classify Concept Activation Vectors(CAV) into interpretable structures. But, these methods are less intuitive than feature visualizations. Also, in the researches on the feature visualization, they are highly dependent on the specific input sample image. For addressing this problem, this paper suggests CAV optimization visualization from random noise input into interpretable feature image by optimizing objective function of cosine-similarity between CAV and noise input activations following the definition of CAV. Also, this paper shows visualized features are polysemantical, and suggests a method for decomposition of features by acquiring concept vectors exploiting SAE.

최근 심층신경망의 활용 사례 및 효율성이 높아짐에 따라 많은 분야에서 심층신경망을 활용한 인공지능 모델을 도입하고 있다. 그에 따라, 심층신경망 인공지능 모델 내부에서 표현되는 활성화된 특징에 대하여 설명과 해석이 연구 분야 및 사회적으로도 요구되어지고 있다. 이러한 추세에 맞추어, 트랜스포머 기반의 언어 모델에서 특징의 선형적 분리를 위해 희소 성질 오토인코더가 활용되고 있는 추세이다. 그러나, 유사한 입력 처리를 채용하는 비전 트랜스포머(ViT), ConvNeXt와 같은 고차원 이미지를 처리하는 컨볼루션 기반의 인공신경망에 대한 선형적 분리의 시도는 모델 내부의 컨셉 활성 벡터(Concept Activation Vector)의 군집화 혹은 분류에 그치고 있다. 이러한 방식들은, 시각화에 비해 직관성이 낮은 방식이다. 또한, 특징 시각화에 대한 연구에서는, 정해진 특정 표본에 대한 시각화 연구가 이루어져 입력값에 매우 종속적인 설명을 제공한다. 본 연구는 이를 해결하기 위해, 컨셉 활성 벡터가 가지는 특징을 해석하기 위해 최적화를 활용한 시각화 방식을 제안하고자 한다. 컨셉 활성 벡터의 코사인 유사도를 활용한 목적함수 설계로, 서포트 벡터 머신을 활용한 컨셉 활성 벡터의 정의에 걸맞는 시각화 방법을 제시하고자 한다. 또한, 기존의 컨셉 활성 벡터의 시각화를 통해 얻는 특징은 다의미성을 지님을 보이고, 컨셉 활성 벡터를 희소 성질 오토인코더를 이용해 유도하여 특징들의 시각화를 분리 표현하는 방법을 제시하고자 한다.

서지기타정보

서지기타정보
청구기호 {MAI 25005
형태사항 iv, 28 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기: 구상언
지도교수의 영문표기: Choi, Jae Sik
지도교수의 한글표기: 최재식
Appendix: A. Concept list for training feature learning and examples of visualizations -- A.0.1. Concept list -- A.0.2. Examples of visualization -- A.0.3. Sparsity in SAEs of channels in the model
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References: p. 20-22
주제 Convolutional Neural Networks
Explainable AI(XAI)
Feature Visualization
Optimization
Concept Activation Vector
Sparse Autoencoders
컨볼루션 기반 신경망
설명가능성 인공지능
특징 시각화
최적화 기반 시각화
컨셉 활성화 벡터
희소 성질 오토인코더
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서

Examples of Concept Optimization Visualization: Each images in figure labeled in form of (method concept layer/channel) for example, (a) is rifle concept in 39-th channel offeatures.1 retrived with CAV. Features are visualized background pattern and part of object image. For example in (c), artichoke is representing dots patterns with its leaves, (d) is representing vertical lines patterns with do

ConvNeXt Architecture in Experiment(Figure from [71

Qualitative Comparisons of Concept Optimization Visualization

Similar Pattern Features for Same Channels in SAE

Larger Object at Later Layer(airship feature)

Quantitative Comparison Between CAV and SAE: In CLIP scores, V represents visualization images, VT represents modified texts for visualization images, 0 represents original images, and OT represents original concept texts.

Vector Correlation Heatmap Over Concepts

Text Appears When Maximizing Cosine Similarity

Examples of Visualized Features: Each cases have samples ofconceptimages, and CAV visualization in the second row, and SAE visualization in the third row of each case.

SAE features.1 Activation Frequency Heatmap

Pattern Recognition Features