반응형
CNN(Convolutional Neural Network)과 Diffusion 모델은 서로 다른 개념과 용도로 사용되는 두 가지 신경망 모델입니다.
각 모델의 특징과 차이점 :
CNN (Convolutional Neural Network)
특징:
- 주로 합성곱 계층(Convolutional Layers), 풀링 계층(Pooling Layers), 완전 연결 계층(Fully Connected Layers)으로 구성
- 이미지 분류, 객체 탐지, 세그멘테이션 등과 같은 컴퓨터 비전 작업에 주로 사용
- 원리:
- 합성곱 계층: 입력 이미지의 작은 패치를 필터(커널)와 컨볼루션 연산을 수행하여 특징 맵을 생성
- 풀링 계층: 특징 맵의 공간적 크기를 줄여 연산량을 감소시키고 중요한 특징을 추출
- 완전 연결 계층: 마지막 합성곱 계층이나 풀링 계층의 출력을 1차원 벡터로 변환하고, 이를 통해 클래스 점수를 예측
- ResNet, VGG, Inception 등 다양한 CNN 아키텍처
Diffusion 모델
특징:
- 주로 확률적 과정과 신경망을 결합하여 데이터 분포를 모델링하는 구조
- 데이터 생성, 특히 이미지 생성 및 복원 작업에 사용
- 원리:
- Forward 과정: 데이터를 점진적으로 노이즈화하여 데이터를 단순한 분포(예: 가우시안 분포)로 변환
- Reverse 과정: 노이즈화된 데이터를 점진적으로 복원하여 원본 데이터를 생성합니다. 이 과정은 학습된 신경망을 통해 수행
- DDPM (Denoising Diffusion Probabilistic Models), Score-based Generative Models 등
주요 차이점:
- CNN:
- 주로 이미지의 특징을 추출하고, 분류, 탐지 등의 작업
- 합성곱 연산을 통해 입력 데이터의 특징을 추출하고, 예측
- 이미지 분류, 객체 탐지, 이미지 세그멘테이션 등 다양한 컴퓨터 비전 작업.
- Diffusion 모델:
- 데이터를 생성/ 복원. 예를 들어, 이미지를 노이즈로부터 복원하거나 새로운 이미지를 생성
- 데이터에 노이즈를 점진적으로 추가한 후, 그 노이즈를 제거하면서 원본 데이터를 복원하는 과정을 학습
- 이미지 생성, 데이터 복원, 이미지 인페인팅 등 생성 모델 분야.
반응형
'AI > Computer Vision' 카테고리의 다른 글
[CV] Xvfb 설정 nvidia-smi랑 연결, error, OpenGL 사용법 /pyglet.canvas.xlib.NoSuchDisplayException: Cannot connect to "None" (0) | 2025.01.30 |
---|---|
[CV] NVS evaluation metrics, 이미지 합성 평가지표 (0) | 2025.01.24 |
[CV] DeepLabCut 설치 / 사용법 (2) | 2024.06.26 |
[CV] Few-shot learning 이란? (1) | 2024.06.18 |
[CV] 컴퓨터 화면 원점, 좌표 설정 (1) | 2024.06.07 |