AI/Computer Vision

CNN(Convolutional Neural Network)과 Diffusion model 차이점

도도걸만단 2024. 6. 3. 21:54
반응형

CNN(Convolutional Neural Network)과 Diffusion 모델은 서로 다른 개념과 용도로 사용되는 두 가지 신경망 모델입니다.

각 모델의 특징과 차이점 :

CNN (Convolutional Neural Network)

특징:

  1.  주로 합성곱 계층(Convolutional Layers), 풀링 계층(Pooling Layers), 완전 연결 계층(Fully Connected Layers)으로 구성
  2. 이미지 분류, 객체 탐지, 세그멘테이션 등과 같은 컴퓨터 비전 작업에 주로 사용
  3. 원리:
    • 합성곱 계층: 입력 이미지의 작은 패치를 필터(커널)와 컨볼루션 연산을 수행하여 특징 맵을 생성
    • 풀링 계층: 특징 맵의 공간적 크기를 줄여 연산량을 감소시키고 중요한 특징을 추출
    • 완전 연결 계층: 마지막 합성곱 계층이나 풀링 계층의 출력을 1차원 벡터로 변환하고, 이를 통해 클래스 점수를 예측
  • ResNet, VGG, Inception 등 다양한 CNN 아키텍처

Diffusion 모델

특징:

  1. 주로 확률적 과정과 신경망을 결합하여 데이터 분포를 모델링하는 구조
  2. 데이터 생성, 특히 이미지 생성 및 복원 작업에 사용
  3. 원리:
    • Forward 과정: 데이터를 점진적으로 노이즈화하여 데이터를 단순한 분포(예: 가우시안 분포)로 변환
    • Reverse 과정: 노이즈화된 데이터를 점진적으로 복원하여 원본 데이터를 생성합니다. 이 과정은 학습된 신경망을 통해 수행
  • DDPM (Denoising Diffusion Probabilistic Models), Score-based Generative Models 등

주요 차이점:

  • CNN:
  • 주로 이미지의 특징을 추출하고, 분류, 탐지 등의 작업
  • 합성곱 연산을 통해 입력 데이터의 특징을 추출하고, 예측
  • 이미지 분류, 객체 탐지, 이미지 세그멘테이션 등 다양한 컴퓨터 비전 작업.

 

  • Diffusion 모델:
  • 데이터를 생성/ 복원. 예를 들어, 이미지를 노이즈로부터 복원하거나 새로운 이미지를 생성
  • 데이터에 노이즈를 점진적으로 추가한 후, 그 노이즈를 제거하면서 원본 데이터를 복원하는 과정을 학습
  • 이미지 생성, 데이터 복원, 이미지 인페인팅 등 생성 모델 분야.

 

반응형