AI/Dataset

[Dataset] Holopix50k

도도걸만단 2025. 5. 1. 01:48
반응형

Holopix50k 데이터셋은 약 49,368쌍의 스테레오 이미지 페어로 구성되어 있으며, 다양한 실제 환경에서 촬영된 이미지들을 포함하고 있어 COCO 데이터셋과 유사한 다양성을 제공합니다. 이러한 특성으로 인해 스테레오 비전, 깊이 추정, 스타일 변환 등 다양한 컴퓨터 비전 과제에 활용될 수 있습니다.

 

 

데이터셋 구성

  • 총 이미지 수: 약 49,368쌍의 스테레오 이미지 페어
  • 해상도: 720p(HD) 및 360p(SD) 해상도의 이미지 포함
  • 장면 다양성: 실내, 실외, 인물, 사물, 풍경 등 다양한 장면 포함
  • 촬영 환경: 모바일 앱 Holopix™를 통해 수집된 실제 환경의 이미지

 

 

다운로드 방법

 

Holopix50k 데이터셋은 GitHub에서 제공하는 스크립트를 통해 다운로드할 수 있습니다. Linux 또는 macOS 환경에서 다음 단계를 따라 다운로드를 진행하세요:

 

  1. 터미널을 열고 원하는 다운로드 경로로 이동합니다.
  2. 다음 명령어를 실행하여 다운로드 스크립트를 클론합니다:
git clone https://github.com/LeiaInc/holopix50k.git

 

  1. 스크립트 디렉토리로 이동합니다:
cd holopix50k/scripts

 

  1. 전체 데이터셋을 다운로드하려면 다음 명령어를 실행합니다:
./download_holopix50k.sh <DOWNLOAD_PATH>

 

  1. 여기서 <DOWNLOAD_PATH>는 데이터셋을 저장할 경로입니다.
  2. 특정 데이터 분할(예: train, test, val)만 다운로드하려면 다음과 같이 실행합니다:
./download_holopix50k.sh <DOWNLOAD_PATH> [train|test|val]

 

  1. 예를 들어, 훈련용 데이터만 다운로드하려면 [train]을 지정합니다.

 

참고: 이 스크립트는 Google Cloud Storage에서 데이터를 다운로드하기 위해 gsutil 도구를 사용합니다. 스크립트 실행 중에 gsutil이 자동으로 설치되지만, 문제가 발생할 경우 공식 설치 가이드를 참고하여 수동으로 설치할 수 있습니다.

 

 

전처리 및 사용

 

Holopix50k 데이터셋은 기본적으로 전처리된 상태로 제공되므로, 별도의 복잡한 전처리 없이 바로 사용할 수 있습니다. 각 스테레오 이미지 페어는 좌우 이미지로 구성되어 있으며, 일반적인 스테레오 비전 작업에 바로 활용 가능합니다. 다만, 특정 연구 목적에 따라 추가적인 전처리가 필요할 수 있습니다.

 

 

라이선스 및 사용 제한

 

Holopix50k 데이터셋은 Leia Inc.에서 제공하며, 비상업적 연구 목적으로만 사용이 허가되어 있습니다. 데이터셋을 사용할 경우, 다음과 같은 인용문을 포함해야 합니다:

@InProceedings{hua2020holopix50k,
  author = {Yiwen Hua and Puneet Kohli and Pritish Uplavikar and Anand Ravi and Saravana Gunaseelan and Jason Orozco and Edward Li},
  title = {Holopix50k: A Large-Scale In-the-wild Stereo Image Dataset},
  booktitle = {CVPR Workshop on Computer Vision for Augmented and Virtual Reality, Seattle, WA, 2020.},
  month = {June},
  year = {2020}
}

자세한 라이선스 내용은 GitHub 저장소의 LICENSE 파일을 참고하시기 바랍니다.

 

Holopix50k 데이터셋은 다양한 실제 환경에서 수집된 대규모 스테레오 이미지 페어를 제공하여, 스테레오 비전 및 깊이 추정과 같은 컴퓨터 비전 과제에 유용하게 활용될 수 있습니다.

반응형