이미지 분할

Yeju Ham
Jul 7, 2021

--

  • 이미지분할(image segmentation)
    이미지 분할의 목표는 이미지의 각 픽셀에 표시되는 항목에 해당 클래스에 레이블을 지정하는 것이다. 하나의 이미지를 여러개의 이미지로 나눈다는 개념인데, 분할된 각 이미지마다 혹은 각 픽셀마다 레이블을 부여하여 학습한다. 이렇게 학습된 이미지들은 더 의미가 있고 분석하기 쉽다. 주로 객체 위치와 바운더리를 보는데 사용된다.
  • 이미지 분할을 할 때는 Unet을 이용한다.
  • 유넷에서 기본적으로 아래로 다운샘플링 되면서 중요한 특성들을 뽑아내며 다시 업샘플링을 하며 뽑아냈던 중요한 특성들을 이용해서 이 정보들을 복구한다. 다운샘플링(컨볼루션, 풀링 등)하면 기본적으로 고해상도 이미지가 저해상도 이미지로 변환된다. 컨벌루션 네트워크에서는 이미지의 높이와 너비가 감소하고, 깊은 계층의 필터가 더 큰 수용필드(컨텍스트)에 집중하는데 도움이 된다. 또한 차원이 줄어들수록 what에 대한 정보를 더 잘 습득하지만 where의 정보는 잃어버린다.
    업샘플링: 보통 출력에는 what과 where 정보가 모두 필요하다. 그러나 다운 샘플링을 결과엔 what 정보만 있기 때문에 업샘플링을 통해 이 정보를 복구한다.이를 통해 저해상도 이미지를 고해상도로 변환한다. 그 기술중 하나가 deconvolution(transposed convolution)이다.

--

--

Yeju Ham

learner, writer, traveler, data science beginner with the whole passion