1. Task의 분류
Segmentation 또는 Image Segmentation은 컴퓨터 비전에서 연구되는 주요 분야 중 하나로, 이미지를 객체에 대응하는 여러 부분(segments)이나 영역으로 나누는 것입니다. 이미지의 픽셀을 레이블이나 카테고리에 할당해서 비슷한 것끼리 묶는 것을 목표로 하고 있습니다.[1] Segmentation은 크게 Semantic, Instance, Panoptic로 구분할 수 있습니다.
Semantic Segmentation은 이미지의 픽셀 단위로 분류해서 클래스나 객체인지를 구분하는 컴퓨터 비전의 한 영역입니다. 이 과제의 주요 목표는 매핑을 통해 이미지를 모두 구분할 수 있는 구분을 형성하는 것입니다. [2] Instance Segmentation은 이미지 안 있는 개별 객체를 경계와 개별 객체에 고유한 레이블을 부여하는 것입니다. [3] Panoptic Segmentation은 semantic과 instance의 결합된 버전으로 장면에 대한 전반적인 이해를 하는 것을 목표로 하고 있습니다. 이미지를 의미에 따라 나누는 것은 semantic, 각 개별 객체를 구분해내는 것은 instance의 방법을 따라가는 것으로 주어진 이미지에서 의미 레이블과 고유의 인스턴스 id를 부여합니다. [4]
아래 이미지를 참고하면 각각에 대해 한번에 와닿게 이해할 수 있을 겁니다.
2. 주요 지표
객체 탐지 문제와 유사하게 면적을 계산할 수 있는만큼 Segmentation 역시 IoU를 활용해 평가지표로 활용할 수 있습니다.
2024.10.02 - [노트/Computer Vision] - [OD] 객체 탐지(Object Detection) 성능 판단 지표 정리 | IOU, mAP, FPS, FLOPS
[OD] 객체 탐지(Object Detection) 성능 판단 지표 정리 | IOU, mAP, FPS, FLOPS
IoUIoU (Intersection Over Union)은 모델이 얼마나 객체 탐지를 정확하게 했는지, 즉 모델이 찾은 객체의 위치가 실제 데이터셋의 ground truth와 겹치는지를 확인하는 지표 입니다. 영문 명칭에서 확인할
seanpark11.tistory.com
이와 유사하게 두개의 영역이 얼마나 겹쳐져 있는지 살펴보는 또 다른 지표인 Dice 라는 것이 존재합니다. 원래 명칭은 Dice-Sørensen coefficient라고 하는데, 두 샘플 사이의 유사도를 측정하는 통계치입니다. 공식은 아래와 같습니다.
IOU 공식은 교집합을 합집합으로 나눈 것이었지만, Dice는 교집합의 2배를 각각 집합을 더한 것만큼 나눈 것이기 때문에 수치적으로 조금 차이가 있을 수 있습니다.
이를 컴퓨터에서도 사용할 수 있게끔 boolean으로 풀어쓰면 아래와 같습니다. 겹치는 것은 2배해서 분자와 분모에 모두 넣고 분모에는 추가적으로 Ground Truth에는 있지만 Prediction에는 없는 것(FN)과 Ground Truth에는 없지만 Prediction에만 있는 것(FP)까지 함께 더합니다.
참고자료
[1] https://paperswithcode.com/task/image-segmentation
[2] https://paperswithcode.com/task/semantic-segmentation
[3] https://paperswithcode.com/task/instance-segmentation
[4] https://paperswithcode.com/task/panoptic-segmentation
[5] https://mindy-support.com/news-post/what-is-image-segmentation-the-basics-and-key-techniques/
[6] https://en.wikipedia.org/wiki/Dice-S%C3%B8rensen_coefficient
'Note > Deep Learning' 카테고리의 다른 글
[NLP] Large Language Model(LLM)의 학습 방법론 | LLM Pretrained Models (0) | 2024.12.03 |
---|---|
[Seg] Fully Convolutional Networks (FCN) for Segmentation 정리 (0) | 2024.11.15 |
OCR 성능 평가 지표 알아보기 | DetEval, IoU, TIoU, CLEval (0) | 2024.11.07 |
[OCR] 광학 문자 인식(OCR) 문제와 특징 (2) | 2024.11.02 |
[OD] 1-Stage Detector 변천사 | YOLO v1, SSD, RetinaNet 까지 (0) | 2024.10.14 |