YOLO란?
YOLO 는 you Only Look Once, 즉 이미지를 한번 보는 것만으로 Object의 종류와 위치를 추측하는 딥러닝 기반의 물체인식 알고리즘을 뜻한다
1-stage detector로서 간단한 처리과정으로 다른 딥러닝 알고리즘에 비해 속도가 매우 빠르며, 높은 mAP(mean Average Precision)을 보인다. 하지만 작은 object에 대해서 낮은 정확도를 보인다.
-The YOLO Detection System.
YOLO로 처리하는 이미지는 간단하고 직관적이다.
(1) Input image를 resize한다.
(2) image에서 작동하는 single convolutional network(1 X 1 convolutions)를 실행한다.
(3) 해당 모델을 통해서 나온 확률 값을 threshold로 잘라서 결과값을 보여준다. (object 점수를 기준으로 box를 필터링한다. 일반적으로 점수가 threshold 미만인 box는 무시된다.)
-Unified Detection:
네트워크의 큰 특징 중 하나는 이미지 전부로부터 features를 뽑아서 각 bounding box를 예측한다는 것이다.
시스템은 input image를 S x S grid로 나눈다.
그리고 만약 어떤 object의 한 가운데가 grid cell에 놓인다면, grid cell은 그 object를 탐지할 의무가 생긴다는 설정이다.
각 grid cell은 B개의 bounding boxes를 예측하고 그 box의 예측 대한 confidence score를 같이 예측한다.
confidence score은 얼마나 박스 안에 실제로 object가 존재하는지, 그리고 그 class를 얼마나 잘 반영했는지에 대한 것이다.
Confidence 는 형식적으로 Pr(Object) * IOU(intersection over union) 라고 정의한다.
( IOU란 정답 box와 예측 box의 교집합 크기 / 합집합 크기 이다 )
Object가 box안에 아무것도 없을 때에는 confidence가 0이 되어야 한다.
또, predicted box와 ground truth의 IOU가 얼마나 일치하는지가 confidence가 되도록 맞추고 싶다.
Objectness sroce가 confidence값이다.
-YOLO의 장점
(1) YOLO는 매우 빠르다.
- 우리가 detection을 single regression problem으로 정의하는 것을 통해서, 우리는 복잡한 pipeline이 필요하지 않다.
(2) YOLO는 image를 예측시에 globally하다는 특징을 가진다.
- sliding window나 region proposal 기반의 기술들과는 다르게 학습이나 테스트 중에 전체 이미지를 보기 때문에, 은연중에 각 class의 대표적인 표현들에 대해서 맥락적인 정보를 encoding 한다.
- 강력한 detection방법인 Fast R-CNN경우에는 배경정보에 따라서 object를 detect하는데 있어서 실수가 있는데, 이것은 Fast R-CNN이 큰 맥락을 보지 못하기 때문이다.
- YOLO는 Fast R-CNN과 비교했을 때, background error가 절반 정도 밖에 되지 않다.
(3) object의 일반적인 특징을 학습한다.
- object의 일반화를 잘한다.
- 예술작품이나 자연의 이미지를 학습하거나 테스트할 때, R-CNN같은 강력한 detection방법들보다 학습을 더 잘한다.
- YOLO는 일반화에 강력하기 때문에, 새로운 도메인이나 예상하지 못한 input이 들어와도 망가질 확률이 적다.
'Programmer > Deep Learning' 카테고리의 다른 글
YOLO 튜토리얼 3. Implementing the forward pass of the network (0) | 2020.04.26 |
---|---|
YOLO 튜토리얼 2. Creating the layers of the network architecture (0) | 2020.04.26 |
[논문리뷰] Rapid Object Detection using a Boosted Cascade of Simple Features (0) | 2020.04.21 |
[논문리뷰] An Overview Of Face Liveness Detection 2 (0) | 2020.04.19 |
[논문리뷰] An Overview of Face Liveness Detection1 (0) | 2020.04.18 |