소개 YOLO는 You Only Look Once의 약자이다. 대략 R-CNN은 너무 느렸으며(5초), Fast R-CNN도 0.5프레임으로 느렸고, Faster R-CNN도 7프레임이 최대였다. 이때 YOLO가 등장하여 45프레임을 보여주었고 빠른 버전의 경우 155프레임을 기록하며 사람들을 놀라게 했다. R-CNN - Fast R-CNN - Faster R-CNN - YOLO는 대략 10배씩 속도차이가 난다. 게다가 성능도 FasterR-CNN에 비해 크게 떨어지지 않았다. 기존 방법과의 차이점 R-CNN 계열의 검출 네트워크들은 영상에서 오브젝트가 있을 것 같은 후보(ROI - Region If Interest : 관심영역)를 먼저 뽑는다. 후보로 뽑힌 ROI(영상의 작은 부분) 들은 분류기(Cla..
object detection
YOLO란? YOLO 는 you Only Look Once, 즉 이미지를 한번 보는 것만으로 Object의 종류와 위치를 추측하는 딥러닝 기반의 물체인식 알고리즘을 뜻한다 1-stage detector로서 간단한 처리과정으로 다른 딥러닝 알고리즘에 비해 속도가 매우 빠르며, 높은 mAP(mean Average Precision)을 보인다. 하지만 작은 object에 대해서 낮은 정확도를 보인다. -The YOLO Detection System. YOLO로 처리하는 이미지는 간단하고 직관적이다. (1) Input image를 resize한다. (2) image에서 작동하는 single convolutional network(1 X 1 convolutions)를 실행한다. (3) 해당 모델을 통해서 나온 확..
사전지식 Face Detection with cascade Object Detector 그림1.에서 머신러닝의 학습데이터로써 사람의 얼굴이 포함된 Positice lmage와 얼굴이 포함되지 않은 Negative Image를 사용하며 Positive Image에서 사람의 얼굴을 ROI(Region Of Interest)로 표시한다. 다음으로 영상에서 특징을 추출하는 작업을 수행하는데, 사람 얼굴의 특징을 추출하기 위해서는 Haar-like feature나 LBP(Local Binary Patters)등이 자주 사용된다. 그리고 분류기를 훈련시키는 작업이 이어지게 된다. Cascade of Classifier라는 분류가 한 번에 결정되는 것이 아니라 여러단계(Cascade)의 분류과정을 거치게 된다. 출처..
들어가기전에 object proposal end to end 학습 Abstract. 단일의 deep neural network로 object detection을 구현했습니다. SSD라고 불리는 접근법은 다양한 크기와 비율을 가진 default box들로 각 feature map에서 bounding box를 뽑아냅니다. predict를 할 때는 네트워크가 각 default box가 각각의 사물 카테고리에 속하는 score와 사물 모양에 잘 맞는 box를 만들어 냅니다. 게다가, 다양한 크기를 가지는 사물을 매끄럽게 변환한 다양한 feature map들을 결합하여 predict에 사용합니다. 쉽게 보면 object proposal들을 사용하는 방법들과 다릅니다. 그 이유는 proposal을 생성하는 부분과 ..