매일매일 논문을 리뷰하기 위해서 object detection에 대해서 정리를 하겠습니다.

오랜만에 정리할 내용은 Dense object detection에 관한 내용입니다.

일반적으로는 detection에서는 이미지들이 sparse하게 있는 경우가 많습니다. 예로들어서 물체가 있더라도 어느정도 거리가 있는 상태에서 detection을 풀어갑니다.

object detection의 예 

그렇지만 실제로는 매장이나 실제 상업적인 이미지중에서 dense하게 있는 영상이 있는데 이를 해결하기 위해 새롭게 제공한 데이터와 방법론을 제시했습니다.

제시한 데이터 예시 

이 논문에서는 3가지의 contribution을 제시하는데

  1. Soft-IOU layer를 추가하여서 새롭게 estimation할수 있다고 합니다.
  2. EM 방식으로 overlap ambiguity 영역을 해결을 하였다고 합니다.
  3. 마지막으로는 SKU-110K같이 dense한 데이터셋에 대해서 제공을 하였습니다.

METHOD

Soft-IOU layer

처음으로 제시한 방법은 IOU의 변화를 제시한 방법입니다.
일반적으로 IOU는 intersection/union으로 수식이 되어지지만 MAP나 평가를 할떄 사용이 되어집니다. 하지만 이 논문에서는 IOU를 사용해서 cross entropy loss에 적용을 하였습니다. 이를 사용하면 일반적으로 object에 probability는 IOU의 형태가 random하게 되어도 상관이 없어서 bounding box가 다양하다는 특징이 있습니다. 그렇지만 IOU를 cross entropy로 사용하게되면 좀더 정확한 bbox를 만들수가 있다고 합니다.

cross entropy에 IOU를 적용한 방법 

제가 알고 있었던 soft-iou는 각 IOU에서 class의 수만큼 나눠줘서 클래스마다의 iou의 값을 주는것이였는데 다르네요 .

다른 soft iou.. 헷갈리네요

EM-Merge unit for inference

일반적으로 NMS보다 좀더 개선되게 EM merge unit로 Gaussian detection로 NMS방법을 제시하였다고 합니다ㅣ.
방법은 unsupervised 방법중에하나인 mixture gaussian으로 사용이 되었습니다.
그래서 prediction의 bbox와 label 의 bbox의 KL distance를 제시해서 후처리를 했다고 합니다.
따로 network를 사용하진 않고 EM algorithm을 통해서 parmeter를 구했습니다.

 

SKU-110K

제시한 새로운 데이터셋

Result

반응형

+ Recent posts