## Introduction
Tiny object detection의 경우에서는 실제 real image에서 많이 발견이 되어진다. 이미 object detection의 경우에서는 눈에 띄는 성능이 있었으며 large-scale의 object에서는 눈에띄는 성능의 향상이 있었다.
하지만 tiny object의 경우 16x16 픽셀의 아주 작은 이미지로 진행이 되어지며 information이 부족하며 또한 disriminative(분별)한 featurer가 학습하는것이 어렵다.
그렇기에 대표적으로 object detection의 성능만 보더라도 $AP_s$ 의 경우에서도 선능이 다르것에 비해서 높지 않는점이 있다.
이를 해결하기 위한 방법으로는 discriminative feature를 향상시키기 위한 방법도 있으며 , 어떤 방법은 small image의 resolution을 향상을 시켜서 input image의 scale과 비슷한 영상으로 만들어서 문제를 해결하는 방법이 있다.
이와 유사하게 GAN을 사용하여서도 super-resolution의 method를 적용하여서 small object의 resolution을 키우는 방법도 사용되어지기도 한다. Network의 관점으로는 Feature Pyramid network(FPN)의 방법을 사용하여 다양한 feature size를 사용해서 TOD performance를 적용하기도 한다.
이번 논문에서는 위의 문제중에서 discriminative feature의 관점에서 문제를 풀어보도록 한다. 일반적으로 object detection의 방법중에서 anchor-base의 방법을 사용하게 되어지면 pos/neg의 대한 bbox를 사용할수 있는데 이의 경우 Figure 1에서 보이는 것처럼 Tiny object에서 문제를 다음과 같이 발생시키며 또한 Figure 2에서도 다음과 같은 문제가 생긴다.
1. 큰 Variance로 인해서 IOU의 값의 차이가 크게 남.
2. 일반적인 BBox의 경우 IOU-Deviation가 일정하나 small object의 경우에서는 IOU-Deviation이 급격하게 되어지는 점이 있다.
3. 작은 bbox의 이동만으로도 pos가 neg로 변경되어지기도 함.
4. tiny object에서는 IOU가 민감함으로 좋은 metric이 아님
이 방법을 해결하기 위해서 Normalized Wasserstein Distance(NWD)을 제안하였고 이는 gaussian distributions의 유사도를 측정할수 있다.
## Method
IOU의 method랑 유사한 방법을 사용하였고 Jaccard similarity coefficient에서 영감을 받았다고 한다.
이 저자는 distribution을 base로 문제를 제시하였고 일반적ㅇ니 2D Gaussian distribtuon은 다음과 같다.
이때 x는 coordination , \mu는 mean, \sum 공분산이며 이는
일단 처음으로는 bodning box에서 가장 중앙점 cx,cy의 값과 box의 width, height를 구한다.
처음에는 이러한 값들을 가지고는 아래의 값들과 같이 ellipse의 equation으로 나타낼수 있다.
또한 이 bbox를 2d gaussian distribution의 형태로 modeling을 할 수 있다.