Related to: Deep Learning

FPN(Feature Pyramid Network)

Feature Pyramid Network(FPN)은 Object Detection에서 Semantic 정보를 고유한 비율로 추출할 수 있도록 하는 기술입니다.

Pyramid 구조를 통해 Low Level에서 High Level로 정보를 전달하며, Top-Down 방식과 Bottom-Up 방식을 사용합니다.

또한, Stage Mapping을 통해 ROI의 w와 h 값으로 Stage를 추정하여 각 Stage에서 Feature map을 추출합니다.

  • Low Level은 Semantic한 정보가 없기 때문에 Pyramid 구조를 사용하여 High Level에서 Low Level로 Semantic 정보를 전달
    • Low level = Early stage = bottome
    • High level = Late Stage = Top

Pipeline

  • Bottom-Up
    • image ~~ High Level까지 feature 전달됨, 일발적인 CNN Backbone 통과 과정을 의미
  • Top-Down
    • High Level ~~ Low Level까지 feature 전달
    • Feature Map의 Dimension이 맞지 않음
      • Top-Down Path : Up Convolution 진행(h,w 피팅)
      • 기존 level Path : 1x1 Convolution 진행(c 피팅)

Stage Mapping

Faster R-CNN 구조에 FPN을 적용하려면 Region Proposal을 어떤 scale의 feature map과 매칭시킬지 결정해야 합니다.

Fast R-CNN은 single-scale feature map만을 사용한 반면, FPN을 적용한 Faster R-CNN은 multi-scale feature map을 사용하기 때문입니다.

저자는 아래 공식을 사용하여 k번째 feature map과 매칭시킵니다.

참조

https://arxiv.org/abs/1612.03144
https://jonathan-hui.medium.com/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c

https://herbwood.tistory.com/18

Week 10