YOLO5Face : なぜ顔検出器を再発明するのか? (YOLOv5, ShuffleNetv2 ベースの検出器)

論文まとめ

今回は、"YOLO5Face: Why Reinventing a Face Detector "という論文について紹介していきます!

YOLO5Face: Why Reinventing a Face Detector
Tremendous progress has been made on face detection in recent years using convolutional neural networks. While many face detectors use designs designated for de...

論文情報

著者 : Delong QiWeijun TanQi YaoJingfeng Liu
(Submitted on 27 May 2021)

スポンサーリンク

ひとこと紹介

YOLOv5, ShuffleNetv2をベースとした顔検出器 YOLOv5Faceを提案!!

スポンサーリンク

イントロダクション

顔検出 (Face Detection)について

 Computer Vision のタスクの一つとして重要なものとしてあげられるのが、今回紹介する顔検出についてです。近年Deep Learingの導入により、ブレイクスルーが起きている分野の一つであり、顔認識やトレーシング、表情分析などの基礎部分となります。
 物体検出の手法として、SSDやYOLO等があげられますが、その中のYOLOv5を元にした検出器についてこの記事では紹介していきます!!

Approach

 この論文でのアプローチとして、顔検出を一般的な物体検出タスクとして扱っている。
TinaFace (https://arxiv.org/abs/2011.13183) でもあげられている通り、顔検出はPoseや Scale , Occlusion, illumination, Blur などの一般的な物体検出でも持ちうる特徴を持っているので、物体検出タスクの一つとして考えられる。
 また、顔検出の課題である「マルチスケール」「小さな顔画像」「密集した場面」なども、一般的な物体検出には存在しているので、顔検出は一般物体検出のサブタスクといえる。

YOLOv5Face

 この論文では、顔検出を一般的な物体検出のサブタスクと考えた上で、YOlOv5をベースにした顔検出器を設計している。また、大きな顔画像、小さな顔画像、landmark supervision を考慮して顔検出の設計を変更。
 目標としては、さまざまなアプリケーションに対応したモデルのポートフォリオを提供することであり、最高のパフォーマンスを得るための非常に複雑なものから、組み込みやモバイル機器におけるパフォーマンスとスピードの最適なトレードオフを得るための非常にシンプルなものまで、様々なモデルを提供することである。

Contributions

この論文での主なContributions は 以下の通り

  • YOLOv5を顔検出器として再設計し、YOLO5Faceと名付けた。
    mean average precision (mAP)と速度の点で性能を向上させるために、Networkを変更(改良の詳細については,セクションIII)
  • 用途に合わせてモデルサイズを変えて3種類設計 (大型モデル、中型モデル、超小型モデル)
    また、YOLOv5で使用されているバックボーンに加えて、ShuffleNetV2をベースにしたバックボーンを実装。(ShuffleNetv2は、モバイル機器向けに最先端(SOTA)の性能と高速性を提供する)
  • モデルをWiderFace データセットで評価
    VGA解像度の画像において、ほぼ全てのモデルがSOTA性能と高速性を達成。
    これは、この論文のタイトルにもあるように、YOLO5Faceが顔検出器を再発明する必要がないことを証明している。
スポンサーリンク

この論文の構成

  1. Introduction
  2. 背景・関連研究
  3. YOLO5Face 顔検出
  4. Experiments
  5. 結論

コメント

タイトルとURLをコピーしました