コンテンツへスキップ

YOLOv4:高速で正確な物体検出

YOLOv4 のUltralytics ドキュメントページへようこそ。YOLOv4 は、Alexey Bochkovskiy がhttps://github.com/AlexeyAB/darknet で 2020 年に発表した最先端のリアルタイム物体検出器です。YOLOv4は、速度と精度の最適なバランスを提供するように設計されており、多くのアプリケーションに最適です。

YOLOv4アーキテクチャ図 YOLOv4アーキテクチャ図.YOLOv4の複雑なネットワーク設計を紹介。バックボーン、ネック、ヘッドの各コンポーネントと、最適なリアルタイム物体検出のための相互接続レイヤーを含む。

はじめに

YOLOv4 stands for You Only Look Once version 4. It is a real-time object detection model developed to address the limitations of previous YOLO versions like YOLOv3 and other object detection models. Unlike other convolutional neural network (CNN) based object detectors, YOLOv4 is not only applicable for recommendation systems but also for standalone process management and human input reduction. Its operation on conventional graphics processing units (GPUs) allows for mass usage at an affordable price, and it is designed to work in real-time on a conventional GPU while requiring only one such GPU for training.

建築

YOLOv4 makes use of several innovative features that work together to optimize its performance. These include Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT), Mish-activation, Mosaic data augmentation, DropBlock regularization, and CIoU loss. These features are combined to achieve state-of-the-art results.

典型的な物体検出器は、入力、バックボーン、ネック、ヘッドを含むいくつかの部分から構成される。YOLOv4のバックボーンは、ImageNetで事前に訓練され、オブジェクトのクラスとバウンディングボックスを予測するために使用されます。バックボーンには、VGG、ResNet、ResNeXt、DenseNetなどのモデルを使用することができます。検出器の首の部分は、異なるステージから特徴マップを収集するために使用され、通常、いくつかのボトムアップ・パスといくつかのトップダウン・パスを含みます。ヘッド部分は、最終的なオブジェクトの検出と分類に使用されます。

福袋

YOLOv4はまた、"bag of freebies "として知られる手法も利用している。これは、推論コストを増加させることなく、学習中のモデルの精度を向上させる手法である。データ補強は、物体検出でよく使われるBag of Freebiesの手法で、入力画像のばらつきを増やしてモデルのロバスト性を向上させる。データ補強の例としては、測光歪み(画像の明るさ、コントラスト、色相、彩度、ノイズを調整する)や幾何学的歪み(ランダムな拡大縮小、切り取り、反転、回転を加える)などがある。これらのテクニックは、モデルが異なるタイプの画像に対してより良く一般化するのに役立ちます。

機能と性能

YOLOv4は、物体検出の速度と精度を最適化するように設計されている。YOLOv4のアーキテクチャには、バックボーンとしてCSPDarknet53、ネックとしてPANet、そして検出ヘッドとしてYOLOv3が含まれている。この設計により、YOLOv4は驚異的なスピードで物体検出を行うことができ、リアルタイム・アプリケーションに適している。YOLOv4は精度にも優れており、物体検出ベンチマークで最先端の結果を達成している。

使用例

本稿執筆時点では、Ultralytics 、現在YOLOv4モデルをサポートしていない。そのため、YOLOv4の使用に興味があるユーザーは、インストールと使用方法について、YOLOv4のGitHubリポジトリを直接参照する必要がある。

YOLOv4を使用するための典型的なステップを簡単に説明します:

  1. YOLOv4のGitHubリポジトリhttps://github.com/AlexeyAB/darknet。

  2. READMEファイルに記載されている指示に従ってインストールしてください。これには通常、リポジトリのクローン、必要な依存関係のインストール、必要な環境変数の設定が含まれます。

  3. インストールが完了したら、リポジトリで提供されている使用方法に従ってモデルをトレーニングし、使用することができます。これは通常、データセットの準備、モデルパラメータの設定、モデルの学習、学習済みモデルを使った物体検出を含みます。

具体的な手順は、特定のユースケースやYOLOv4リポジトリの現在の状態によって異なる可能性があることに注意してください。そのため、YOLOv4のGitHubリポジトリで提供されている手順を直接参照することを強くお勧めします。

ご迷惑をおかけして申し訳ありません。YOLOv4のサポートが実装されましたら、Ultralytics 、このドキュメントに使用例を更新するよう努めます。

結論

YOLOv4は、スピードと精度のバランスを取ったパワフルで効率的な物体検出モデルです。YOLOv4は、トレーニング中に独自の機能とバッグ・オブ・フリーダム技術を使用することで、リアルタイムの物体検出タスクで優れた性能を発揮します。YOLOv4は、従来のGPU 、誰でもトレーニングして使用することができ、幅広い用途に利用可能で実用的です。

引用と謝辞

リアルタイム物体検出の分野におけるYOLOv4作者の多大な貢献に感謝したい:

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

オリジナルのYOLOv4論文はarXivに掲載されている。著者らは彼らの研究を公開し、コードベースはGitHubでアクセスできる。我々は、この分野を発展させ、より広いコミュニティーが彼らの研究にアクセスできるようにした彼らの努力に感謝している。

よくあるご質問

What is YOLOv4 and why should I use it for object detection?

YOLOv4, which stands for "You Only Look Once version 4," is a state-of-the-art real-time object detection model developed by Alexey Bochkovskiy in 2020. It achieves an optimal balance between speed and accuracy, making it highly suitable for real-time applications. YOLOv4's architecture incorporates several innovative features like Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), and Self-adversarial-training (SAT), among others, to achieve state-of-the-art results. If you're looking for a high-performance model that operates efficiently on conventional GPUs, YOLOv4 is an excellent choice.

YOLOv4のアーキテクチャーはどのように性能を高めているのですか?

YOLOv4のアーキテクチャには、バックボーン、ネック、ヘッドといういくつかの重要なコンポーネントがある。バックボーンは、VGG、ResNet、CSPDarknet53のようなモデルで、クラスとバウンディングボックスを予測するために事前に訓練されている。首はPANetを利用し、異なるステージからの特徴マップを接続し、包括的なデータ抽出を行う。最後に、YOLOv3の設定を使用する頭部が、最終的なオブジェクトの検出を行う。YOLOv4はまた、モザイクデータの補強やDropBlock正則化のような "bag of freebies "技術を採用し、速度と精度をさらに最適化している。

YOLOv4でいうところの "オマケ袋 "とは?

「Bag of freebies」とは、推論コストを増加させることなくYOLOv4の学習精度を向上させる手法のことである。これらの手法には、写真的歪み(明るさ、コントラストなどの調整)や幾何学的歪み(スケーリング、トリミング、反転、回転)などの様々な形式のデータ補強が含まれる。入力画像の可変性を高めることで、これらの補強はYOLOv4が異なるタイプの画像に対してより良く汎化するのを助け、リアルタイム性能を損なうことなく、ロバスト性と精度を向上させます。

なぜYOLOv4が従来のGPUでのリアルタイム物体検出に適していると考えられているのか?

YOLOv4 is designed to optimize both speed and accuracy, making it ideal for real-time object detection tasks that require quick and reliable performance. It operates efficiently on conventional GPUs, needing only one for both training and inference. This makes it accessible and practical for various applications ranging from recommendation systems to standalone process management, thereby reducing the need for extensive hardware setups and making it a cost-effective solution for real-time object detection.

Ultralytics 、現在YOLOv4がサポートされていない場合、どうすれば使い始めることができますか?

YOLOv4を使い始めるには、YOLOv4の公式GitHubリポジトリにアクセスする必要がある。READMEファイルに記載されているインストール手順に従い、リポジトリのクローン、依存関係のインストール、環境変数の設定を行う。インストールが完了したら、データセットを準備し、モデル・パラメーターを設定し、提供されている使用方法に従ってモデルをトレーニングすることができる。現在、Ultralytics はYOLOv4をサポートしていないため、最新の詳細なガイダンスについては、YOLOv4のGitHubを直接参照することを推奨する。

📅 Created 11 months ago ✏️ Updated 28 days ago

コメント