物体検出

YOLO object detection with bounding boxes

物体検出とは、画像や動画ストリーム内の物体の位置とクラスを特定するタスクです。

物体検出器の出力は、画像内の物体を囲むバウンディングボックスのセットであり、各ボックスのクラスラベルと信頼度スコアが含まれます。物体検出は、シーン内の対象物を特定する必要があるものの、その物体の正確な位置や形状までは必要としない場合に適した選択肢です。



Watch: Object Detection with Pretrained Ultralytics YOLO Model.
ヒント

YOLO26 DetectモデルはデフォルトのYOLO26モデル(yolo26n.ptなど)であり、COCOで事前学習されています。

モデル

YOLO26の事前学習済みDetectモデルをここに示します。Detect、Segment、PoseモデルはCOCOデータセットで事前学習されており、SemanticモデルはCityscapesで、ClassifyモデルはImageNetデータセットで事前学習されています。

モデルは、初回使用時に最新のUltralyticsリリースから自動的にダウンロードされます。

モデルサイズ
(ピクセル)
mAPval
50-95
mAPval
50-95(e2e)
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9
  • **mAPval**値は、COCO val2017データセットにおけるシングルモデル・シングルスケールの数値です。
    再現するには yolo val detect data=coco.yaml device=0 を実行してください。
  • 速度は、Amazon EC2 P4dインスタンスを使用してCOCO val画像で平均した値です。
    再現するには yolo val detect data=coco.yaml batch=1 device=0|cpu を実行してください。
  • パラメータ数およびFLOPs値は、Conv層とBatchNorm層を結合し、エンドツーエンドモデルの場合は補助的なone-to-many検出ヘッドを削除した後の、model.fuse()適用済みモデルに対するものです。事前学習済みチェックポイントは完全な学習用アーキテクチャを保持しているため、より大きい数値が表示される場合があります。

トレーニング (Train)

COCO8データセットでYOLO26nを画像サイズ640で100エポック学習させます。利用可能なすべての引数のリストについては、設定ページを参照してください。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.yaml")  # build a new model from YAML
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n.yaml").load("yolo26n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

trainモードの詳細については、Trainページを参照してください。検出モデルは、Ultralytics Platformを通じてクラウドGPU上で学習させることも可能です。

データセット形式

YOLO検出データセット形式の詳細については、データセットガイドを参照してください。既存のデータセットを他の形式(COCOなど)からYOLO形式に変換するには、UltralyticsのJSON2YOLOツールをご利用ください。また、AI支援アノテーションツールを備えたUltralytics Platform上で、検出データセットの管理とアノテーションを直接行うこともできます。

検証 (Val)

学習済みYOLO26nモデルの精度をCOCO8データセットで検証します。modelは学習時のdataや引数を属性として保持しているため、引数の指定は不要です。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val()  # no arguments needed, dataset and settings remembered
metrics.box.map  # map50-95
metrics.box.map50  # map50
metrics.box.map75  # map75
metrics.box.maps  # a list containing mAP50-95 for each category
metrics.box.image_metrics  # per-image metrics dictionary with precision, recall, F1, TP, FP, and FN

予測 (Predict)

学習済みYOLO26nモデルを使用して画像で予測を実行します。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg")  # predict on an image

# Access the results
for result in results:
    xywh = result.boxes.xywh  # center-x, center-y, width, height
    xywhn = result.boxes.xywhn  # normalized
    xyxy = result.boxes.xyxy  # top-left-x, top-left-y, bottom-right-x, bottom-right-y
    xyxyn = result.boxes.xyxyn  # normalized
    names = [result.names[cls.item()] for cls in result.boxes.cls.int()]  # class name of each box
    confs = result.boxes.conf  # confidence score of each box

predictモードの詳細については、Predictページを参照してください。

エクスポート (Export)

YOLO26nモデルをONNXやCoreMLなどの異なる形式にエクスポートします。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom-trained model

# Export the model
model.export(format="onnx")

利用可能なYOLO26エクスポート形式は以下の表の通りです。format引数(例: format='onnx'format='engine')を使用して任意の形式にエクスポートできます。エクスポートされたモデルに対して直接予測や検証を行うことも可能です(例: yolo predict model=yolo26n.onnx)。エクスポート完了後、モデルの使用例が表示されます。

形式format引数モデルメタデータ引数
PyTorch-yolo26n.pt-
TorchScripttorchscriptyolo26n.torchscriptimgsz, half, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n.onnximgsz, half, dynamic, simplify, opset, nms, batch, device
OpenVINOopenvinoyolo26n_openvino_model/imgsz, half, dynamic, int8, nms, batch, data, fraction, device
TensorRTengineyolo26n.engineimgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device
CoreMLcoremlyolo26n.mlpackageimgsz, dynamic, half, int8, nms, batch, device
TF SavedModelsaved_modelyolo26n_saved_model/imgsz, keras, int8, nms, batch, data, fraction, device
TF GraphDefpbyolo26n.pbimgsz, batch, device
TF Litetfliteyolo26n.tfliteimgsz, half, int8, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n_edgetpu.tfliteimgsz, int8, data, fraction, device
TF.jstfjsyolo26n_web_model/imgsz, half, int8, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n_paddle_model/imgsz, batch, device
MNNmnnyolo26n.mnnimgsz, batch, int8, half, device
NCNNncnnyolo26n_ncnn_model/imgsz, half, batch, device
IMX500imxyolo26n_imx_model/imgsz, int8, data, fraction, nms, device
RKNNrknnyolo26n_rknn_model/imgsz, batch, name, device
ExecuTorchexecutorchyolo26n_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n_axelera_model/imgsz, batch, int8, data, fraction, device
DeepXdeepxyolo26n_deepx_model/imgsz, int8, data, optimize, device

exportの詳細は、Exportページを参照してください。

FAQ

コーディングなしで検出モデルのトレーニングとデプロイはできますか?

はい。Ultralytics Platformでは、データセットのアノテーション、クラウドGPUでの検出モデルのトレーニング、および推論エンドポイントへのデプロイを行うためのブラウザベースのワークフローを提供しています。開始するには、Platform quickstartを参照してください。

カスタムデータセットでYOLO26モデルをトレーニングするにはどうすればよいですか?

カスタムデータセットでYOLO26モデルをトレーニングする手順は以下の通りです:

  1. データセットの準備: データセットがYOLO形式であることを確認してください。ガイダンスについては、Dataset Guideを参照してください。
  2. モデルの読み込み: Ultralytics YOLOライブラリを使用して、事前学習済みモデルを読み込むか、YAMLファイルから新しいモデルを作成します。
  3. モデルのトレーニング: Pythonでtrainメソッドを実行するか、CLIでyolo detect trainコマンドを実行します。
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
model.train(data="my_custom_dataset.yaml", epochs=100, imgsz=640)

詳細な設定オプションについては、Configurationページを参照してください。

YOLO26ではどのような事前学習済みモデルが利用可能ですか?

Ultralytics YOLO26は、object detectioninstance segmentationsemantic segmentation、およびpose estimation用のさまざまな事前学習済みモデルを提供しています。これらのモデルは、COCOデータセット、セマンティックセグメンテーション用のCityscapes、または分類タスク用のImageNetで事前学習されています。利用可能なモデルの一部を以下に示します:

詳細なリストとパフォーマンス指標については、Modelsセクションを参照してください。

トレーニング済みのYOLOモデルの精度を検証するにはどうすればよいですか?

トレーニング済みのYOLO26モデルの精度を検証するには、Pythonで.val()メソッドを使用するか、CLIでyolo detect valコマンドを使用します。これにより、mAP50-95やmAP50などの指標が得られます。

from ultralytics import YOLO

# Load the model
model = YOLO("path/to/best.pt")

# Validate the model
metrics = model.val()
print(metrics.box.map)  # mAP50-95

検証の詳細については、Valページを参照してください。

YOLO26モデルはどの形式にエクスポートできますか?

Ultralytics YOLO26では、異なるプラットフォームやデバイス間で互換性を確保するために、ONNXTensorRTCoreMLなどのさまざまな形式にモデルをエクスポートできます。

from ultralytics import YOLO

# Load the model
model = YOLO("yolo26n.pt")

# Export the model to ONNX format
model.export(format="onnx")

サポートされている形式の完全なリストと手順については、Exportページを確認してください。

オブジェクト検出にUltralytics YOLO26を使用すべき理由は何ですか?

Ultralytics YOLO26は、object detectioninstance segmentationsemantic segmentation、およびpose estimationにおいて最先端のパフォーマンスを提供するように設計されています。主な利点は以下の通りです:

  1. 事前学習済みモデル: COCOImageNetなどの一般的なデータセットで事前学習されたモデルを活用し、開発を迅速化します。
  2. 高精度: 優れたmAPスコアを達成し、信頼性の高いオブジェクト検出を保証します。
  3. 速度: real-time inference用に最適化されており、迅速な処理が必要なアプリケーションに最適です。
  4. 柔軟性: モデルをONNXやTensorRTなどのさまざまな形式にエクスポートして、複数のプラットフォームでデプロイできます。

YOLO26の活用事例や成功事例については、Blogをご覧ください。

コメント