Ultralytics YOLO よくある質問 (FAQ)

このFAQセクションでは、ユーザーが Ultralytics YOLO リポジトリを使用する際に遭遇する可能性のある一般的な質問や問題について解説します。

FAQ

Ultralytics とは何ですか。また何を提供していますか?

Ultralytics is a computer vision AI company specializing in state-of-the-art object detection and image segmentation models, with a focus on the YOLO (You Only Look Once) family. Their offerings include:

Ultralytics パッケージのインストール方法を教えてください。

Ultralytics パッケージのインストールは、pip を使用して簡単に行えます。

pip install ultralytics

最新の開発バージョンについては、GitHub リポジトリから直接インストールしてください。

pip install git+https://github.com/ultralytics/ultralytics.git

詳細なインストール手順は、クイックスタートガイド に記載されています。

Ultralytics モデルを実行するためのシステム要件は何ですか?

最小要件:

  • Python 3.8以上
  • PyTorch 1.8以上
  • CUDA 対応 GPU (GPU アクセラレーション用)

推奨セットアップ:

  • Python 3.8以上
  • PyTorch 1.10以上
  • CUDA 11.2以上を搭載した NVIDIA GPU
  • 8GB 以上の RAM
  • 50GB 以上のディスク空き容量 (データセット保存およびモデルトレーニング用)

一般的なトラブルシューティングについては、YOLO Common Issues ページをご覧ください。

独自のデータセットでカスタム YOLO モデルをトレーニングする方法を教えてください。

カスタム YOLO モデルをトレーニングするには:

  1. データセットを YOLO 形式 (画像と対応するラベル txt ファイル) で準備します。

  2. データセットの構造とクラスを記述した YAML ファイルを作成します (詳細は dataset YAML の例 を参照してください)。

  3. 以下の Python コードを使用してトレーニングを開始します。

    from ultralytics import YOLO
    
    # Load a model
    model = YOLO("yolo26n.yaml")  # build a new model from scratch
    model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)
    
    # Train the model
    results = model.train(data="path/to/your/data.yaml", epochs=100, imgsz=640)

データ準備や高度なトレーニングオプションを含む詳細なガイドについては、包括的な トレーニングガイド を参照してください。

Ultralytics で利用可能な学習済みモデルにはどのようなものがありますか?

Ultralytics は、様々なタスクに対応した多様な学習済みモデルを提供しています。

  • 物体検出: YOLO26n, YOLO26s, YOLO26m, YOLO26l, YOLO26x
  • インスタンスセグメンテーション: YOLO26n-seg, YOLO26s-seg, YOLO26m-seg, YOLO26l-seg, YOLO26x-seg
  • 分類: YOLO26n-cls, YOLO26s-cls, YOLO26m-cls, YOLO26l-cls, YOLO26x-cls
  • 姿勢推定: YOLO26n-pose, YOLO26s-pose, YOLO26m-pose, YOLO26l-pose, YOLO26x-pose
  • 指向性物体検出 (OBB): YOLO26n-obb, YOLO26s-obb, YOLO26m-obb, YOLO26l-obb, YOLO26x-obb

これらのモデルはサイズと複雑さが異なり、速度と 精度 の間で異なるトレードオフを提供します。プロジェクトに最適なモデルを見つけるには、学習済みモデル の全ラインナップをご確認ください。

学習済み Ultralytics モデルを使用して推論を行うにはどうすればよいですか?

学習済みモデルで推論を実行するには:

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/your/model.pt")

# Perform inference
results = model("path/to/image.jpg")

# Process results
for r in results:
    print(r.boxes)  # print bbox predictions
    print(r.masks)  # print mask predictions
    print(r.probs)  # print class probabilities

バッチ処理やビデオ推論を含む高度な推論オプションについては、詳細な 予測ガイド を確認してください。

Ultralytics モデルをエッジデバイスや本番環境にデプロイできますか?

もちろんです。Ultralytics モデルは、様々なプラットフォームでの多用途なデプロイを想定して設計されています。

  • エッジデバイス: TensorRT, ONNX, OpenVINO を使用して、NVIDIA Jetson や Intel Neural Compute Stick などのデバイス上で推論を最適化します。
  • モバイル: モデルを TFLite または CoreML に変換して、Android や iOS デバイスにデプロイします。
  • クラウド: TensorFlow Serving や PyTorch Serve などのフレームワークを活用して、スケーラブルなクラウドデプロイを実現します。
  • Web: ONNX.js や TensorFlow.js を使用して、ブラウザ内推論を実装します。

Ultralytics は、モデルをデプロイ用に様々な形式へ変換するエクスポート機能を提供しています。ユースケースに最適な解決策を見つけるには、幅広い デプロイオプション を探索してください。

YOLO11 と YOLO26 の違いは何ですか?

主な違いは以下の通りです。

  • エンドツーエンド NMS フリー推論: YOLO26 はネイティブでエンドツーエンドであり、非最大値抑制 (NMS) なしで直接予測を生成するため、レイテンシが短縮され、デプロイが簡素化されます。
  • DFL の削除: YOLO26 では Distribution Focal Loss モジュールが削除され、エクスポートの簡素化とエッジや低電力デバイスとの互換性向上が図られています。
  • MuSGD オプティマイザ: SGD と Muon (Moonshot AI の Kimi K2 に着想) のハイブリッドであり、より安定したトレーニングと高速な収束を実現します。
  • CPU パフォーマンス: YOLO26 は CPU 推論を最大 43% 高速化しており、GPU を搭載していないデバイスに最適です。
  • タスク固有の最適化: セマンティック損失とマルチスケール protos を用いたセグメンテーションの強化、高精度な姿勢推定のための RLE、角度損失を用いた OBB デコードの改善。
  • タスク: 両モデルとも、物体検出、インスタンスセグメンテーション、分類、姿勢推定、指向性物体検出 (OBB) を統一フレームワークでサポートしています。

機能とパフォーマンスメトリクスの詳細な比較については、YOLO26 ドキュメントページ をご覧ください。

Ultralytics オープンソースプロジェクトに貢献するにはどうすればよいですか?

Ultralytics への貢献は、プロジェクトを改善し自身のスキルを向上させる絶好の機会です。参加方法は以下の通りです。

  1. GitHub で Ultralytics リポジトリをフォークします。
  2. 機能追加またはバグ修正のために新しいブランチを作成します。
  3. 変更を加え、すべてのテストが通過することを確認します。
  4. 変更内容を明確に説明したプルリクエストを送信します。
  5. コードレビュープロセスに参加します。

バグ報告、機能の提案、ドキュメントの改善による貢献も歓迎です。詳細なガイドラインとベストプラクティスについては、コントリビューションガイド を参照してください。

Python で Ultralytics パッケージをインストールする方法を教えてください。

Python での Ultralytics パッケージのインストールは簡単です。ターミナルまたはコマンドプロンプトで以下の pip コマンドを実行してください。

pip install ultralytics

最先端の開発バージョンについては、GitHub リポジトリから直接インストールしてください。

pip install git+https://github.com/ultralytics/ultralytics.git

環境ごとのインストール手順やトラブルシューティングのヒントについては、包括的な クイックスタートガイド をご確認ください。

Ultralytics YOLO の主な機能は何ですか?

Ultralytics YOLO は、高度なコンピュータビジョンタスクのための豊富な機能を備えています。

  • リアルタイム検出: リアルタイムのシナリオにおいて効率的に物体を検出・分類します。
  • マルチタスク機能: 統一フレームワークにより、物体検出、インスタンスセグメンテーション、分類、姿勢推定を実行します。
  • 学習済みモデル: 様々なユースケースで速度と精度のバランスが取れた様々な 学習済みモデル にアクセスできます。
  • カスタムトレーニング: 柔軟な トレーニングパイプライン により、カスタムデータセットでモデルを簡単にファインチューニングできます。
  • 広範な デプロイオプション: モデルを TensorRT, ONNX, CoreML などの様々な形式にエクスポートして、異なるプラットフォームへデプロイできます。
  • 広範なドキュメント: コンピュータビジョンのワークフローを支援する包括的な ドキュメント とサポートコミュニティを活用できます。

YOLO モデルのパフォーマンスを向上させるにはどうすればよいですか?

YOLO モデルのパフォーマンスを向上させるには、以下の技術が有効です。

  1. ハイパーパラメータチューニング: ハイパーパラメータチューニングガイド を活用し、様々なハイパーパラメータを試すことでモデルのパフォーマンスを最適化します。
  2. データ拡張: 反転、拡大縮小、回転、色調整などの技術を実装してトレーニングデータセットを強化し、モデルの汎用性を向上させます。
  3. 転移学習: 学習済みモデルを活用し、トレーニングガイド を用いて特定のデータセットでファインチューニングを行います。
  4. 効率的な形式へのエクスポート: エクスポートガイド に従って、モデルを TensorRT や ONNX などの最適化された形式に変換し、推論を高速化します。
  5. ベンチマーク: ベンチマークモード を使用して、推論速度と精度を体系的に測定し改善します。

Ultralytics YOLO モデルをモバイルやエッジデバイスにデプロイできますか?

はい、Ultralytics YOLO モデルはモバイルやエッジデバイスを含む多様なデプロイを想定して設計されています。

  • モバイル: モデルを TFLite または CoreML に変換して、Android や iOS アプリへシームレスに統合できます。プラットフォームごとの手順については、TFLite 統合ガイド および CoreML 統合ガイド を参照してください。
  • エッジデバイス: TensorRT や ONNX を使用して、NVIDIA Jetson やその他のエッジハードウェア上で推論を最適化します。Edge TPU 統合ガイド では、エッジデプロイの詳細な手順を説明しています。

様々なプラットフォームにおけるデプロイ戦略の包括的な概要については、デプロイオプションガイド を参照してください。

学習済み Ultralytics YOLO モデルを使用して推論を行うにはどうすればよいですか?

学習済み Ultralytics YOLO モデルによる推論は簡単です。

  1. モデルの読み込み:

    from ultralytics import YOLO
    
    model = YOLO("path/to/your/model.pt")
  2. 推論の実行:

    results = model("path/to/image.jpg")
    
    for r in results:
        print(r.boxes)  # print bounding box predictions
        print(r.masks)  # print mask predictions
        print(r.probs)  # print class probabilities

バッチ処理、ビデオ推論、カスタム前処理を含む高度な推論技術については、詳細な 予測ガイド を参照してください。

Ultralytics を使用するための例やチュートリアルはどこで確認できますか?

Ultralytics は、開始からツールの習得までを支援する豊富なリソースを提供しています。

  • 📚 公式ドキュメント: 包括的なガイド、API リファレンス、およびベストプラクティス。
  • 💻 GitHub リポジトリ: ソースコード、サンプルスクリプト、およびコミュニティからの貢献。
  • ✍️ Ultralytics ブログ: 詳細な記事、ユースケース、および技術的な知見。
  • 💬 コミュニティフォーラム: 他のユーザーとの交流、質問、経験の共有。
  • 🎥 YouTube channel: Ultralyticsに関する様々なトピックについての動画チュートリアル、デモ、ウェビナー。

これらのリソースでは、Ultralyticsモデルを使用した様々なタスクのためのコード例、実際のユースケース、ステップバイステップガイドを提供しています。

さらにサポートが必要な場合は、Ultralyticsドキュメントを参照するか、GitHub Issuesまたは公式ディスカッションフォーラムを通じてコミュニティに連絡してください。

コメント