Axelera AIのエクスポートとデプロイ

UltralyticsはAxelera AIとパートナーシップを組み、Edge AIデバイスにおける高性能でエネルギー効率の高い推論を実現します。Voyager SDKを使用して、Ultralytics YOLOモデルMetis® AIPUに直接エクスポートおよびデプロイします。

YOLO向けAxelera AIエッジデプロイメントエコシステム

Axelera AI provides dedicated hardware acceleration for computer vision at the edge, using a proprietary dataflow architecture and in-memory computing to deliver up to 856 TOPS with low power consumption.

適切なハードウェアの選択

Axelera AIは、さまざまなデプロイ要件に適合する多様なフォームファクタを提供しています。以下のチャートは、お使いのUltralytics YOLOデプロイメントに最適なハードウェアを特定するのに役立ちます。

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

ハードウェアポートフォリオ

Axeleraのハードウェアラインナップは、Ultralytics YOLO26およびレガシーバージョンを、高いFPS/ワット効率で実行するように最適化されています。

アクセラレータカード

これらのカードは既存のホストデバイスでのAIアクセラレーションを可能にし、ブラウンフィールド展開を促進します。

製品フォームファクタ計算能力パフォーマンス (INT8)ターゲットアプリケーション
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPS高密度ビデオ解析、スマートシティ
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPS産業用PC、小売店向けキュー管理
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSドローン、ロボティクス、ポータブル医療機器
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPS高度な熱管理を必要とする環境

統合システム

ターンキーソリューション向けに、Axeleraはメーカーと提携し、Metis AIPU向けに事前検証済みのシステムを提供しています。

  • Metis Compute Board: Metis AIPUとRockchip RK3588 ARM CPUを組み合わせたスタンドアロン型エッジデバイス。
  • ワークステーション: Dell (Precision 3460XE) および Lenovo (ThinkStation P360 Ultra) のエンタープライズタワー。
  • 産業用PC: 製造自動化向けに設計されたAdvantechおよびAetinaの堅牢なシステム。

サポートされているタスク

以下のタスクはYOLOv8、YOLO11、およびYOLO26モデル全体でサポートされています。

タスクYOLOv8YOLO11YOLO26
物体検出
姿勢推定
セグメンテーション⚠️ Voyager SDKのみ
回転バウンディングボックス (OBB)
分類
注意

YOLO26 segmentation is not yet supported through the Ultralytics export command. Users who need YOLO26-seg can deploy via the Voyager SDK using deploy.py, which provides a user-space workaround. Native compiler support will be added in a future release.

インストール

プラットフォームの要件

Axelera形式へのエクスポートには以下が必要です。

  • オペレーティングシステム: Linuxのみ (Ubuntu 22.04/24.04を推奨)
  • ハードウェア: Axelera AIアクセラレータ (Metisデバイス)
  • Python: バージョン3.10、3.11、3.12
  • システム依存関係: sudo apt install libgl1 (OpenCVで必要。pip経由ではインストールされません)

Ultralyticsのインストール

pip install ultralytics

詳細な手順については、Ultralyticsインストールガイドを参照してください。問題が発生した場合は、一般的な問題ガイドをご確認ください。

Axeleraドライバーのインストール

  1. Axeleraリポジトリキーを追加します。

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
  2. aptにリポジトリを追加します。

    使用しているOSに合わせて、以下から適切なスニペットを選択してください。

    # Ubuntu 22.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    # Ubuntu 24.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list"
  3. SDKをインストールし、ドライバーを読み込みます。

    sudo apt update
    sudo apt install -y metis-dkms=1.4.16
    sudo modprobe metis
初回実行時にSDKが自動的にダウンロードされます

最初の yolo export format=axelera またはAxeleraモデルを使用した yolo predict を実行すると、Axelera SDKパッケージが自動的にダウンロードおよびインストールされます。接続速度によっては数分かかる場合があり、ダウンロード中に進捗状況は表示されません。事前に手動でインストールするには次を実行します。

pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple

YOLOモデルのAxeleraへのエクスポート

標準のUltralyticsエクスポートコマンドを使用して、学習済みYOLOモデルをエクスポートします。

Axelera形式へのエクスポート
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory
初回エクスポートは依存関係の更新後に失敗する可能性があります

Axeleraコンパイラは numpy<2 を必要とします。環境に numpy>=2 が存在する場合、最初の yolo export は自動的にダウングレードを行いますが、モジュールの状態が古いためエクスポートは失敗します。同じエクスポートコマンドをもう一度実行するだけで、2回目の試行で成功します。

エクスポート引数

引数タイプデフォルト説明
formatstr'axelera'Axelera Metis AIPUハードウェアのターゲット形式。
imgszint または tuple640モデル入力の画像サイズ。
batchint1エクスポートされたモデルのバッチ推論サイズ、または predict モードでモデルが同時に処理する画像の最大数を指定します。
int8boolTrueAIPU向けのINT8量子化を有効にします。
datastr'coco128.yaml'量子化キャリブレーション用のデータセット設定。
fractionfloat1.0キャリブレーションに使用するデータセットの割合(100~400枚を推奨)。
devicestrNoneエクスポートデバイス: GPU (device=0) または CPU (device=cpu)。

すべてのエクスポートオプションについては、エクスポートモードのドキュメントを参照してください。

出力構造

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

推論の実行

ONNXモデルの読み込みと同様に、Ultralytics APIでエクスポートされたモデルを読み込み、推論を実行します。

Axeleraモデルによる推論
from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

Axelera AIベンチマーク

Metis AIPUは、エネルギー消費を最小限に抑えながらスループットを最大化します。

モデルMetis PCIe FPS (1秒あたりのフレーム数)Metis M.2 FPS (1秒あたりのフレーム数)
YOLOv8n847771
YOLO11n746574
YOLO26n648.6484.9

ベンチマークはAxelera AIのデータに基づいています。実際のFPSは、モデルサイズ、バッチ処理、および入力解像度によって異なります。

実世界の応用例

Axeleraハードウェア上のUltralytics YOLOは、高度なエッジコンピューティングソリューションを実現します。

推奨されるワークフロー

  1. Ultralytics Trainモードを使用してモデルを学習
  2. model.export(format="axelera") を使用してAxelera形式にエクスポート
  3. yolo val を使用して精度を検証し、量子化による損失が最小限であることを確認
  4. 定性的検証のために yolo predict を使用して予測を実行
  5. Deploy to a high-performance end-to-end pipeline without PyTorch dependency — see the YOLO on Voyager SDK examples for composable Python pipelines using axelera-rt

デバイスヘルスチェック

Axeleraデバイスが正常に動作しているか確認してください:

# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice

詳細な診断については、AxDevice documentationをご覧ください。

最大パフォーマンス

この統合では互換性のためにシングルコア構成を使用しています。最大スループットを必要とする本番環境向けに、Axelera Voyager SDKでは以下が提供されています。

  • マルチコア活用(クアッドコアMetis AIPU)
  • ストリーミング推論パイプライン
  • 高解像度カメラ用のタイル状推論

FPSベンチマークについてはmodel-zooを参照するか、本番環境のサポートについてはAxeleraまでお問い合わせください。

既知の問題

既知の制限事項
  • M.2電力制限: 大規模または超大規模モデルでは、電源の制約によりM.2アクセラレータ上で実行時エラーが発生する可能性があります。

サポートについては、Axelera Communityをご覧ください。

FAQ

AxeleraではどのYOLOバージョンがサポートされていますか?

Voyager SDKは、YOLOv8YOLO11、およびYOLO26モデルのエクスポートをサポートしています。モデルごとのタスクの利用可能性については、Supported Tasksを参照してください。

カスタム学習済みモデルをデプロイできますか?

はい。Ultralytics Train Modeを使用して学習されたモデルであれば、サポートされているレイヤーと演算を使用している限り、Axelera形式にエクスポートできます。

INT8量子化は精度にどのような影響を与えますか?

AxeleraのVoyager SDKは、混合精度AIPUアーキテクチャ向けにモデルを自動的に量子化します。ほとんどのobject detectionタスクにおいて、パフォーマンスの向上(FPSの向上、消費電力の削減)は、mAPへの最小限の影響を大幅に上回ります。量子化には、モデルのサイズに応じて数秒から数時間かかります。精度を確認するには、エクスポート後にyolo valを実行してください。

何枚のキャリブレーション画像を使用すべきですか?

100枚から400枚の使用を推奨します。400枚を超えてもメリットはなく、量子化時間が増加するだけです。最適なバランスを見つけるために、100枚、200枚、400枚で試してください。

Voyager SDKはどこで入手できますか?

SDK、ドライバー、およびコンパイラツールは、Axelera Developer Portalから入手できます。

コメント