Axelera AIのエクスポートとデプロイ
UltralyticsはAxelera AIとパートナーシップを組み、Edge AIデバイスにおける高性能でエネルギー効率の高い推論を実現します。Voyager SDKを使用して、Ultralytics YOLOモデルをMetis® AIPUに直接エクスポートおよびデプロイします。
Axelera AI provides dedicated hardware acceleration for computer vision at the edge, using a proprietary dataflow architecture and in-memory computing to deliver up to 856 TOPS with low power consumption.
適切なハードウェアの選択
Axelera AIは、さまざまなデプロイ要件に適合する多様なフォームファクタを提供しています。以下のチャートは、お使いのUltralytics YOLOデプロイメントに最適なハードウェアを特定するのに役立ちます。
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"ハードウェアポートフォリオ
Axeleraのハードウェアラインナップは、Ultralytics YOLO26およびレガシーバージョンを、高いFPS/ワット効率で実行するように最適化されています。
アクセラレータカード
これらのカードは既存のホストデバイスでのAIアクセラレーションを可能にし、ブラウンフィールド展開を促進します。
| 製品 | フォームファクタ | 計算能力 | パフォーマンス (INT8) | ターゲットアプリケーション |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | 高密度ビデオ解析、スマートシティ |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | 産業用PC、小売店向けキュー管理 |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | ドローン、ロボティクス、ポータブル医療機器 |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | 高度な熱管理を必要とする環境 |
統合システム
ターンキーソリューション向けに、Axeleraはメーカーと提携し、Metis AIPU向けに事前検証済みのシステムを提供しています。
- Metis Compute Board: Metis AIPUとRockchip RK3588 ARM CPUを組み合わせたスタンドアロン型エッジデバイス。
- ワークステーション: Dell (Precision 3460XE) および Lenovo (ThinkStation P360 Ultra) のエンタープライズタワー。
- 産業用PC: 製造自動化向けに設計されたAdvantechおよびAetinaの堅牢なシステム。
サポートされているタスク
以下のタスクはYOLOv8、YOLO11、およびYOLO26モデル全体でサポートされています。
| タスク | YOLOv8 | YOLO11 | YOLO26 |
|---|---|---|---|
| 物体検出 | ✅ | ✅ | ✅ |
| 姿勢推定 | ✅ | ✅ | ✅ |
| セグメンテーション | ✅ | ✅ | ⚠️ Voyager SDKのみ |
| 回転バウンディングボックス (OBB) | ✅ | ✅ | ✅ |
| 分類 | ✅ | ✅ | ✅ |
YOLO26 segmentation is not yet supported through the Ultralytics export command. Users who need YOLO26-seg can deploy via the Voyager SDK using deploy.py, which provides a user-space workaround. Native compiler support will be added in a future release.
インストール
Axelera形式へのエクスポートには以下が必要です。
- オペレーティングシステム: Linuxのみ (Ubuntu 22.04/24.04を推奨)
- ハードウェア: Axelera AIアクセラレータ (Metisデバイス)
- Python: バージョン3.10、3.11、3.12
- システム依存関係:
sudo apt install libgl1(OpenCVで必要。pip経由ではインストールされません)
Ultralyticsのインストール
pip install ultralytics詳細な手順については、Ultralyticsインストールガイドを参照してください。問題が発生した場合は、一般的な問題ガイドをご確認ください。
Axeleraドライバーのインストール
-
Axeleraリポジトリキーを追加します。
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg" -
aptにリポジトリを追加します。
使用しているOSに合わせて、以下から適切なスニペットを選択してください。
# Ubuntu 22.04 sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"# Ubuntu 24.04 sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list" -
SDKをインストールし、ドライバーを読み込みます。
sudo apt update sudo apt install -y metis-dkms=1.4.16 sudo modprobe metis
最初の yolo export format=axelera またはAxeleraモデルを使用した yolo predict を実行すると、Axelera SDKパッケージが自動的にダウンロードおよびインストールされます。接続速度によっては数分かかる場合があり、ダウンロード中に進捗状況は表示されません。事前に手動でインストールするには次を実行します。
pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simpleYOLOモデルのAxeleraへのエクスポート
標準のUltralyticsエクスポートコマンドを使用して、学習済みYOLOモデルをエクスポートします。
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model' directoryAxeleraコンパイラは numpy<2 を必要とします。環境に numpy>=2 が存在する場合、最初の yolo export は自動的にダウングレードを行いますが、モジュールの状態が古いためエクスポートは失敗します。同じエクスポートコマンドをもう一度実行するだけで、2回目の試行で成功します。
エクスポート引数
| 引数 | タイプ | デフォルト | 説明 |
|---|---|---|---|
format | str | 'axelera' | Axelera Metis AIPUハードウェアのターゲット形式。 |
imgsz | int または tuple | 640 | モデル入力の画像サイズ。 |
batch | int | 1 | エクスポートされたモデルのバッチ推論サイズ、または predict モードでモデルが同時に処理する画像の最大数を指定します。 |
int8 | bool | True | AIPU向けのINT8量子化を有効にします。 |
data | str | 'coco128.yaml' | 量子化キャリブレーション用のデータセット設定。 |
fraction | float | 1.0 | キャリブレーションに使用するデータセットの割合(100~400枚を推奨)。 |
device | str | None | エクスポートデバイス: GPU (device=0) または CPU (device=cpu)。 |
すべてのエクスポートオプションについては、エクスポートモードのドキュメントを参照してください。
出力構造
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)推論の実行
ONNXモデルの読み込みと同様に、Ultralytics APIでエクスポートされたモデルを読み込み、推論を実行します。
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display resultsAxelera AIベンチマーク
Metis AIPUは、エネルギー消費を最小限に抑えながらスループットを最大化します。
| モデル | Metis PCIe FPS (1秒あたりのフレーム数) | Metis M.2 FPS (1秒あたりのフレーム数) |
|---|---|---|
| YOLOv8n | 847 | 771 |
| YOLO11n | 746 | 574 |
| YOLO26n | 648.6 | 484.9 |
ベンチマークはAxelera AIのデータに基づいています。実際のFPSは、モデルサイズ、バッチ処理、および入力解像度によって異なります。
実世界の応用例
Axeleraハードウェア上のUltralytics YOLOは、高度なエッジコンピューティングソリューションを実現します。
- スマートリテール: 店舗最適化のためのリアルタイム物体カウントおよびヒートマップ解析。
- 産業安全: 製造環境における低遅延のPPE検出。
- Drone Analytics: High-speed object detection on UAVs for agriculture and search-and-rescue.
- Traffic Systems: Edge-based license plate recognition and speed estimation.
推奨されるワークフロー
- Ultralytics Trainモードを使用してモデルを学習
model.export(format="axelera")を使用してAxelera形式にエクスポートyolo valを使用して精度を検証し、量子化による損失が最小限であることを確認- 定性的検証のために
yolo predictを使用して予測を実行 - Deploy to a high-performance end-to-end pipeline without PyTorch dependency — see the YOLO on Voyager SDK examples for composable Python pipelines using
axelera-rt
デバイスヘルスチェック
Axeleraデバイスが正常に動作しているか確認してください:
# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice詳細な診断については、AxDevice documentationをご覧ください。
最大パフォーマンス
この統合では互換性のためにシングルコア構成を使用しています。最大スループットを必要とする本番環境向けに、Axelera Voyager SDKでは以下が提供されています。
- マルチコア活用(クアッドコアMetis AIPU)
- ストリーミング推論パイプライン
- 高解像度カメラ用のタイル状推論
FPSベンチマークについてはmodel-zooを参照するか、本番環境のサポートについてはAxeleraまでお問い合わせください。
既知の問題
- M.2電力制限: 大規模または超大規模モデルでは、電源の制約によりM.2アクセラレータ上で実行時エラーが発生する可能性があります。
サポートについては、Axelera Communityをご覧ください。
FAQ
AxeleraではどのYOLOバージョンがサポートされていますか?
Voyager SDKは、YOLOv8、YOLO11、およびYOLO26モデルのエクスポートをサポートしています。モデルごとのタスクの利用可能性については、Supported Tasksを参照してください。
カスタム学習済みモデルをデプロイできますか?
はい。Ultralytics Train Modeを使用して学習されたモデルであれば、サポートされているレイヤーと演算を使用している限り、Axelera形式にエクスポートできます。
INT8量子化は精度にどのような影響を与えますか?
AxeleraのVoyager SDKは、混合精度AIPUアーキテクチャ向けにモデルを自動的に量子化します。ほとんどのobject detectionタスクにおいて、パフォーマンスの向上(FPSの向上、消費電力の削減)は、mAPへの最小限の影響を大幅に上回ります。量子化には、モデルのサイズに応じて数秒から数時間かかります。精度を確認するには、エクスポート後にyolo valを実行してください。
何枚のキャリブレーション画像を使用すべきですか?
100枚から400枚の使用を推奨します。400枚を超えてもメリットはなく、量子化時間が増加するだけです。最適なバランスを見つけるために、100枚、200枚、400枚で試してください。
Voyager SDKはどこで入手できますか?
SDK、ドライバー、およびコンパイラツールは、Axelera Developer Portalから入手できます。