Axelera AIのエクスポートとデプロイ
実験的リリース
これは、Axelera Metisハードウェアへのデプロイメントを示す実験的な統合です。完全な統合は2026年2月までに予定されており、Axeleraハードウェアを必要としないモデルエクスポートと標準的なpipインストールが可能になります。
UltralyticsはAxelera AIと提携し、Edge AIデバイス上で高性能かつエネルギー効率の高い推論を可能にします。Voyager SDKを使用して、Ultralytics YOLOモデルをMetis® AIPUに直接エクスポートおよびデプロイしてください。
Axelera AIは、独自のデータフローアーキテクチャとインメモリコンピューティングを使用し、低消費電力で最大856 TOPSを達成することで、エッジでのコンピュータービジョン向けに専用のハードウェアアクセラレーションを提供します。
適切なハードウェアの選択
Axelera AIは、さまざまなデプロイメントの制約に対応するために様々なフォームファクタを提供しています。下のチャートは、Ultralytics YOLOデプロイメントに最適なハードウェアを特定するのに役立ちます。
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
ハードウェアポートフォリオ
Axeleraのハードウェアラインアップは、高いFPS/ワット効率でUltralytics YOLO26およびレガシーバージョンを実行するために最適化されています。
アクセラレータカード
これらのカードは、既存のホストデバイスでAIアクセラレーションを可能にし、ブラウンフィールドデプロイメントを促進します。
| 製品 | フォームファクタ | コンピュート | 性能 (INT8) | 対象アプリケーション |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4倍の Metis AIPU | 856 TOPS | 高密度映像解析、スマートシティ |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | 産業用PC、小売店における行列管理 |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones、ロボット工学、ポータブル医療機器 |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | 高度な熱管理を必要とする環境 |
統合システム
ターンキーソリューション向けに、Axeleraはメーカーと提携し、Metis AIPU向けに事前検証済みのシステムを提供しています。
- Metis Compute Board:Metis AIPUとRockchip RK3588 ARM CPUを組み合わせたスタンドアロンのエッジデバイスです。
- ワークステーション:Dell (Precision 3460XE) および Lenovo (ThinkStation P360 Ultra) 製のエンタープライズ向けタワー型PC。
- 産業用PC:Advantech および Aetina 製の、製造自動化向けに設計された堅牢なシステム。
サポートされているタスク
現在、オブジェクト detect モデルはAxelera形式にエクスポートできます。追加のタスクが統合されています。
| タスク | ステータス |
|---|---|
| 物体検出 | ✅ サポート済み |
| 姿勢推定 | 近日公開 |
| セグメンテーション | 近日公開 |
| 傾斜バウンディングボックス | 近日公開 |
インストール
プラットフォーム要件
Axelera形式へのエクスポートには以下が必要です。
- オペレーティングシステム: Linuxのみ (Ubuntu 22.04/24.04を推奨)
- ハードウェア: Axelera AIアクセラレーター (Metisデバイス)
- Python: バージョン 3.10 (3.11および3.12は近日公開)
Ultralytics インストール
pip install ultralytics
詳細な手順については、弊社のUltralyticsインストールガイドを参照してください。問題が発生した場合は、弊社の一般的な問題ガイドを参照してください。
Axeleraドライバーのインストール
Axeleraリポジトリキーを追加します。
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"aptにリポジトリを追加します。
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"SDKをインストールし、ドライバーをロードします。
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
YOLOモデルのAxeleraへのエクスポート
標準のUltralyticsエクスポートコマンドを使用して、訓練済みのYOLOモデルをエクスポートします。
Axeleraフォーマットへのエクスポート
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera
エクスポート引数
| 引数 | 種類 | デフォルト | 説明 |
|---|---|---|---|
format | str | 'axelera' | Axelera Metis AIPUハードウェア向けのターゲット形式 |
imgsz | int または tuple | 640 | モデル入力用の画像サイズ |
int8 | bool | True | AIPU向けにINT8量子化を有効にします |
data | str | 'coco128.yaml' | 量子化キャリブレーション用のデータセット設定 |
fraction | float | 1.0 | キャリブレーション用のデータセットの割合 (100~400画像を推奨) |
device | str | None | エクスポートデバイス: GPU (device=0) または CPU (device=cpu) |
すべてのエクスポートオプションについては、エクスポートモードのドキュメントを参照してください。
出力構造
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
推論の実行
Ultralytics APIでエクスポートされたモデルをロードし、ONNXモデルのロードと同様に推論を実行します。
Axeleraモデルによる推論
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
既知の問題
最初の推論実行で ImportErrorが発生する場合があります。それ以降の実行は正しく動作します。これは将来のリリースで対処されます。
推論パフォーマンス
Metis AIPUは、エネルギー消費を最小限に抑えながらスループットを最大化します。
| メトリック | Metis PCIe x4 | Metis M.2 | 注 |
|---|---|---|---|
| ピークスループット | 856 TOPS | 214 TOPS | INT8精度 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640入力 |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640入力 |
| 効率 | 高 | 非常に高い | バッテリー駆動に最適 |
ベンチマークはAxelera AIのデータに基づいています。実際のFPSは、モデルサイズ、バッチ処理、入力解像度によって異なります。
現実世界のアプリケーション
Axeleraハードウェア上のUltralytics YOLOは、高度なエッジコンピューティングソリューションを可能にします。
- スマートリテール: 店舗最適化のためのリアルタイム物体計数およびヒートマップ分析。
- 産業安全: 製造環境における低遅延PPE detect。
- ドローン分析: 農業および捜索救助のためのUAV上での高速物体検出。
- 交通システム: エッジベースのナンバープレート認識および速度推定。
推奨ワークフロー
- UltralyticsのTrain Modeを使用してモデルをトレーニングします。
- エクスポート を使用してAxelera形式に
model.export(format="axelera") - 検証 で精度を
yolo val量子化損失が最小限であることを確認するために - 予測 使用
yolo predict定性的な検証のために
デバイスヘルスチェック
Axeleraデバイスが正常に機能していることを確認してください。
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
詳細な診断については、AxDeviceドキュメントを参照してください。
最大性能
この統合は互換性のためにシングルコア構成を使用します。最大スループットを必要とする本番環境では、Axelera Voyager SDKが以下を提供します。
- マルチコア利用(クアッドコアMetis AIPU)
- ストリーミング推論パイプライン
- 高解像度カメラ向けタイル推論
FPSベンチマークについてはmodel-zooを、本番環境のサポートについてはAxeleraにお問い合わせください。
既知の問題
既知の制限事項
PyTorch 2.9の互換性: 最初の
yolo export format=axeleraコマンドは、PyTorchが自動的に2.8にダウングレードされるため失敗する可能性があります。2回目を実行すると成功します。M.2電源の制限: 大規模または超大規模モデルは、電源供給の制約によりM.2アクセラレータでランタイムエラーが発生する可能性があります。
最初の推論でのImportError: 最初の推論実行で
ImportErrorが発生する場合があります。それ以降の実行は正しく動作します。
サポートについては、Axeleraコミュニティをご覧ください。
よくある質問
AxeleraではどのYOLOバージョンがサポートされていますか?
Voyager SDKはYOLOv8およびYOLO26モデルのエクスポートをサポートしています。
カスタムトレーニングしたモデルをデプロイできますか?
はい。Ultralytics Train Modeを使用してトレーニングされたモデルは、サポートされているレイヤーと操作を使用している限り、Axelera形式にエクスポートできます。
INT8量子化は精度にどのように影響しますか?
AxeleraのVoyager SDKは、混合精度AIPUアーキテクチャ向けにモデルを自動的に量子化します。ほとんどの 物体検出 タスクにおいて、パフォーマンスの向上(高FPS、低消費電力)は、最小限の影響をはるかに上回ります。 mAP量子化は、モデルのサイズに応じて数秒から数時間かかります。エクスポート後に実行して精度を確認してください。 yolo val エクスポート後に実行して精度を確認してください。
キャリブレーション画像はいくつ使用すべきですか?
100から400枚の画像を推奨します。400枚を超えると、追加の利点はなく、量子化時間が増加します。100、200、400枚の画像で実験し、最適なバランスを見つけてください。
Voyager SDKはどこで入手できますか?
SDK、ドライバー、およびコンパイラツールは、Axelera Developer Portalを通じて入手可能です。