アクセレラAIのエクスポートとデプロイメント
実験的リリース
これはAxelera Metisハードウェア上でのデプロイメントを示す実験的統合です。2026年2月までに完全な統合が予定されており、Axeleraハードウェアを必要とせず、標準的なpipインストールでモデルエクスポートが可能となります。
Ultralytics Axelera AIとUltralytics 、エッジAIデバイスにおける高性能かつ省電力な推論を実現します。Voyager SDKを使用して、Ultralytics YOLO Metis® AIPUに直接エクスポートおよびデプロイできます。
アクセレラAIは、独自のデータフローアーキテクチャとインメモリコンピューティングを活用し、エッジ環境におけるコンピュータビジョン向けに専用ハードウェアアクセラレーションを提供。低消費電力で最大856 TOPSを実現します。
正しいハードウェアの選択
アクセラAIは、さまざまな導入制約に対応するため、さまざまなフォームファクターを提供しています。以下のチャートは、Ultralytics YOLO 展開に最適なハードウェアを特定するのに役立ちます。
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
ハードウェア・ポートフォリオ
アクセラハードウェアのラインナップは、以下の動作に最適化されています。 Ultralytics YOLO11およびレガシーバージョンをワットあたり高い FPS 効率で実行できるように最適化されています。
アクセラレーターカード
これらのカードは、既存のホスト・デバイスでのAIアクセラレーションを可能にし、ブラウンフィールドでの展開を容易にする。
| 製品 | フォームファクター | 計算する | パフォーマンス(INT8) | ターゲット・アプリケーション |
|---|---|---|---|---|
| メティス PCIe x4 | PCIe Gen3 x16 | 4倍の Metis AIPU | 856 トップス | 高密度ビデオ分析、スマートシティ |
| メティス PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | 産業用PC、小売店の待ち行列管理 |
| メティスM.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones、ロボット工学、ポータブル医療機器 |
| メティスM.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | 高度な熱管理が必要な環境 |
統合システム
ターンキーソリューションについては、アクセレラはメーカーと提携し、Metis AIPU用に事前に検証されたシステムを提供している。
- Metisコンピュートボード:Metis AIPUとRockchip RK3588 ARMCPU組み合わせたスタンドアローンのエッジデバイス。
- ワークステーション:デル(Precision 3460XE)とレノボ(ThinkStation P360 Ultra)のエンタープライズ・タワー。
- 産業用PC:製造オートメーション用に設計されたアドバンテックと エティナの堅牢なシステム。
サポートされているタスク
現在、物体検出モデルはAxelera形式にエクスポート可能です。追加タスクの統合が進行中です:
| タスク | ステータス |
|---|---|
| 物体検出 | ✅ サポート対象 |
| 姿勢推定 | 近日公開 |
| セグメンテーション | 近日公開 |
| 方向付き境界ボックス | 近日公開 |
インストール
プラットフォーム要件
Axelera形式へのエクスポートには以下が必要です:
- オペレーティングシステム: Linuxのみ(Ubuntu 22.04/24.04推奨)
- ハードウェア:アクセレラAIアクセラレータ(メティスデバイス)
- Python: バージョン 3.10 (3.11 および 3.12 はまもなくリリース予定)
Ultralytics インストール
pip install ultralytics
詳細な手順については、Ultralytics ガイドをご覧ください。問題が発生した場合は、よくある問題ガイドを参照してください。
アクセレラ ドライバーのインストール
Axeleraリポジトリキーを追加します:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"リポジトリをaptに追加します:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"SDKをインストールし、ドライバを読み込みます:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
YOLO モデルのアクセラへのエクスポート
標準Ultralytics コマンドを使用して、トレーニング済みのYOLO をエクスポートします。
アクセラフォーマットへのエクスポート
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera
エクスポート引数
| 引数 | 種類 | デフォルト | 説明 |
|---|---|---|---|
format | str | 'axelera' | Axelera Metis AIPUハードウェア向けターゲットフォーマット |
imgsz | int または tuple | 640 | モデル入力用の画像サイズ |
int8 | bool | True | AIPUに対してINT8量子化を有効にする |
data | str | 'coco128.yaml' | 量子化キャリブレーション用データセット設定 |
fraction | float | 1.0 | キャリブレーション用データセットの割合(100~400枚を推奨) |
device | str | None | エクスポートデバイス:GPUdevice=0またはCPUdevice=cpu) |
すべてのエクスポートオプションについては、エクスポートモードのドキュメントを参照してください。
出力構造
yolo11n_axelera_model/
├── yolo11n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
推論の実行
エクスポートしたモデルをUltralytics で読み込み、推論を実行します。これは ONNX モデルを読み込むのと同様の手順で実行します。
アクセレラモデルを用いた推論
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
既知の問題
最初の実行では例外が発生する可能性があります。 ImportError以降の実行は正常に動作します。この問題は今後のリリースで修正されます。
推論パフォーマンス
メティスAIPUは、エネルギー消費を最小限に抑えながらスループットを最大化します。
| メトリック | メティス PCIe x4 | メティスM.2 | 注 |
|---|---|---|---|
| ピーク・スループット | 856 トップス | 214 TOPS | INT8 精度 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 入力 |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 入力 |
| 効率性 | 高い | 非常に高い | バッテリー駆動に最適 |
Axelera AIデータに基づくベンチマーク。実際のFPSはモデルサイズ、バッチ処理、入力解像度によって異なります。
現実世界のアプリケーション
アクセラ・ハードウェア上のUltralytics YOLO 、高度なエッジ・コンピューティング・ソリューションを可能にします:
- スマートリテール:店舗最適化のためのリアルタイム物体カウントと ヒートマップ分析。
- 産業安全:製造環境における低遅延PPE検出。
- ドローンアナリティクス 農業や捜索救助のためのUAVでの高速物体検出。
- 交通システム:エッジベースのナンバープレート認識と 速度推定。
推奨ワークフロー
- Ultralytics Train Modeを使用してモデルをトレーニングする
- エクスポート Axelera形式を使用して
model.export(format="axelera") - 検証 正確さをもって
yolo val最小量子化損失を検証する - 予測 使用
yolo predict定性的検証のため
デバイス健全性チェック
Axeleraデバイスが正常に動作していることを確認してください:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
詳細な診断については、AxDeviceのドキュメントを参照してください。
最高性能
この統合は互換性のためにシングルコア構成を使用します。最大スループットを必要とする本番環境向けに、Axelera Voyager SDKは以下の機能を提供します:
- マルチコア利用率(クアッドコア Metis AIPU)
- ストリーミング推論パイプライン
- 高解像度カメラ向けタイル型推論
FPSベンチマークについてはモデル・ズーを参照するか、製品サポートについてはAxeleraにお問い合わせください。
既知の問題
既知の制限事項
PyTorch .9 互換性最初の
yolo export format=axeleraコマンドPyTorch 自動的に2.8にPyTorch ため失敗する可能性があります。成功させるにはコマンドを再度実行してください。M.2の電力制限: 大型または超大型モデルでは、電源供給の制約によりM.2アクセラレータ上でランタイムエラーが発生する可能性があります。
最初の推論 ImportError最初の実行では例外が発生する可能性があります。
ImportErrorその後の実行は正常に動作します。
サポートについては、Axeleraコミュニティをご覧ください。
よくある質問
アクセラでサポートされているYOLO バージョンは?
Voyager SDKはエクスポートをサポートしています YOLOv8 および YOLO11 モデルのエクスポートをサポートしています。
カスタムトレーニング済みモデルをデプロイできますか?
はい。Ultralytics Train Modeを使用してトレーニングされたモデルは、サポートされているレイヤーとオペレーションを使用する限り、Axeleraフォーマットにエクスポートできます。
INT8の量子化は精度にどう影響しますか?
AxeleraのVoyager SDKは、混合精度AIPUアーキテクチャ向けにモデルを自動的に量子化します。ほとんどの 物体検出 タスクにおいて、パフォーマンス向上(高いFPS、低い電力)は、最小限の影響を大幅に上回る。 mAP量子化にはモデルサイズに応じて数秒から数時間かかります。実行 yolo val エクスポート後に正確性を確認する。
校正画像は何枚使用すべきですか?
100~400枚の画像を推奨します。400枚を超えると追加の利点はなく、量子化時間が長くなります。100枚、200枚、400枚で実験し、最適なバランスを見つけてください。
Voyager SDKはどこにありますか?
SDK、ドライバ、コンパイラツールは、アクセラ開発者ポータルから入手できます。