コンテンツにスキップ

Axelera AIのエクスポートとデプロイ

実験的リリース

これは、Axelera Metisハードウェアへのデプロイメントを示す実験的な統合です。完全な統合は2026年2月までに予定されており、Axeleraハードウェアを必要としないモデルエクスポートと標準的なpipインストールが可能になります。

UltralyticsはAxelera AIと提携し、Edge AIデバイス上で高性能かつエネルギー効率の高い推論を可能にします。Voyager SDKを使用して、Ultralytics YOLOモデルMetis® AIPUに直接エクスポートおよびデプロイしてください。

アクセレラAIエッジ展開エコシステム forYOLO

Axelera AIは、独自のデータフローアーキテクチャとインメモリコンピューティングを使用し、低消費電力で最大856 TOPSを達成することで、エッジでのコンピュータービジョン向けに専用のハードウェアアクセラレーションを提供します。

適切なハードウェアの選択

Axelera AIは、さまざまなデプロイメントの制約に対応するために様々なフォームファクタを提供しています。下のチャートは、Ultralytics YOLOデプロイメントに最適なハードウェアを特定するのに役立ちます。

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

ハードウェアポートフォリオ

Axeleraのハードウェアラインアップは、高いFPS/ワット効率でUltralytics YOLO26およびレガシーバージョンを実行するために最適化されています。

アクセラレータカード

これらのカードは、既存のホストデバイスでAIアクセラレーションを可能にし、ブラウンフィールドデプロイメントを促進します。

製品フォームファクタコンピュート性能 (INT8)対象アプリケーション
Metis PCIe x4PCIe Gen3 x164倍の Metis AIPU856 TOPS高密度映像解析、スマートシティ
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPS産業用PC、小売店における行列管理
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones、ロボット工学、ポータブル医療機器
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPS高度な熱管理を必要とする環境

統合システム

ターンキーソリューション向けに、Axeleraはメーカーと提携し、Metis AIPU向けに事前検証済みのシステムを提供しています。

  • Metis Compute Board:Metis AIPUとRockchip RK3588 ARM CPUを組み合わせたスタンドアロンのエッジデバイスです。
  • ワークステーションDell (Precision 3460XE) および Lenovo (ThinkStation P360 Ultra) 製のエンタープライズ向けタワー型PC。
  • 産業用PCAdvantech および Aetina 製の、製造自動化向けに設計された堅牢なシステム。

サポートされているタスク

現在、オブジェクト detect モデルはAxelera形式にエクスポートできます。追加のタスクが統合されています。

タスクステータス
物体検出✅ サポート済み
姿勢推定近日公開
セグメンテーション近日公開
傾斜バウンディングボックス近日公開

インストール

プラットフォーム要件

Axelera形式へのエクスポートには以下が必要です。

  • オペレーティングシステム: Linuxのみ (Ubuntu 22.04/24.04を推奨)
  • ハードウェア: Axelera AIアクセラレーター (Metisデバイス)
  • Python: バージョン 3.10 (3.11および3.12は近日公開)

Ultralytics インストール

pip install ultralytics

詳細な手順については、弊社のUltralyticsインストールガイドを参照してください。問題が発生した場合は、弊社の一般的な問題ガイドを参照してください。

Axeleraドライバーのインストール

  1. Axeleraリポジトリキーを追加します。

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. aptにリポジトリを追加します。

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. SDKをインストールし、ドライバーをロードします。

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

YOLOモデルのAxeleraへのエクスポート

標準のUltralyticsエクスポートコマンドを使用して、訓練済みのYOLOモデルをエクスポートします。

Axeleraフォーマットへのエクスポート

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera

エクスポート引数

引数種類デフォルト説明
formatstr'axelera'Axelera Metis AIPUハードウェア向けのターゲット形式
imgszint または tuple640モデル入力用の画像サイズ
int8boolTrueAIPU向けにINT8量子化を有効にします
datastr'coco128.yaml'量子化キャリブレーション用のデータセット設定
fractionfloat1.0キャリブレーション用のデータセットの割合 (100~400画像を推奨)
devicestrNoneエクスポートデバイス: GPU (device=0) または CPU (device=cpu)

すべてのエクスポートオプションについては、エクスポートモードのドキュメントを参照してください。

出力構造

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

推論の実行

Ultralytics APIでエクスポートされたモデルをロードし、ONNXモデルのロードと同様に推論を実行します。

Axeleraモデルによる推論

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

既知の問題

最初の推論実行で ImportErrorが発生する場合があります。それ以降の実行は正しく動作します。これは将来のリリースで対処されます。

推論パフォーマンス

Metis AIPUは、エネルギー消費を最小限に抑えながらスループットを最大化します。

メトリックMetis PCIe x4Metis M.2
ピークスループット856 TOPS214 TOPSINT8精度
YOLOv5m FPS~1539 FPS~326 FPS640x640入力
YOLOv5s FPSN/A~827 FPS640x640入力
効率非常に高いバッテリー駆動に最適

ベンチマークはAxelera AIのデータに基づいています。実際のFPSは、モデルサイズ、バッチ処理、入力解像度によって異なります。

現実世界のアプリケーション

Axeleraハードウェア上のUltralytics YOLOは、高度なエッジコンピューティングソリューションを可能にします。

  1. UltralyticsのTrain Modeを使用してモデルをトレーニングします。
  2. エクスポート を使用してAxelera形式に model.export(format="axelera")
  3. 検証 で精度を yolo val 量子化損失が最小限であることを確認するために
  4. 予測 使用 yolo predict 定性的な検証のために

デバイスヘルスチェック

Axeleraデバイスが正常に機能していることを確認してください。

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

詳細な診断については、AxDeviceドキュメントを参照してください。

最大性能

この統合は互換性のためにシングルコア構成を使用します。最大スループットを必要とする本番環境では、Axelera Voyager SDKが以下を提供します。

  • マルチコア利用(クアッドコアMetis AIPU)
  • ストリーミング推論パイプライン
  • 高解像度カメラ向けタイル推論

FPSベンチマークについてはmodel-zooを、本番環境のサポートについてはAxeleraにお問い合わせください。

既知の問題

既知の制限事項

  • PyTorch 2.9の互換性: 最初の yolo export format=axelera コマンドは、PyTorchが自動的に2.8にダウングレードされるため失敗する可能性があります。2回目を実行すると成功します。

  • M.2電源の制限: 大規模または超大規模モデルは、電源供給の制約によりM.2アクセラレータでランタイムエラーが発生する可能性があります。

  • 最初の推論でのImportError: 最初の推論実行で ImportErrorが発生する場合があります。それ以降の実行は正しく動作します。

サポートについては、Axeleraコミュニティをご覧ください。

よくある質問

AxeleraではどのYOLOバージョンがサポートされていますか?

Voyager SDKはYOLOv8およびYOLO26モデルのエクスポートをサポートしています。

カスタムトレーニングしたモデルをデプロイできますか?

はい。Ultralytics Train Modeを使用してトレーニングされたモデルは、サポートされているレイヤーと操作を使用している限り、Axelera形式にエクスポートできます。

INT8量子化は精度にどのように影響しますか?

AxeleraのVoyager SDKは、混合精度AIPUアーキテクチャ向けにモデルを自動的に量子化します。ほとんどの 物体検出 タスクにおいて、パフォーマンスの向上(高FPS、低消費電力)は、最小限の影響をはるかに上回ります。 mAP量子化は、モデルのサイズに応じて数秒から数時間かかります。エクスポート後に実行して精度を確認してください。 yolo val エクスポート後に実行して精度を確認してください。

キャリブレーション画像はいくつ使用すべきですか?

100から400枚の画像を推奨します。400枚を超えると、追加の利点はなく、量子化時間が増加します。100、200、400枚の画像で実験し、最適なバランスを見つけてください。

Voyager SDKはどこで入手できますか?

SDK、ドライバー、およびコンパイラツールは、Axelera Developer Portalを通じて入手可能です。



📅 2ヶ月前に作成✏️ 7日前に更新
glenn-jocherpderrengerambitious-octopusonuralpszr

コメント