Перейти к содержанию

Экспорт и развертывание Axelera AI

Экспериментальный выпуск

Это экспериментальная интеграция, демонстрирующая развертывание на оборудовании Axelera Metis. Полная интеграция ожидается к февралю 2026 года с экспортом моделей без необходимости использования оборудования Axelera и стандартной установки через pip.

Ultralytics сотрудничает с Axelera AI, чтобы обеспечить высокопроизводительный и энергоэффективный вывод на устройствах Edge AI. Экспортируйте и развертывайте модели Ultralytics YOLO непосредственно на Metis® AIPU с помощью Voyager SDK.

Экосистема Axelera AI для развертывания YOLO на периферии

Axelera AI предоставляет специализированное аппаратное ускорение для компьютерного зрения на периферии, используя проприетарную архитектуру потоков данных и вычисления в памяти для обеспечения до 856 TOPS при низком энергопотреблении.

Выбор подходящего оборудования

Axelera AI предлагает различные форм-факторы для соответствия различным ограничениям развертывания. Приведенная ниже диаграмма помогает определить оптимальное оборудование для вашего развертывания Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Портфель оборудования

Линейка оборудования Axelera оптимизирована для запуска Ultralytics YOLO26 и устаревших версий с высокой эффективностью FPS на ватт.

Карты ускорителей

Эти карты обеспечивают ускорение ИИ в существующих хост-устройствах, облегчая развертывания на существующей инфраструктуре.

ПродуктФорм-факторВычисленияПроизводительность (INT8)Целевое приложение
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSВысокоплотная видеоаналитика, умные города
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSПромышленные ПК, розничная торговля управление очередью
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSДроны, робототехника, портативные медицинские устройства
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSСреды, требующие продвинутого терморегулирования

Интегрированные системы

Для готовых решений Axelera сотрудничает с производителями, чтобы предоставлять системы, предварительно проверенные для Metis AIPU.

  • Вычислительная плата Metis: Автономное периферийное устройство, объединяющее Metis AIPU с Rockchip RK3588 ARM CPU.
  • Рабочие станции: Корпоративные башни от Dell (Precision 3460XE) и Lenovo (ThinkStation P360 Ultra).
  • Промышленные ПК: Прочные системы от Advantech и Aetina, предназначенные для автоматизации производства.

Поддерживаемые задачи

В настоящее время модели detect объектов могут быть экспортированы в формат Axelera. Интегрируются дополнительные задачи:

ЗадачаСтатус
Обнаружение объектов✅ Поддерживается
Оценка позыСкоро
СегментацияСкоро
Ориентированные ограничивающие рамкиСкоро

Установка

Требования к платформе

Для экспорта в формат Axelera требуется:

  • Операционная система: Только Linux (рекомендуется Ubuntu 22.04/24.04)
  • Оборудование: Ускоритель Axelera AI (устройства Metis)
  • Python: Версия 3.10 (3.11 и 3.12 скоро будут доступны)

Установка Ultralytics

pip install ultralytics

Подробные инструкции см. в нашем руководстве по установке Ultralytics. В случае возникновения трудностей обратитесь к нашему руководству по распространенным проблемам.

Установка драйвера Axelera

  1. Добавьте ключ репозитория Axelera:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. Добавьте репозиторий в apt:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. Установите SDK и загрузите драйвер:

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

Экспорт моделей YOLO в Axelera

Экспортируйте обученные модели YOLO с помощью стандартной команды экспорта Ultralytics.

Экспорт в формат Axelera

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera

Аргументы экспорта

АргументТипПо умолчаниюОписание
formatstr'axelera'Целевой формат для оборудования Axelera Metis AIPU
imgszint или tuple640Размер изображения для входа модели
int8boolTrueВключите квантование INT8 для AIPU
datastr'coco128.yaml'Конфигурация набора данных для калибровки квантования
fractionfloat1.0Доля набора данных для калибровки (рекомендуется 100-400 изображений)
devicestrNoneУстройство экспорта: GPU (device=0) или CPU (device=cpu)

Все параметры экспорта см. в документации по режиму экспорта.

Структура вывода

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Запуск логического вывода

Загрузите экспортированную модель с помощью API Ultralytics и выполните инференс, аналогично загрузке моделей ONNX.

Инференс с моделью Axelera

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Известная проблема

Первый запуск инференса может вызвать ImportError. Последующие запуски будут работать корректно. Это будет исправлено в будущем выпуске.

Производительность Inference

Metis AIPU максимизирует пропускную способность, минимизируя при этом энергопотребление.

МетрикаMetis PCIe x4Metis M.2Примечание
Пиковая пропускная способность856 TOPS214 TOPSТочность INT8
YOLOv5m FPS~1539 FPS~326 FPSВход 640x640
YOLOv5s FPSН/Д~827 FPSВход 640x640
ЭффективностьВысокийОчень высокийИдеально подходит для питания от аккумулятора

Бенчмарки основаны на данных Axelera AI. Фактический FPS зависит от размера модели, пакетной обработки и входного разрешения.

Приложения в реальном мире

Ultralytics YOLO на оборудовании Axelera обеспечивает передовые решения для edge computing:

  1. Обучите вашу модель, используя режим обучения Ultralytics
  2. Экспорт в формат Axelera с использованием model.export(format="axelera")
  3. Проверка точность с yolo val для проверки минимальных потерь при квантовании
  4. Прогнозирование используя yolo predict для качественной валидации

Проверка работоспособности устройства

Убедитесь, что ваше устройство Axelera функционирует правильно:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Для подробной диагностики см. документацию AxDevice.

Максимальная производительность

Эта интеграция использует одноядерную конфигурацию для обеспечения совместимости. Для производственных задач, требующих максимальной пропускной способности, Axelera Voyager SDK предлагает:

  • Использование многоядерности (четырехъядерный Metis AIPU)
  • Конвейеры потокового вывода
  • Плиточный вывод для камер высокого разрешения

См. model-zoo для сравнения FPS или свяжитесь с Axelera для получения производственной поддержки.

Известные проблемы

Известные ограничения

  • Совместимость с PyTorch 2.9: Первая yolo export format=axelera команда может завершиться неудачей из-за автоматического понижения версии PyTorch до 2.8. Запустите команду повторно для успешного выполнения.

  • Ограничения питания M.2: Большие или очень большие модели могут столкнуться с ошибками выполнения на ускорителях M.2 из-за ограничений по питанию.

  • ImportError при первом выводе: Первый запуск вывода может вызвать ImportError. Последующие запуски работают корректно.

Для получения поддержки посетите сообщество Axelera.

Часто задаваемые вопросы

Какие версии YOLO поддерживаются на Axelera?

Voyager SDK поддерживает экспорт моделей YOLOv8 и YOLO26.

Можно ли развертывать модели, обученные на пользовательских данных?

Да. Любая модель, обученная с использованием Ultralytics Train Mode, может быть экспортирована в формат Axelera, при условии, что она использует поддерживаемые слои и операции.

Как влияет квантование INT8 на точность?

Voyager SDK от Axelera автоматически квантует модели для архитектуры AIPU со смешанной точностью. Для большинства обнаружения объектов задач, выигрыш в производительности (более высокий FPS, меньшее энергопотребление) значительно перевешивает минимальное влияние на mAP. Квантование занимает от нескольких секунд до нескольких часов в зависимости от размера модели. Запустите yolo val после экспорта для проверки точности.

Сколько калибровочных изображений следует использовать?

Мы рекомендуем от 100 до 400 изображений. Более 400 изображений не дают дополнительной выгоды и увеличивают время квантования. Экспериментируйте со 100, 200 и 400 изображениями, чтобы найти оптимальный баланс.

Где я могу найти Voyager SDK?

SDK, драйверы и инструменты компилятора доступны через Портал разработчика Axelera.



📅 Создано 2 месяцев назад ✏️ Обновлено 7 дней назад
glenn-jocherpderrengerambitious-octopusonuralpszr

Комментарии