Перейти к содержанию

Экспорт и развертывание искусственного интеллекта Axelera

Экспериментальный выпуск

Это экспериментальная интеграция, демонстрирующая развертывание на оборудовании Axelera Metis. Полная интеграция ожидается к февралю 2026 года с экспортом моделей без необходимости использования оборудования Axelera и стандартной установки pip.

Ultralytics с Axelera AI, чтобы обеспечить высокопроизводительное и энергоэффективное вычисление на устройствах Edge AI. Экспортируйте и развертывайте YOLO Ultralytics YOLO непосредственно на Metis® AIPU с помощью Voyager SDK.

Axelera AI Ecosystem

Axelera AI обеспечивает специализированное аппаратное ускорение для компьютерного зрения на периферии, используя запатентованную архитектуру потока данных и вычисления в памяти, чтобы обеспечить производительность до 856 TOPS при низком энергопотреблении.

Выбор подходящего оборудования

Axelera AI предлагает различные форм-факторы для соответствия различным ограничениям развертывания. Приведенная ниже диаграмма помогает определить оптимальное оборудование для вашего развертывания Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Портфель оборудования

Линейка оборудования Axelera оптимизирована для запуска Ultralytics YOLO11 и устаревших версий с высокой энергоэффективностью FPS-per-watt.

Карты ускорителей

Эти карты обеспечивают ускорение ИИ в существующих хост-устройствах, облегчая развертывания на существующей инфраструктуре.

ПродуктФорм-факторВычисленияПроизводительность (INT8)Целевое приложение
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSВысокоплотная видеоаналитика, умные города
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSПромышленные ПК, розничная торговля управление очередью
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSДроны, робототехника, портативные медицинские устройства
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSСреды, требующие продвинутого терморегулирования

Интегрированные системы

Для готовых решений Axelera сотрудничает с производителями, чтобы предоставлять системы, предварительно проверенные для Metis AIPU.

  • Вычислительная плата Metis: Автономное периферийное устройство, объединяющее Metis AIPU с Rockchip RK3588 ARM CPU.
  • Рабочие станции: Корпоративные башни от Dell (Precision 3460XE) и Lenovo (ThinkStation P360 Ultra).
  • Промышленные ПК: Прочные системы от Advantech и Aetina, предназначенные для автоматизации производства.

Поддерживаемые задачи

В настоящее время модели обнаружения объектов могут быть экспортированы в формат Axelera. В настоящее время ведется работа по интеграции дополнительных задач:

ЗадачаСтатус
Обнаружение объектов✅ Поддерживается
Оценка позыСкоро
СегментацияСкоро
Ориентированные ограничительные рамкиСкоро

Установка

Требования к платформе

Для экспорта в формат Axelera необходимо:

  • Операционная система: только Linux (рекомендуется Ubuntu 22.04/24.04)
  • Оборудование: ускоритель искусственного интеллекта Axelera (устройства Metis)
  • Python: версия 3.10 (скоро выйдут версии 3.11 и 3.12)

Установка Ultralytics

pip install ultralytics

Подробные инструкции см. в руководствеUltralytics . Если у вас возникли трудности, обратитесь к руководству по распространенным проблемам.

Установка драйвера Axelera

  1. Добавьте ключ репозитория Axelera:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. Добавьте репозиторий в apt:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. Установите SDK и загрузите драйвер:

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

Экспорт моделей YOLO в Axelera

Экспортируйте обученные YOLO с помощью стандартной команды Ultralytics .

Экспорт в формат Axelera

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera

Аргументы экспорта

АргументТипПо умолчаниюОписание
formatstr'axelera'Целевой формат для оборудования Axelera Metis AIPU
imgszint или tuple640Размер изображения для ввода модели
int8boolTrueВключить квантование INT8 для AIPU
datastr'coco128.yaml'Конфигурация набора данных для калибровки квантования
fractionfloat1.0Часть набора данных для калибровки (рекомендуется 100–400 изображений)
devicestrNoneУстройство экспорта: GPUdevice=0) или CPUdevice=cpu)

Все параметры экспорта см. в документации по режиму экспорта.

Структура вывода

yolo11n_axelera_model/
├── yolo11n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Запуск логического вывода

Загрузите экспортированную модель с помощью Ultralytics и запустите инференцию, аналогично загрузке ONNX .

Вывод с помощью модели Axelera

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Известная проблема

Первый прогон вывода может вызвать исключение ImportError. Последующие запуски будут работать корректно. Эта проблема будет устранена в будущем выпуске.

Производительность Inference

Metis AIPU обеспечивает максимальную пропускную способность при минимальном энергопотреблении.

МетрикаMetis PCIe x4Metis M.2Примечание
Пиковая пропускная способность856 TOPS214 TOPSТочность INT8
YOLOv5m FPS~1539 FPS~326 FPSВход 640x640
YOLOv5s FPSН/Д~827 FPSВход 640x640
ЭффективностьВысокийОчень высокийИдеально подходит для питания от аккумулятора

Тесты основаны на данных Axelera AI. Фактическая частота кадров зависит от размера модели, пакетной обработки и разрешения входных данных.

Приложения в реальном мире

Ultralytics YOLO на оборудовании Axelera обеспечивает передовые решения для edge computing:

  1. Обучите свою модель с помощьюрежима обучения Ultralytics
  2. Экспорт в формат Axelera с помощью model.export(format="axelera")
  3. Проверка точность с yolo val для проверки минимальных потерь при квантовании
  4. Прогнозирование используя yolo predict для качественной валидации

Проверка работоспособности устройства

Убедитесь, что устройство Axelera работает правильно:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Подробную информацию о диагностике см. в документации AxDevice.

Максимальная производительность

Эта интеграция использует одноядерную конфигурацию для обеспечения совместимости. Для производства, требующего максимальной пропускной способности, Axelera Voyager SDK предлагает:

  • Использование многоядерных процессоров (четырехъядерный Metis AIPU)
  • Потоковые конвейеры инференса
  • Мозаичное выведение для камер с более высоким разрешением

См. модельный зоопарк для тестов FPS или обратитесь в Axelera для получения поддержки по производству.

Известные проблемы

Известные ограничения

  • Совместимость с PyTorch .9: Первый yolo export format=axelera команда может завершиться сбоем из-за автоматического PyTorch до 2.8. Запустите команду второй раз, чтобы она выполнилась успешно.

  • Ограничения по мощности M.2: в больших или очень больших моделях могут возникать ошибки выполнения на ускорителях M.2 из-за ограничений по питанию.

  • Первое заключение ImportError: Первый прогон вывода может вызвать исключение ImportError. Последующие запуски работают правильно.

Для получения поддержки посетите сообщество Axelera.

Часто задаваемые вопросы

Какие версии YOLO поддерживаются на Axelera?

SDK Voyager поддерживает экспорт YOLOv8 и YOLO11 .

Могу ли я развернуть модели, обученные по индивидуальному заказу?

Да. Любая модель, обученная с использованием Ultralytics Train Mode, может быть экспортирована в формат Axelera, при условии, что она использует поддерживаемые слои и операции.

Как влияет квантование INT8 на точность?

SDK Voyager от Axelera автоматически квантует модели для архитектуры AIPU со смешанной точностью. Для большинства обнаружения объектов задачах, прирост производительности (более высокая частота кадров, более низкое энергопотребление) значительно перевешивает минимальное влияние на mAP. Квантование занимает от нескольких секунд до нескольких часов в зависимости от размера модели. Запустить yolo val после экспорта для проверки точности.

Сколько калибровочных изображений следует использовать?

Мы рекомендуем от 100 до 400 изображений. Более 400 изображений не дают дополнительных преимуществ и увеличивают время квантования. Поэкспериментируйте с 100, 200 и 400 изображениями, чтобы найти оптимальный баланс.

Где я могу найти Voyager SDK?

SDK, драйверы и инструменты компилятора доступны через Портал разработчика Axelera.



📅 Создано 20 дней назад ✏️ Обновлено 3 дня назад
glenn-jocherpderrengerambitious-octopusonuralpszr

Комментарии