Экспорт и развертывание Axelera AI
Экспериментальный выпуск
Это экспериментальная интеграция, демонстрирующая развертывание на оборудовании Axelera Metis. Полная интеграция ожидается к февралю 2026 года с экспортом моделей без необходимости использования оборудования Axelera и стандартной установки через pip.
Ultralytics сотрудничает с Axelera AI, чтобы обеспечить высокопроизводительный и энергоэффективный вывод на устройствах Edge AI. Экспортируйте и развертывайте модели Ultralytics YOLO непосредственно на Metis® AIPU с помощью Voyager SDK.
Axelera AI предоставляет специализированное аппаратное ускорение для компьютерного зрения на периферии, используя проприетарную архитектуру потоков данных и вычисления в памяти для обеспечения до 856 TOPS при низком энергопотреблении.
Выбор подходящего оборудования
Axelera AI предлагает различные форм-факторы для соответствия различным ограничениям развертывания. Приведенная ниже диаграмма помогает определить оптимальное оборудование для вашего развертывания Ultralytics YOLO.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Портфель оборудования
Линейка оборудования Axelera оптимизирована для запуска Ultralytics YOLO26 и устаревших версий с высокой эффективностью FPS на ватт.
Карты ускорителей
Эти карты обеспечивают ускорение ИИ в существующих хост-устройствах, облегчая развертывания на существующей инфраструктуре.
| Продукт | Форм-фактор | Вычисления | Производительность (INT8) | Целевое приложение |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Высокоплотная видеоаналитика, умные города |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | Промышленные ПК, розничная торговля управление очередью |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Дроны, робототехника, портативные медицинские устройства |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Среды, требующие продвинутого терморегулирования |
Интегрированные системы
Для готовых решений Axelera сотрудничает с производителями, чтобы предоставлять системы, предварительно проверенные для Metis AIPU.
- Вычислительная плата Metis: Автономное периферийное устройство, объединяющее Metis AIPU с Rockchip RK3588 ARM CPU.
- Рабочие станции: Корпоративные башни от Dell (Precision 3460XE) и Lenovo (ThinkStation P360 Ultra).
- Промышленные ПК: Прочные системы от Advantech и Aetina, предназначенные для автоматизации производства.
Поддерживаемые задачи
В настоящее время модели detect объектов могут быть экспортированы в формат Axelera. Интегрируются дополнительные задачи:
| Задача | Статус |
|---|---|
| Обнаружение объектов | ✅ Поддерживается |
| Оценка позы | Скоро |
| Сегментация | Скоро |
| Ориентированные ограничивающие рамки | Скоро |
Установка
Требования к платформе
Для экспорта в формат Axelera требуется:
- Операционная система: Только Linux (рекомендуется Ubuntu 22.04/24.04)
- Оборудование: Ускоритель Axelera AI (устройства Metis)
- Python: Версия 3.10 (3.11 и 3.12 скоро будут доступны)
Установка Ultralytics
pip install ultralytics
Подробные инструкции см. в нашем руководстве по установке Ultralytics. В случае возникновения трудностей обратитесь к нашему руководству по распространенным проблемам.
Установка драйвера Axelera
Добавьте ключ репозитория Axelera:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"Добавьте репозиторий в apt:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"Установите SDK и загрузите драйвер:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
Экспорт моделей YOLO в Axelera
Экспортируйте обученные модели YOLO с помощью стандартной команды экспорта Ultralytics.
Экспорт в формат Axelera
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera
Аргументы экспорта
| Аргумент | Тип | По умолчанию | Описание |
|---|---|---|---|
format | str | 'axelera' | Целевой формат для оборудования Axelera Metis AIPU |
imgsz | int или tuple | 640 | Размер изображения для входа модели |
int8 | bool | True | Включите квантование INT8 для AIPU |
data | str | 'coco128.yaml' | Конфигурация набора данных для калибровки квантования |
fraction | float | 1.0 | Доля набора данных для калибровки (рекомендуется 100-400 изображений) |
device | str | None | Устройство экспорта: GPU (device=0) или CPU (device=cpu) |
Все параметры экспорта см. в документации по режиму экспорта.
Структура вывода
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
Запуск логического вывода
Загрузите экспортированную модель с помощью API Ultralytics и выполните инференс, аналогично загрузке моделей ONNX.
Инференс с моделью Axelera
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
Известная проблема
Первый запуск инференса может вызвать ImportError. Последующие запуски будут работать корректно. Это будет исправлено в будущем выпуске.
Производительность Inference
Metis AIPU максимизирует пропускную способность, минимизируя при этом энергопотребление.
| Метрика | Metis PCIe x4 | Metis M.2 | Примечание |
|---|---|---|---|
| Пиковая пропускная способность | 856 TOPS | 214 TOPS | Точность INT8 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | Вход 640x640 |
| YOLOv5s FPS | Н/Д | ~827 FPS | Вход 640x640 |
| Эффективность | Высокий | Очень высокий | Идеально подходит для питания от аккумулятора |
Бенчмарки основаны на данных Axelera AI. Фактический FPS зависит от размера модели, пакетной обработки и входного разрешения.
Приложения в реальном мире
Ultralytics YOLO на оборудовании Axelera обеспечивает передовые решения для edge computing:
- Интеллектуальная розничная торговля: Подсчет объектов и аналитика тепловых карт в реальном времени для оптимизации магазина.
- Промышленная безопасность: Обнаружение средств индивидуальной защиты с низкой задержкой в производственных условиях.
- Аналитика с дронов: Высокоскоростное detect объектов на БПЛА для сельского хозяйства и поисково-спасательных операций.
- Транспортные системы: Распознавание номерных знаков и оценка скорости на периферийных устройствах.
Рекомендуемый рабочий процесс
- Обучите вашу модель, используя режим обучения Ultralytics
- Экспорт в формат Axelera с использованием
model.export(format="axelera") - Проверка точность с
yolo valдля проверки минимальных потерь при квантовании - Прогнозирование используя
yolo predictдля качественной валидации
Проверка работоспособности устройства
Убедитесь, что ваше устройство Axelera функционирует правильно:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
Для подробной диагностики см. документацию AxDevice.
Максимальная производительность
Эта интеграция использует одноядерную конфигурацию для обеспечения совместимости. Для производственных задач, требующих максимальной пропускной способности, Axelera Voyager SDK предлагает:
- Использование многоядерности (четырехъядерный Metis AIPU)
- Конвейеры потокового вывода
- Плиточный вывод для камер высокого разрешения
См. model-zoo для сравнения FPS или свяжитесь с Axelera для получения производственной поддержки.
Известные проблемы
Известные ограничения
Совместимость с PyTorch 2.9: Первая
yolo export format=axeleraкоманда может завершиться неудачей из-за автоматического понижения версии PyTorch до 2.8. Запустите команду повторно для успешного выполнения.Ограничения питания M.2: Большие или очень большие модели могут столкнуться с ошибками выполнения на ускорителях M.2 из-за ограничений по питанию.
ImportError при первом выводе: Первый запуск вывода может вызвать
ImportError. Последующие запуски работают корректно.
Для получения поддержки посетите сообщество Axelera.
Часто задаваемые вопросы
Какие версии YOLO поддерживаются на Axelera?
Voyager SDK поддерживает экспорт моделей YOLOv8 и YOLO26.
Можно ли развертывать модели, обученные на пользовательских данных?
Да. Любая модель, обученная с использованием Ultralytics Train Mode, может быть экспортирована в формат Axelera, при условии, что она использует поддерживаемые слои и операции.
Как влияет квантование INT8 на точность?
Voyager SDK от Axelera автоматически квантует модели для архитектуры AIPU со смешанной точностью. Для большинства обнаружения объектов задач, выигрыш в производительности (более высокий FPS, меньшее энергопотребление) значительно перевешивает минимальное влияние на mAP. Квантование занимает от нескольких секунд до нескольких часов в зависимости от размера модели. Запустите yolo val после экспорта для проверки точности.
Сколько калибровочных изображений следует использовать?
Мы рекомендуем от 100 до 400 изображений. Более 400 изображений не дают дополнительной выгоды и увеличивают время квантования. Экспериментируйте со 100, 200 и 400 изображениями, чтобы найти оптимальный баланс.
Где я могу найти Voyager SDK?
SDK, драйверы и инструменты компилятора доступны через Портал разработчика Axelera.