Ускорение искусственного интеллекта Axelera
Скоро - Q1 2026
Поддержка Axelera в ultralytics является в процессе. Приведенные здесь примеры демонстрируют планируемый UI/UX и станут доступными для выполнения после выпуска пакета времени выполнения Axelera.
Компания Ultralytics сотрудничает с Axelera AI для оптимизации высокопроизводительных и энергоэффективных выводов на устройствах Edge AI. Эта интеграция позволяет пользователям экспортировать и развертывать моделиUltralytics YOLO непосредственно на платформах Metis® AIPU и Europa® с помощью Voyager SDK.
Компания Axelera AI предоставляет специализированное аппаратное ускорение для компьютерного зрения и генеративного искусственного интеллекта на границе. Их технология использует запатентованную архитектуру потока данных и вычисления в памяти для обеспечения высокой пропускной способности (до 856 TOPS) при низком энергопотреблении.
Для пользователей Ultralytics это открывает масштабируемый путь к развертыванию функций обнаружения объектов, оценки положения и других задач YOLO на различных устройствах - от встроенных беспилотников до граничных серверов.
Выбор подходящего оборудования
Axelera AI предлагает различные форм-факторы, чтобы соответствовать различным ограничениям на развертывание. Приведенная ниже диаграмма поможет определить оптимальное оборудование для развертывания Ultralytics YOLO .
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Портфель аппаратных средств
Линейка оборудования Axelera оптимизирована для работы Ultralytics YOLO11 и устаревших версий с высокой эффективностью FPS на ватт.
Карты ускорителей
Эти карты позволяют ускорять ИИ в существующих хост-устройствах, что облегчает развертывание в условиях "зрелого поля".
| Продукт | Форм-фактор | Вычислите | Производительность (INT8) | Целевое применение |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Видеоаналитика высокой плотности, умные города |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Метис Айпу | 214 TOPS | Промышленные ПК, управление очередями в розничной торговле |
| Метис М.2 | M.2 2280 M-Key | 1x Метис Айпу | 214 TOPS | Беспилотники, робототехника, портативные медицинские устройства |
| Metis M.2 MAX | M.2 2280 | 1x Метис Айпу | 214 TOPS | Среды, требующие усовершенствованного терморегулирования |
Интегрированные системы
В случае готовых решений Axelera сотрудничает с производителями, поставляя системы, предварительно проверенные для Metis AIPU.
- Вычислительная плата Metis: Автономное пограничное устройство, объединяющее Metis AIPU с CPU Rockchip RK3588.
- Рабочие станции: Корпоративные башни от Dell (Precision 3460XE) и Lenovo (ThinkStation P360 Ultra).
- Промышленные компьютеры: Надежные системы от Advantech и Aetina, предназначенные для автоматизации производства.
Интеграция с Voyager SDK
Voyager SDK служит связующим звеном между моделями Ultralytics и аппаратным обеспечением Axelera. Он управляет компиляцией, квантованием и выполнением нейронных сетей во время исполнения.
Ключевые особенности для пользователей Ultralytics :
- Бесшовный экспорт: Компилятор SDK оптимизирует модели YOLO для архитектуры потока данных Metis.
- Механизм квантования: Автоматически преобразует модели FP32 в INT8 с минимальной потерей точности.
- Pipeline Builder: Основанный на YAML фреймворк для создания цепочки из нескольких моделей (например, обнаружение + оценка позы) без написания сложного кода на C++.
Установка и настройка
Чтобы использовать ускорение Axelera, вам необходимо ultralytics установленный пакет. Обратите внимание, что Voyager SDK - это отдельная установка системного уровня, необходимая для взаимодействия с оборудованием. Колеса выполнения ожидаются в Q1 2026; приведенные ниже команды отражают предполагаемый порядок настройки.
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
Экспорт моделей YOLO в Axelera
Когда пакет времени выполнения Axelera будет поставлен (целевой квартал 2026 года), вы экспортируете свои обученные модели YOLO в формат Axelera с помощью стандартной команды экспорта Ultralytics . Этот процесс генерирует артефакты, необходимые компилятору Voyager.
Требуется Voyager SDK
Параметр format='axelera' экспорт требует наличия библиотек Axelera в вашей среде. В качестве альтернативы можно экспортировать в ONNX и вручную скомпилировать с помощью набора инструментов Voyager.
Примеры экспорта
Преобразование модели YOLO11 для развертывания в Metis.
Экспорт в формат Axelera
Будущий пример - будет работать, когда выйдет время выполнения
Этот блок кода демонстрирует планируемый поток. Для его успешного выполнения потребуется готовящийся к выпуску пакет времени выполнения Axelera (ETA Q1 2026).
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
Доступные аргументы см. в документации по режиму экспорта.
Запуск логического вывода
После экспорта вы сможете загрузить скомпилированную в Axelera модель напрямую с помощью функции ultralytics API (аналогично загрузке ONNX модели). В приведенном ниже примере показана ожидаемая схема использования для выполнения выводов и сохранения результатов после поставки пакета времени выполнения.
Вывод с помощью формата Axelera
Будущий пример - будет работать, когда выйдет время выполнения
Этот блок кода демонстрирует планируемый поток. Для его успешного выполнения потребуется готовящийся к выпуску пакет времени выполнения Axelera (ETA Q1 2026).
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
Производительность выводов
Metis AIPU разработан для обеспечения максимальной пропускной способности при минимальном потреблении энергии. Приведенные ниже контрольные показатели иллюстрируют производительность, достижимую при использовании стандартных моделей Ultralytics .
| Метрика | Metis PCIe x4 | Метис М.2 | Примечание |
|---|---|---|---|
| Пиковая пропускная способность | 856 TOPS | 214 TOPS | INT8 Точность |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | Вход 640x640 |
| YOLOv5s FPS | Н/Д | ~827 FPS | Вход 640x640 |
| Эффективность | Высокий | Очень высокий | Идеально подходит для питания от аккумулятора |
Бенчмарки основаны на данных Axelera AI (сентябрь 2025 года). Фактический FPS зависит от размера модели, пакетной обработки и разрешения входного сигнала.
Приложения в реальном мире
Ultralytics YOLO на оборудовании Axelera позволяет создавать передовые решения для пограничных вычислений:
- Умная розничная торговля: Подсчет объектов в реальном времени и аналитика тепловых карт для оптимизации работы магазина.
- Промышленная безопасность: Обнаружение СИЗ с малой задержкой в производственных условиях.
- Аналитика для беспилотников: Высокоскоростное обнаружение объектов на БПЛА для сельского хозяйства и поисково-спасательных работ.
- Дорожные системы: Распознавание номерных знаков по краям и оценка скорости.
Часто задаваемые вопросы
Какие версии YOLO поддерживаются на Axelera?
Voyager SDK и интеграция с Ultralytics поддерживают экспорт данных YOLOv8 и YOLO11 моделей.
Можно ли развернуть модели с пользовательским обучением?
Да. Любая модель, обученная с помощью Ultralytics Train Mode, может быть экспортирована в формат Axelera, если в ней используются поддерживаемые слои и операции.
Как квантование INT8 влияет на точность?
В механизме квантования Axelera используются передовые методы калибровки для минимизации падения точности. Для большинства задач обнаружения выигрыш в производительности значительно превосходит незначительное влияние на mAP.
Где я могу найти Voyager SDK?
SDK, драйверы и инструменты компилятора доступны на портале разработчиков Axelera.