Axelera 人工智能加速
即将推出 - 2026 年第一季度
Axelera 支持 ultralytics 是 进行中.这里的示例展示了计划中的用户界面/用户体验,一旦 Axelera 运行包发布,这些示例就可以运行了。
Ultralytics 与Axelera AI合作,简化边缘 AI设备上的高性能、高能效推理。这种集成使用户能够使用Voyager SDK 直接向Metis® AIPU和Europa®平台导出和部署Ultralytics YOLO 模型。
Axelera AI为边缘计算机视觉和生成式人工智能提供专用硬件加速。他们的技术利用专有的数据流架构和内存计算,在低功耗范围内提供高吞吐量(高达856 TOPS)。
对于Ultralytics 用户来说,这为在从嵌入式无人机到边缘服务器的各种设备上部署目标检测、姿势估计 和其他YOLO 任务提供了可扩展的途径。
选择合适的硬件
Axelera AI 提供各种外形尺寸,以适应不同的部署限制。下图有助于为您的Ultralytics YOLO 部署确定最佳硬件。
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
硬件组合
Axelera 硬件阵容经过优化,可运行 Ultralytics YOLO11和传统版本的每瓦高 FPS 效率。
加速卡
这些板卡可在现有的主机设备中实现人工智能加速,从而促进棕地部署。
| 产品 | 外形尺寸 | 计算 | 性能 (INT8) | 目标应用 |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x梅蒂斯 AIPU | 856 TOPS | 高密度视频分析、智慧城市 |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x梅蒂斯 AIPU | 214 TOPS | 工业 PC、零售排队管理 |
| 梅蒂斯 M.2 | M.2 2280 M 键 | 1x梅蒂斯 AIPU | 214 TOPS | 无人机、机器人、便携式医疗设备 |
| 美蒂丝 M.2 MAX | M.2 2280 | 1x梅蒂斯 AIPU | 214 TOPS | 需要先进热管理的环境 |
集成系统
对于交钥匙解决方案,Axelera 与制造商合作,提供经过 Metis AIPU 预先验证的系统。
- Metis 计算板:将 Metis AIPU 与 Rockchip RK3588 ARMCPU 配对的独立边缘设备。
- 工作站:戴尔(Precision 3460XE)和联想(ThinkStation P360 Ultra)的企业级塔式工作站。
- 工业 PC:研华和Aetina专为制造自动化设计的坚固系统。
航海家 SDK 集成
Voyager SDK是连接Ultralytics 模型和Axelera硬件的桥梁。它处理神经网络的编译、量化和运行时执行。
Ultralytics 用户的主要功能
- 无缝导出:SDK 的编译器可针对 Metis 数据流架构优化YOLO 模型。
- 量化引擎:自动将 FP32 模型转换为INT8 精度,将精度损失降至最低。
- 管道生成器:基于 YAML 的框架,可在不编写复杂 C++ 代码的情况下连锁多个模型(例如,检测 +姿势估计 )。
安装和设置
要使用 Axelera 加速,您需要使用 ultralytics 软件包已安装。请注意,Voyager SDK 是一个单独的系统级安装程序,用于连接硬件。运行时轮预计在 Q1 2026;以下命令反映了预期的设置流程。
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
将YOLO 模型导出到 Axelera
当 Axelera 运行时软件包发布时(目标是 2026 年第一季度),您将使用标准的Ultralytics 导出命令将训练好的YOLO 模型导出为 Axelera 格式。这一过程会生成 Voyager 编译器所需的工件。
需要 Voyager SDK
字段 format='axelera' 导出要求 Axelera 库在你的环境中可用。或者,您也可以导出到 ONNX 并使用 Voyager 工具链手动编译。
导出示例
为 Metis 部署转换YOLO11 模型。
导出为 Axelera 格式
未来示例--运行时发布后即可使用
该代码块演示了计划流程。它需要即将推出的 Axelera 运行时软件包(预计 2026 年第一季度)才能成功执行。
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
有关可用参数,请参阅导出模式文档。
运行推理
导出后,您就可以直接使用 ultralytics 应用程序接口(类似于加载 ONNX 模型)。下面的示例显示了运行时软件包发布后运行推理和保存结果的预期使用模式。
使用 Axelera 格式进行推理
未来示例--运行时发布后即可使用
该代码块演示了计划流程。它需要即将推出的 Axelera 运行时软件包(预计 2026 年第一季度)才能成功执行。
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
推理性能
Metis AIPU 的设计旨在最大限度地提高吞吐量,同时最大限度地降低能耗。以下基准说明了标准Ultralytics 型号所能达到的性能。
| 指标 | Metis PCIe x4 | 梅蒂斯 M.2 | 注意 |
|---|---|---|---|
| 峰值吞吐量 | 856 TOPS | 214 TOPS | INT8 精确度 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 输入 |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 输入 |
| 效率 | 高 | 非常高 | 电池供电的理想选择 |
基准基于 Axelera AI 数据(2025 年 9 月)。实际 FPS 取决于模型大小、批处理和输入分辨率。
真实世界的应用
Axelera 硬件上的Ultralytics YOLO 实现了先进的边缘计算解决方案:
常见问题
Axelera 支持哪些YOLO 版本?
Voyager SDK 和Ultralytics 集成支持导出 YOLOv8和 YOLO11模型。
能否部署自定义训练的模型?
可以。任何使用Ultralytics 训练模式训练的模型,只要使用了支持的层和操作,都可以导出为 Axelera 格式。
INT8 量化对精度有何影响?
Axelera 的量化引擎采用先进的校准技术,最大限度地减少精度下降。对于大多数检测任务而言,性能的提升远远超过对 mAP.
在哪里可以找到 Voyager SDK?
SDK、驱动程序和编译器工具可通过Axelera 开发人员门户网站获取。