Meet YOLO26: next-gen vision AI.

Link to this sectionAxelera AI 导出与部署#

Ultralytics 与 Axelera AI 合作,旨在实现 Edge AI 设备上的高性能、高能效推理。使用 Voyager SDKUltralytics YOLO 模型 直接导出并部署到 Metis® AIPU

YOLO 的 Axelera AI 边缘部署生态系统

Axelera AI provides dedicated hardware acceleration for computer vision at the edge, using a proprietary dataflow architecture and in-memory computing to deliver up to 856 TOPS with low power consumption.

Link to this section选择合适的硬件#

Axelera AI 提供多种外形规格,以适应不同的部署限制。下表可帮助你为 Ultralytics YOLO 部署确定最佳硬件。

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Link to this section硬件产品组合#

Axelera 硬件系列经过优化,能够以极高的每瓦 FPS 效率运行 Ultralytics YOLO26 及旧版本模型。

Link to this section加速卡#

这些加速卡支持在现有的主机设备中进行 AI 加速,从而助力 棕地部署

产品外形规格算力性能 (INT8)目标应用
Metis PCIe x4PCIe Gen3 x164x Metis AIPU856 TOPS高密度 视频分析、智慧城市
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPS工业 PC、零售 排队管理
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPS无人机、机器人、便携式医疗设备
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPS需要高级热管理的环境

Link to this section集成系统#

为提供统包解决方案,Axelera 与各制造商合作,提供已针对 Metis AIPU 进行预验证的系统。

  • Metis 计算板:一种独立的边缘设备,将 Metis AIPU 与 Rockchip RK3588 ARM CPU 配对。
  • 工作站:来自 Dell (Precision 3460XE) 和 Lenovo (ThinkStation P360 Ultra) 的企业级塔式机。
  • 工业 PC:来自 AdvantechAetina 的加固型系统,专为 制造自动化 设计。

Link to this section支持的任务#

以下任务在 YOLOv8、YOLO11 和 YOLO26 模型中均受支持。

任务YOLOv8YOLO11YOLO26
目标检测
姿态估计
实例分割⚠️ 仅限 Voyager SDK
语义分割
旋转目标检测框
分类
注意

YOLO26 分割目前尚未通过 Ultralytics export 命令支持。需要使用 YOLO26-seg 的用户可以通过 Voyager SDK 使用 deploy.py 进行部署,这提供了一种用户空间的变通方案。原生编译器支持将在未来版本中添加。

Link to this section安装#

平台要求

导出为 Axelera 格式需要:

  • 操作系统:仅限 Linux (推荐 Ubuntu 22.04/24.04)
  • 硬件:Axelera AI 加速器 (Metis 设备)
  • Python:版本 3.10、3.11、3.12 和 3.13
  • 系统依赖sudo apt install libgl1 (OpenCV 所需,不包含在 pip 中)

Link to this sectionUltralytics 安装#

pip install ultralytics

详细说明请参阅我们的 Ultralytics 安装指南。如果遇到困难,请查阅我们的 常见问题指南

Link to this sectionAxelera 驱动程序安装#

  1. 添加 Axelera 存储库密钥:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
  2. 将存储库添加到 apt:

    根据使用的操作系统从下方选择合适的代码片段。

    # Ubuntu 22.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    # Ubuntu 24.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list"
  3. 安装 SDK 并加载驱动程序:

    sudo apt update
    sudo apt install -y metis-dkms=1.4.16
    sudo modprobe metis
首次运行会自动下载 SDK

第一次运行 yolo export format=axelera 或使用 Axelera 模型进行 yolo predict 时,系统将自动下载并安装 Axelera SDK 包。根据你的网络连接速度,这可能需要几分钟,且下载过程中不显示进度。如需提前手动安装:

pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple

Link to this section将 YOLO 模型导出为 Axelera 格式#

Axelera 格式支持 导出 (Export)预测 (Predict)验证 (Validate) 模式。推理和验证在 Axelera Metis AIPU 硬件上运行。导出模型后,加载导出的模型即可运行推理或验证其准确性。

导出
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model'
预测
from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
验证
from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")
更新依赖后,首次导出可能会失败

Axelera 编译器要求 numpy<2。如果你的环境中 numpy>=2,首次 yolo export 将自动降级该包,但由于过时的模块状态,导出将会失败。只需再次运行相同的导出命令即可——它在第二次运行时将会成功。

Link to this section导出参数#

参数类型默认值描述
formatstr'axelera'Axelera Metis AIPU 硬件的目标格式。
imgszinttuple640模型输入的图像尺寸。
batchint1指定导出模型的推理批次大小,或导出模型在 predict 模式下并发处理的最大图像数量。
int8boolTrue为 AIPU 启用 INT8 量化
datastr'coco128.yaml'用于量化校准的 数据集 配置。
fractionfloat1.0用于校准的数据集比例(推荐 100-400 张图像)。
devicestrNone导出设备:GPU (device=0) 或 CPU (device=cpu)。

关于所有导出选项,请参阅 导出模式文档

Link to this section输出结构#

yolo26n_axelera_model/
├── yolo26n.axm                  # Axelera model file
├── compiler_config_final.toml  # Compiler configuration used for the build
└── metadata.yaml               # Model metadata (classes, image size, etc.)

Link to this sectionAxelera AI 基准测试#

Metis AIPU 可最大化吞吐量并同时将能耗降至最低。

模型Metis PCIe FPS (每秒帧数)Metis M.2 FPS (每秒帧数)
YOLOv8n847771
YOLO11n746574
YOLO26n648.6484.9

基准测试基于 Axelera AI 数据。实际 FPS 取决于模型大小、批处理大小和输入分辨率。

Link to this section实际应用场景#

基于 Axelera 硬件的 Ultralytics YOLO 可实现先进的边缘计算解决方案:

Link to this section推荐工作流程#

  1. 训练 (Train) 你的模型,使用 Ultralytics 训练模式
  2. 导出 (Export) 为 Axelera 格式,使用 model.export(format="axelera")
  3. 验证 准确性,使用 yolo val 以确认极小的量化损失
  4. 预测,使用 yolo predict 进行定性验证
  5. 部署 (Deploy) 到无需 PyTorch 依赖的高性能端到端管道中 — 请参阅 YOLO on Voyager SDK 示例,了解使用 axelera-rt 的可组合 Python 管道。

Link to this section设备健康检查#

验证你的 Axelera 设备是否工作正常:

# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice

有关详细诊断,请参阅 AxDevice 文档

Link to this section最高性能#

此集成为了兼容性使用了单核配置。对于需要最大吞吐量的生产环境,Axelera Voyager SDK 提供:

  • 多核利用率(四核 Metis AIPU)
  • 流式推理流水线
  • 用于更高分辨率摄像头的分块推理

查看 model-zoo 获取 FPS 基准测试,或 联系 Axelera 获取生产支持。

Link to this section已知问题#

已知限制
  • M.2 功率限制:大型或超大型模型在 M.2 加速器上可能会因供电限制而遇到运行时错误。

如需支持,请访问 Axelera Community

Link to this section常见问题解答#

Link to this sectionAxelera 支持哪些 YOLO 版本?#

Voyager SDK 支持导出 YOLOv8YOLO11YOLO26 模型。请查看 Supported Tasks 获取每个模型的任务可用性。

Link to this section我可以部署自定义训练的模型吗?#

可以。任何使用 Ultralytics Train Mode 训练的模型都可以导出为 Axelera 格式,前提是它使用了受支持的层和操作。

Link to this sectionINT8 量化如何影响精度?#

Axelera 的 Voyager SDK 会自动为混合精度 AIPU 架构量化模型。对于大多数 object detection 任务,性能提升(更高的 FPS,更低的功耗)远超对 mAP 的微小影响。量化过程根据模型大小需要几秒到几小时不等。导出后运行 yolo val 以验证精度。

Link to this section我应该使用多少张校准图像?#

我们建议使用 100 到 400 张图像。超过 400 张不会提供额外的好处,反而会增加量化时间。请尝试使用 100、200 和 400 张图像,以找到最佳平衡点。

Link to this section我可以在哪里找到 Voyager SDK?#

SDK、驱动程序和编译器工具可通过 Axelera Developer Portal 获取。

评论