Meet YOLO26: next-gen vision AI.

Link to this sectionXuất và Triển khai trên Axelera AI#

Ultralytics hợp tác với Axelera AI để hỗ trợ suy luận hiệu suất cao, tiết kiệm năng lượng trên các thiết bị Edge AI. Xuất và triển khai Ultralytics YOLO models trực tiếp lên Metis® AIPU sử dụng Voyager SDK.

Axelera AI edge deployment ecosystem for YOLO

Axelera AI cung cấp tăng tốc phần cứng chuyên dụng cho computer vision tại biên, sử dụng kiến trúc luồng dữ liệu độc quyền và in-memory computing để đạt tới 856 TOPS với mức tiêu thụ điện năng thấp.

Link to this sectionChọn Phần cứng Phù hợp#

Axelera AI cung cấp nhiều kích thước (form factor) khác nhau để phù hợp với các ràng buộc triển khai khác nhau. Biểu đồ dưới đây giúp xác định phần cứng tối ưu cho việc triển khai Ultralytics YOLO của bạn.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Link to this sectionDanh mục Phần cứng#

Dòng phần cứng Axelera được tối ưu hóa để chạy Ultralytics YOLO26 và các phiên bản cũ hơn với hiệu suất FPS-per-watt cao.

Link to this sectionThẻ Tăng tốc (Accelerator Cards)#

Các thẻ này cho phép tăng tốc AI trên các thiết bị chủ hiện có, tạo điều kiện thuận lợi cho brownfield deployments.

Sản phẩmKích thước (Form Factor)Tính toánHiệu suất (INT8)Ứng dụng Mục tiêu
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSvideo analytics mật độ cao, thành phố thông minh
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSMáy tính công nghiệp, quản lý hàng đợi bán lẻ
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, robot, thiết bị y tế di động
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSCác môi trường yêu cầu quản lý nhiệt nâng cao

Link to this sectionHệ thống Tích hợp#

Đối với các giải pháp chìa khóa trao tay, Axelera hợp tác với các nhà sản xuất để cung cấp các hệ thống đã được kiểm duyệt trước cho Metis AIPU.

  • Metis Compute Board: Thiết bị biên độc lập kết hợp Metis AIPU với CPU ARM Rockchip RK3588.
  • Workstations: Các máy trạm doanh nghiệp từ Dell (Precision 3460XE) và Lenovo (ThinkStation P360 Ultra).
  • Industrial PCs: Các hệ thống siêu bền từ AdvantechAetina được thiết kế cho tự động hóa sản xuất.

Link to this sectionCác tác vụ được hỗ trợ#

Các tác vụ sau đây được hỗ trợ trên các model YOLOv8, YOLO11 và YOLO26.

Tác vụYOLOv8YOLO11YOLO26
Object Detection
Pose Estimation
Instance Segmentation⚠️ Chỉ dành cho Voyager SDK
Semantic Segmentation
Oriented Bounding Boxes
Classification
Lưu ý

Tính năng phân đoạn (segmentation) của YOLO26 chưa được hỗ trợ thông qua lệnh export của Ultralytics. Người dùng cần YOLO26-seg có thể triển khai qua Voyager SDK sử dụng deploy.py, đây là một giải pháp thay thế ở cấp người dùng. Hỗ trợ trình biên dịch gốc sẽ được thêm trong bản phát hành tương lai.

Link to this sectionCài đặt#

Yêu cầu Nền tảng

Việc xuất sang định dạng Axelera yêu cầu:

  • Hệ điều hành: Chỉ Linux (khuyến nghị Ubuntu 22.04/24.04)
  • Phần cứng: Bộ tăng tốc Axelera AI (Metis devices)
  • Python: Các phiên bản 3.10, 3.11, 3.12 và 3.13
  • Phụ thuộc hệ thống: sudo apt install libgl1 (yêu cầu bởi OpenCV, không bao gồm qua pip)

Link to this sectionCài đặt Ultralytics#

pip install ultralytics

Để biết hướng dẫn chi tiết, hãy xem Hướng dẫn Cài đặt Ultralytics của chúng tôi. Nếu bạn gặp khó khăn, hãy tham khảo Hướng dẫn các vấn đề thường gặp.

Link to this sectionCài đặt Driver Axelera#

  1. Thêm khóa kho lưu trữ Axelera:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
  2. Thêm kho lưu trữ vào apt:

    Chọn đoạn mã phù hợp từ bên dưới để khớp với HĐH đang sử dụng.

    # Ubuntu 22.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    # Ubuntu 24.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list"
  3. Cài đặt SDK và tải driver:

    sudo apt update
    sudo apt install -y metis-dkms=1.4.16
    sudo modprobe metis
Lần chạy đầu tiên sẽ tự động tải xuống SDK

Lệnh yolo export format=axelera hoặc yolo predict đầu tiên với một model Axelera sẽ tự động tải xuống và cài đặt các gói SDK Axelera. Quá trình này có thể mất vài phút tùy thuộc vào tốc độ kết nối của bạn và không có tiến trình nào được hiển thị trong quá trình tải xuống. Để cài đặt thủ công trước đó:

pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple

Link to this sectionXuất YOLO Models sang Axelera#

Định dạng Axelera hỗ trợ các chế độ Export, PredictValidate. Suy luận và kiểm định chạy trên phần cứng Axelera Metis AIPU. Hãy xuất model của bạn, sau đó tải model đã xuất để chạy suy luận hoặc kiểm định độ chính xác của nó.

Xuất (Export)
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model'
Dự đoán (Predict)
from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
Xác thực
from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")
Lần xuất đầu tiên có thể thất bại sau khi cập nhật phụ thuộc

Trình biên dịch Axelera yêu cầu numpy<2. Nếu môi trường của bạn có numpy>=2, lệnh yolo export đầu tiên sẽ tự động hạ cấp nó nhưng quá trình xuất sẽ thất bại do trạng thái module cũ. Chỉ cần chạy lại cùng lệnh xuất đó — nó sẽ thành công ở lần chạy thứ hai.

Link to this sectionĐối số xuất#

Đối sốLoạiMặc địnhMô tả
formatstr'axelera'Định dạng mục tiêu cho phần cứng Axelera Metis AIPU.
imgszint hoặc tuple640Kích thước hình ảnh cho đầu vào model.
batchint1Chỉ định kích thước batch inference của model khi xuất hoặc số lượng ảnh tối đa mà model đã xuất sẽ xử lý đồng thời ở chế độ predict.
int8boolTrueBật INT8 quantization cho AIPU.
datastr'coco128.yaml'Cấu hình Dataset để hiệu chuẩn lượng tử hóa.
fractionfloat1.0Tỷ lệ tập dữ liệu để hiệu chuẩn (khuyến nghị 100-400 ảnh).
devicestrNoneThiết bị xuất: GPU (device=0) hoặc CPU (device=cpu).

Để xem tất cả các tùy chọn xuất, hãy tham khảo Tài liệu Chế độ Xuất.

Link to this sectionCấu trúc đầu ra#

yolo26n_axelera_model/
├── yolo26n.axm                  # Axelera model file
├── compiler_config_final.toml  # Compiler configuration used for the build
└── metadata.yaml               # Model metadata (classes, image size, etc.)

Link to this sectionĐiểm chuẩn Axelera AI#

Metis AIPU tối đa hóa thông lượng trong khi giảm thiểu tiêu thụ năng lượng.

Mô hìnhFPS Metis PCIe (khung hình trên giây)FPS Metis M.2 (khung hình trên giây)
YOLOv8n847771
YOLO11n746574
YOLO26n648.6484.9

Các điểm chuẩn dựa trên dữ liệu của Axelera AI. FPS thực tế phụ thuộc vào kích thước model, batching và độ phân giải đầu vào.

Link to this sectionỨng dụng trong thực tế#

Ultralytics YOLO trên phần cứng Axelera cho phép các giải pháp điện toán biên nâng cao:

Link to this sectionQuy trình làm việc được đề xuất#

  1. Huấn luyện (Train) model của bạn sử dụng Ultralytics Train Mode
  2. Xuất (Export) sang định dạng Axelera sử dụng model.export(format="axelera")
  3. Xác thực độ chính xác bằng yolo val để kiểm tra mức độ mất mát khi lượng tử hóa tối thiểu
  4. Dự đoán bằng yolo predict để xác thực định tính
  5. Triển khai (Deploy) lên một pipeline end-to-end hiệu suất cao mà không cần phụ thuộc PyTorch — xem Ví dụ YOLO trên Voyager SDK cho các pipeline Python có thể kết hợp sử dụng axelera-rt

Link to this sectionKiểm tra Tình trạng Thiết bị#

Xác minh thiết bị Axelera của bạn đang hoạt động bình thường:

# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice

Để biết chẩn đoán chi tiết, hãy xem Tài liệu AxDevice.

Link to this sectionHiệu suất tối đa#

Tích hợp này sử dụng cấu hình đơn nhân để đảm bảo khả năng tương thích. Đối với môi trường sản xuất yêu cầu thông lượng tối đa, Axelera Voyager SDK cung cấp:

  • Tận dụng đa nhân (Metis AIPU lõi tứ)
  • Các pipeline suy luận truyền phát (streaming)
  • Suy luận theo ô (tiled inferencing) cho các camera có độ phân giải cao hơn

Xem model-zoo để biết các chỉ số FPS hoặc liên hệ với Axelera để được hỗ trợ sản xuất.

Link to this sectionCác vấn đề đã biết#

Các hạn chế đã biết
  • Hạn chế về nguồn điện M.2: Các model lớn hoặc siêu lớn có thể gặp lỗi runtime trên các thiết bị tăng tốc M.2 do các ràng buộc về nguồn cung cấp điện.

Để được hỗ trợ, hãy truy cập Axelera Community.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionNhững phiên bản YOLO nào được hỗ trợ trên Axelera?#

Voyager SDK hỗ trợ xuất các model YOLOv8, YOLO11YOLO26. Xem Supported Tasks để biết khả năng hỗ trợ tác vụ cho từng model.

Link to this sectionTôi có thể triển khai các model tự huấn luyện không?#

Có. Bất kỳ model nào được huấn luyện bằng Ultralytics Train Mode đều có thể được xuất sang định dạng Axelera, miễn là model đó sử dụng các lớp và thao tác được hỗ trợ.

Link to this sectionViệc lượng tử hóa INT8 ảnh hưởng đến độ chính xác như thế nào?#

Voyager SDK của Axelera tự động lượng tử hóa các model cho kiến trúc AIPU hỗn hợp độ chính xác. Đối với hầu hết các tác vụ object detection, việc tăng hiệu suất (FPS cao hơn, tiêu thụ điện năng thấp hơn) vượt xa tác động tối thiểu đối với mAP. Quá trình lượng tử hóa mất từ vài giây đến vài giờ tùy thuộc vào kích thước model. Hãy chạy yolo val sau khi xuất để xác minh độ chính xác.

Link to this sectionTôi nên sử dụng bao nhiêu ảnh hiệu chỉnh (calibration images)?#

Chúng tôi khuyến nghị từ 100 đến 400 ảnh. Số lượng hơn 400 không mang lại lợi ích bổ sung và làm tăng thời gian lượng tử hóa. Hãy thử nghiệm với 100, 200 và 400 ảnh để tìm ra sự cân bằng tối ưu.

Link to this sectionTôi có thể tìm Voyager SDK ở đâu?#

SDK, trình điều khiển (drivers) và các công cụ biên dịch có sẵn thông qua Axelera Developer Portal.

Bình luận