Link to this sectionXuất và Triển khai trên Axelera AI#
Ultralytics hợp tác với Axelera AI để hỗ trợ suy luận hiệu suất cao, tiết kiệm năng lượng trên các thiết bị Edge AI. Xuất và triển khai Ultralytics YOLO models trực tiếp lên Metis® AIPU sử dụng Voyager SDK.
Axelera AI cung cấp tăng tốc phần cứng chuyên dụng cho computer vision tại biên, sử dụng kiến trúc luồng dữ liệu độc quyền và in-memory computing để đạt tới 856 TOPS với mức tiêu thụ điện năng thấp.
Link to this sectionChọn Phần cứng Phù hợp#
Axelera AI cung cấp nhiều kích thước (form factor) khác nhau để phù hợp với các ràng buộc triển khai khác nhau. Biểu đồ dưới đây giúp xác định phần cứng tối ưu cho việc triển khai Ultralytics YOLO của bạn.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"Link to this sectionDanh mục Phần cứng#
Dòng phần cứng Axelera được tối ưu hóa để chạy Ultralytics YOLO26 và các phiên bản cũ hơn với hiệu suất FPS-per-watt cao.
Link to this sectionThẻ Tăng tốc (Accelerator Cards)#
Các thẻ này cho phép tăng tốc AI trên các thiết bị chủ hiện có, tạo điều kiện thuận lợi cho brownfield deployments.
| Sản phẩm | Kích thước (Form Factor) | Tính toán | Hiệu suất (INT8) | Ứng dụng Mục tiêu |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | video analytics mật độ cao, thành phố thông minh |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | Máy tính công nghiệp, quản lý hàng đợi bán lẻ |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robot, thiết bị y tế di động |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Các môi trường yêu cầu quản lý nhiệt nâng cao |
Link to this sectionHệ thống Tích hợp#
Đối với các giải pháp chìa khóa trao tay, Axelera hợp tác với các nhà sản xuất để cung cấp các hệ thống đã được kiểm duyệt trước cho Metis AIPU.
- Metis Compute Board: Thiết bị biên độc lập kết hợp Metis AIPU với CPU ARM Rockchip RK3588.
- Workstations: Các máy trạm doanh nghiệp từ Dell (Precision 3460XE) và Lenovo (ThinkStation P360 Ultra).
- Industrial PCs: Các hệ thống siêu bền từ Advantech và Aetina được thiết kế cho tự động hóa sản xuất.
Link to this sectionCác tác vụ được hỗ trợ#
Các tác vụ sau đây được hỗ trợ trên các model YOLOv8, YOLO11 và YOLO26.
| Tác vụ | YOLOv8 | YOLO11 | YOLO26 |
|---|---|---|---|
| Object Detection | ✅ | ✅ | ✅ |
| Pose Estimation | ✅ | ✅ | ✅ |
| Instance Segmentation | ✅ | ✅ | ⚠️ Chỉ dành cho Voyager SDK |
| Semantic Segmentation | ❌ | ❌ | ✅ |
| Oriented Bounding Boxes | ✅ | ✅ | ✅ |
| Classification | ✅ | ✅ | ✅ |
Tính năng phân đoạn (segmentation) của YOLO26 chưa được hỗ trợ thông qua lệnh export của Ultralytics. Người dùng cần YOLO26-seg có thể triển khai qua Voyager SDK sử dụng deploy.py, đây là một giải pháp thay thế ở cấp người dùng. Hỗ trợ trình biên dịch gốc sẽ được thêm trong bản phát hành tương lai.
Link to this sectionCài đặt#
Việc xuất sang định dạng Axelera yêu cầu:
- Hệ điều hành: Chỉ Linux (khuyến nghị Ubuntu 22.04/24.04)
- Phần cứng: Bộ tăng tốc Axelera AI (Metis devices)
- Python: Các phiên bản 3.10, 3.11, 3.12 và 3.13
- Phụ thuộc hệ thống:
sudo apt install libgl1(yêu cầu bởi OpenCV, không bao gồm quapip)
Link to this sectionCài đặt Ultralytics#
pip install ultralyticsĐể biết hướng dẫn chi tiết, hãy xem Hướng dẫn Cài đặt Ultralytics của chúng tôi. Nếu bạn gặp khó khăn, hãy tham khảo Hướng dẫn các vấn đề thường gặp.
Link to this sectionCài đặt Driver Axelera#
-
Thêm khóa kho lưu trữ Axelera:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg" -
Thêm kho lưu trữ vào apt:
Chọn đoạn mã phù hợp từ bên dưới để khớp với HĐH đang sử dụng.
# Ubuntu 22.04 sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"# Ubuntu 24.04 sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list" -
Cài đặt SDK và tải driver:
sudo apt update sudo apt install -y metis-dkms=1.4.16 sudo modprobe metis
Lệnh yolo export format=axelera hoặc yolo predict đầu tiên với một model Axelera sẽ tự động tải xuống và cài đặt các gói SDK Axelera. Quá trình này có thể mất vài phút tùy thuộc vào tốc độ kết nối của bạn và không có tiến trình nào được hiển thị trong quá trình tải xuống. Để cài đặt thủ công trước đó:
pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simpleLink to this sectionXuất YOLO Models sang Axelera#
Định dạng Axelera hỗ trợ các chế độ Export, Predict và Validate. Suy luận và kiểm định chạy trên phần cứng Axelera Metis AIPU. Hãy xuất model của bạn, sau đó tải model đã xuất để chạy suy luận hoặc kiểm định độ chính xác của nó.
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model'from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")Trình biên dịch Axelera yêu cầu numpy<2. Nếu môi trường của bạn có numpy>=2, lệnh yolo export đầu tiên sẽ tự động hạ cấp nó nhưng quá trình xuất sẽ thất bại do trạng thái module cũ. Chỉ cần chạy lại cùng lệnh xuất đó — nó sẽ thành công ở lần chạy thứ hai.
Link to this sectionĐối số xuất#
| Đối số | Loại | Mặc định | Mô tả |
|---|---|---|---|
format | str | 'axelera' | Định dạng mục tiêu cho phần cứng Axelera Metis AIPU. |
imgsz | int hoặc tuple | 640 | Kích thước hình ảnh cho đầu vào model. |
batch | int | 1 | Chỉ định kích thước batch inference của model khi xuất hoặc số lượng ảnh tối đa mà model đã xuất sẽ xử lý đồng thời ở chế độ predict. |
int8 | bool | True | Bật INT8 quantization cho AIPU. |
data | str | 'coco128.yaml' | Cấu hình Dataset để hiệu chuẩn lượng tử hóa. |
fraction | float | 1.0 | Tỷ lệ tập dữ liệu để hiệu chuẩn (khuyến nghị 100-400 ảnh). |
device | str | None | Thiết bị xuất: GPU (device=0) hoặc CPU (device=cpu). |
Để xem tất cả các tùy chọn xuất, hãy tham khảo Tài liệu Chế độ Xuất.
Link to this sectionCấu trúc đầu ra#
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
├── compiler_config_final.toml # Compiler configuration used for the build
└── metadata.yaml # Model metadata (classes, image size, etc.)Link to this sectionĐiểm chuẩn Axelera AI#
Metis AIPU tối đa hóa thông lượng trong khi giảm thiểu tiêu thụ năng lượng.
| Mô hình | FPS Metis PCIe (khung hình trên giây) | FPS Metis M.2 (khung hình trên giây) |
|---|---|---|
| YOLOv8n | 847 | 771 |
| YOLO11n | 746 | 574 |
| YOLO26n | 648.6 | 484.9 |
Các điểm chuẩn dựa trên dữ liệu của Axelera AI. FPS thực tế phụ thuộc vào kích thước model, batching và độ phân giải đầu vào.
Link to this sectionỨng dụng trong thực tế#
Ultralytics YOLO trên phần cứng Axelera cho phép các giải pháp điện toán biên nâng cao:
- Smart Retail: đếm đối tượng thời gian thực và phân tích bản đồ nhiệt để tối ưu hóa cửa hàng.
- Industrial Safety: phát hiện PPE độ trễ thấp trong môi trường sản xuất.
- Drone Analytics: phát hiện đối tượng tốc độ cao trên UAV cho nông nghiệp và tìm kiếm cứu nạn.
- Traffic Systems: Edge-based license plate recognition and speed estimation.
Link to this sectionQuy trình làm việc được đề xuất#
- Huấn luyện (Train) model của bạn sử dụng Ultralytics Train Mode
- Xuất (Export) sang định dạng Axelera sử dụng
model.export(format="axelera") - Xác thực độ chính xác bằng
yolo valđể kiểm tra mức độ mất mát khi lượng tử hóa tối thiểu - Dự đoán bằng
yolo predictđể xác thực định tính - Triển khai (Deploy) lên một pipeline end-to-end hiệu suất cao mà không cần phụ thuộc PyTorch — xem Ví dụ YOLO trên Voyager SDK cho các pipeline Python có thể kết hợp sử dụng
axelera-rt
Link to this sectionKiểm tra Tình trạng Thiết bị#
Xác minh thiết bị Axelera của bạn đang hoạt động bình thường:
# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdeviceĐể biết chẩn đoán chi tiết, hãy xem Tài liệu AxDevice.
Link to this sectionHiệu suất tối đa#
Tích hợp này sử dụng cấu hình đơn nhân để đảm bảo khả năng tương thích. Đối với môi trường sản xuất yêu cầu thông lượng tối đa, Axelera Voyager SDK cung cấp:
- Tận dụng đa nhân (Metis AIPU lõi tứ)
- Các pipeline suy luận truyền phát (streaming)
- Suy luận theo ô (tiled inferencing) cho các camera có độ phân giải cao hơn
Xem model-zoo để biết các chỉ số FPS hoặc liên hệ với Axelera để được hỗ trợ sản xuất.
Link to this sectionCác vấn đề đã biết#
- Hạn chế về nguồn điện M.2: Các model lớn hoặc siêu lớn có thể gặp lỗi runtime trên các thiết bị tăng tốc M.2 do các ràng buộc về nguồn cung cấp điện.
Để được hỗ trợ, hãy truy cập Axelera Community.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionNhững phiên bản YOLO nào được hỗ trợ trên Axelera?#
Voyager SDK hỗ trợ xuất các model YOLOv8, YOLO11 và YOLO26. Xem Supported Tasks để biết khả năng hỗ trợ tác vụ cho từng model.
Link to this sectionTôi có thể triển khai các model tự huấn luyện không?#
Có. Bất kỳ model nào được huấn luyện bằng Ultralytics Train Mode đều có thể được xuất sang định dạng Axelera, miễn là model đó sử dụng các lớp và thao tác được hỗ trợ.
Link to this sectionViệc lượng tử hóa INT8 ảnh hưởng đến độ chính xác như thế nào?#
Voyager SDK của Axelera tự động lượng tử hóa các model cho kiến trúc AIPU hỗn hợp độ chính xác. Đối với hầu hết các tác vụ object detection, việc tăng hiệu suất (FPS cao hơn, tiêu thụ điện năng thấp hơn) vượt xa tác động tối thiểu đối với mAP. Quá trình lượng tử hóa mất từ vài giây đến vài giờ tùy thuộc vào kích thước model. Hãy chạy yolo val sau khi xuất để xác minh độ chính xác.
Link to this sectionTôi nên sử dụng bao nhiêu ảnh hiệu chỉnh (calibration images)?#
Chúng tôi khuyến nghị từ 100 đến 400 ảnh. Số lượng hơn 400 không mang lại lợi ích bổ sung và làm tăng thời gian lượng tử hóa. Hãy thử nghiệm với 100, 200 và 400 ảnh để tìm ra sự cân bằng tối ưu.
Link to this sectionTôi có thể tìm Voyager SDK ở đâu?#
SDK, trình điều khiển (drivers) và các công cụ biên dịch có sẵn thông qua Axelera Developer Portal.