Axelera AI 내보내기 및 배포
Ultralytics는 Axelera AI와 파트너십을 맺고 Edge AI 장치에서 고성능 및 에너지 효율적인 추론을 지원합니다. Voyager SDK를 사용하여 Ultralytics YOLO 모델을 Metis® AIPU로 직접 내보내고 배포하십시오.
Axelera AI provides dedicated hardware acceleration for computer vision at the edge, using a proprietary dataflow architecture and in-memory computing to deliver up to 856 TOPS with low power consumption.
적절한 하드웨어 선택
Axelera AI는 다양한 배포 제약 조건에 맞는 여러 폼 팩터를 제공합니다. 아래 차트는 Ultralytics YOLO 배포에 최적인 하드웨어를 식별하는 데 도움을 줍니다.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"하드웨어 포트폴리오
Axelera 하드웨어 라인업은 Ultralytics YOLO26 및 이전 버전을 높은 와트당 FPS 효율로 실행하도록 최적화되어 있습니다.
가속기 카드
이 카드들은 기존 호스트 장치에서 AI 가속을 활성화하여 브라운필드 배포를 용이하게 합니다.
| 제품 | 폼 팩터 | 컴퓨트 | 성능 (INT8) | 대상 애플리케이션 |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPU | 856 TOPS | 고밀도 비디오 분석, 스마트 시티 |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | 산업용 PC, 소매점 대기열 관리 |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | 드론, 로봇 공학, 휴대용 의료 기기 |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | 고급 열 관리가 필요한 환경 |
통합 시스템
턴키 솔루션을 위해 Axelera는 제조업체와 파트너십을 맺고 Metis AIPU용으로 사전 검증된 시스템을 제공합니다.
- Metis Compute Board: Metis AIPU와 Rockchip RK3588 ARM CPU를 결합한 독립형 엣지 장치입니다.
- 워크스테이션: Dell(Precision 3460XE) 및 Lenovo(ThinkStation P360 Ultra)의 엔터프라이즈 타워형 PC입니다.
- 산업용 PC: 제조 자동화를 위해 설계된 Advantech 및 Aetina의 견고한 시스템입니다.
지원 작업
다음 작업들은 YOLOv8, YOLO11, YOLO26 모델에서 지원됩니다.
YOLO26 segmentation is not yet supported through the Ultralytics export command. Users who need YOLO26-seg can deploy via the Voyager SDK using deploy.py, which provides a user-space workaround. Native compiler support will be added in a future release.
설치
Axelera 형식으로 내보내려면 다음이 필요합니다:
- 운영 체제: Linux 전용 (Ubuntu 22.04/24.04 권장)
- 하드웨어: Axelera AI 가속기 (Metis 장치)
- Python: 3.10, 3.11, 3.12 버전
- 시스템 종속성:
sudo apt install libgl1(OpenCV에서 필수,pip를 통해 포함되지 않음)
Ultralytics 설치
pip install ultralytics자세한 지침은 Ultralytics 설치 가이드를 참조하십시오. 어려움이 발생하면 일반 문제 가이드를 확인하십시오.
Axelera 드라이버 설치
-
Axelera 저장소 키를 추가하십시오:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg" -
apt에 저장소를 추가하십시오:
사용 중인 OS에 맞는 아래 스니펫을 선택하십시오.
# Ubuntu 22.04 sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"# Ubuntu 24.04 sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list" -
SDK를 설치하고 드라이버를 로드하십시오:
sudo apt update sudo apt install -y metis-dkms=1.4.16 sudo modprobe metis
첫 번째 yolo export format=axelera 또는 Axelera 모델을 사용한 yolo predict 실행 시 Axelera SDK 패키지가 자동으로 다운로드 및 설치됩니다. 연결 속도에 따라 몇 분 정도 소요될 수 있으며, 다운로드 중에는 진행 상황이 표시되지 않습니다. 사전에 수동으로 설치하려면 다음을 수행하십시오:
pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simpleYOLO 모델을 Axelera로 내보내기
표준 Ultralytics 내보내기 명령을 사용하여 학습된 YOLO 모델을 내보내십시오.
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model' directoryAxelera 컴파일러는 numpy<2를 요구합니다. 환경에 numpy>=2가 있는 경우, 첫 번째 yolo export는 자동으로 다운그레이드하지만 오래된 모듈 상태로 인해 내보내기가 실패합니다. 동일한 내보내기 명령을 다시 실행하십시오. 두 번째 실행에서는 성공합니다.
내보내기 인수
| 인수(Argument) | 유형(Type) | 기본값(Default) | 설명 |
|---|---|---|---|
format | str | 'axelera' | Axelera Metis AIPU 하드웨어용 대상 형식입니다. |
imgsz | int 또는 tuple | 640 | 모델 입력용 이미지 크기입니다. |
batch | int | 1 | 내보낸 모델의 배치 추론 크기 또는 predict 모드에서 내보낸 모델이 동시에 처리할 최대 이미지 수를 지정합니다. |
int8 | bool | True | AIPU를 위한 INT8 양자화를 활성화합니다. |
data | str | 'coco128.yaml' | 양자화 보정을 위한 데이터셋 구성입니다. |
fraction | float | 1.0 | 보정을 위한 데이터셋의 비율입니다 (100-400장 권장). |
device | str | None | 내보내기 장치: GPU (device=0) 또는 CPU (device=cpu)입니다. |
모든 내보내기 옵션은 내보내기 모드 문서를 참조하십시오.
출력 구조
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)추론 실행
ONNX 모델을 로드하는 것과 유사하게 Ultralytics API로 내보낸 모델을 로드하고 추론을 실행하십시오.
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display resultsAxelera AI 벤치마크
Metis AIPU는 에너지 소비를 최소화하면서 처리량을 극대화합니다.
| 모델 | Metis PCIe FPS (초당 프레임 수) | Metis M.2 FPS (초당 프레임 수) |
|---|---|---|
| YOLOv8n | 847 | 771 |
| YOLO11n | 746 | 574 |
| YOLO26n | 648.6 | 484.9 |
벤치마크는 Axelera AI 데이터를 기반으로 합니다. 실제 FPS는 모델 크기, 배치 처리, 입력 해상도에 따라 달라집니다.
실제 적용 사례
Axelera 하드웨어에서의 Ultralytics YOLO는 고급 엣지 컴퓨팅 솔루션을 지원합니다:
- 스마트 리테일: 매장 최적화를 위한 실시간 객체 계수 및 히트맵 분석.
- 산업 안전: 제조 환경에서의 저지연 PPE 감지.
- Drone Analytics: High-speed object detection on UAVs for agriculture and search-and-rescue.
- Traffic Systems: Edge-based license plate recognition and speed estimation.
권장 워크플로
- Ultralytics 학습 모드를 사용하여 모델 학습
model.export(format="axelera")를 사용하여 Axelera 형식으로 내보내기yolo val로 정확도를 검증하여 최소한의 양자화 손실 확인- 정성적 검증을 위해
yolo predict를 사용하여 예측 - Deploy to a high-performance end-to-end pipeline without PyTorch dependency — see the YOLO on Voyager SDK examples for composable Python pipelines using
axelera-rt
장치 상태 점검
Axelera 장치가 제대로 작동하는지 확인하십시오:
# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice자세한 진단 정보는 AxDevice 문서를 참조하십시오.
최고 성능
이 통합은 호환성을 위해 싱글 코어 구성을 사용합니다. 최대 처리량이 필요한 프로덕션 환경의 경우, Axelera Voyager SDK가 다음을 제공합니다:
- 멀티 코어 활용 (쿼드 코어 Metis AIPU)
- 스트리밍 추론 파이프라인
- 고해상도 카메라를 위한 타일 기반 추론
FPS 벤치마크는 model-zoo를 참조하거나 프로덕션 지원은 Axelera에 문의하십시오.
알려진 문제
- M.2 전력 제한: 대형 또는 초대형 모델은 전원 공급 장치 제약으로 인해 M.2 가속기에서 런타임 오류가 발생할 수 있습니다.
지원이 필요한 경우 Axelera 커뮤니티를 방문하십시오.
FAQ
Axelera에서 지원되는 YOLO 버전은 무엇인가요?
Voyager SDK는 YOLOv8, YOLO11 및 YOLO26 모델의 내보내기를 지원합니다. 모델별 작업 가용성은 지원되는 작업을 참조하십시오.
사용자 지정 학습 모델을 배포할 수 있나요?
네. 지원되는 레이어와 연산을 사용하는 경우, Ultralytics Train 모드를 사용하여 학습된 모든 모델을 Axelera 형식으로 내보낼 수 있습니다.
INT8 양자화가 정확도에 어떤 영향을 미치나요?
Axelera의 Voyager SDK는 혼합 정밀도 AIPU 아키텍처를 위해 모델을 자동으로 양자화합니다. 대부분의 객체 탐지 작업에서 성능 향상(더 높은 FPS, 더 낮은 전력 소모)은 mAP에 미치는 최소한의 영향보다 훨씬 큽니다. 양자화는 모델 크기에 따라 수 초에서 수 시간까지 소요됩니다. 내보내기 후 yolo val을 실행하여 정확도를 확인하십시오.
교정용 이미지는 몇 장을 사용해야 하나요?
100장에서 400장의 이미지를 권장합니다. 400장 이상은 추가적인 이점을 제공하지 않으며 양자화 시간만 증가시킵니다. 100장, 200장, 400장으로 실험하여 최적의 균형을 찾으십시오.
Voyager SDK는 어디에서 찾을 수 있나요?
SDK, 드라이버 및 컴파일러 도구는 Axelera 개발자 포털을 통해 이용할 수 있습니다.