Axelera AI 내보내기 및 배포
실험적 릴리스
이는 Axelera Metis 하드웨어에 배포하는 것을 시연하는 실험적인 통합입니다. Axelera 하드웨어 없이 모델을 내보내고 표준 pip 설치를 통해 2026년 2월까지 완전한 통합이 예상됩니다.
Ultralytics는 Axelera AI와 협력하여 엣지 AI 장치에서 고성능, 에너지 효율적인 추론을 가능하게 합니다. Voyager SDK를 사용하여 Ultralytics YOLO 모델을 Metis® AIPU에 직접 내보내고 배포하세요.
Axelera AI는 엣지에서 컴퓨터 비전을 위한 전용 하드웨어 가속을 제공하며, 독점적인 데이터플로우 아키텍처와 인메모리 컴퓨팅을 사용하여 낮은 전력 소비로 최대 856 TOPS를 제공합니다.
올바른 하드웨어 선택
Axelera AI는 다양한 배포 제약 조건에 맞춰 여러 폼 팩터를 제공합니다. 아래 차트는 Ultralytics YOLO 배포에 최적화된 하드웨어를 식별하는 데 도움이 됩니다.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
하드웨어 포트폴리오
Axelera 하드웨어 라인업은 높은 와트당 FPS 효율성으로 Ultralytics YOLO26 및 레거시 버전을 실행하도록 최적화되어 있습니다.
가속기 카드
이 카드들은 기존 호스트 장치에서 AI 가속을 가능하게 하여 브라운필드 배포를 용이하게 합니다.
| 제품 | 폼 팩터 | 컴퓨팅 | 성능 (INT8) | 대상 애플리케이션 |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPU | 856 TOPS | 고밀도 비디오 분석, 스마트 시티 |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | 산업용 PC, 소매점 대기열 관리 |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, 로봇 공학, 휴대용 의료 기기 |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | 고급 열 관리가 필요한 환경 |
통합 시스템
턴키 솔루션을 위해 Axelera는 제조업체와 협력하여 Metis AIPU에 대해 사전 검증된 시스템을 제공합니다.
- Metis 컴퓨트 보드: Metis AIPU와 Rockchip RK3588 ARM CPU를 결합한 독립형 엣지 장치.
- 워크스테이션: Dell (Precision 3460XE) 및 Lenovo (ThinkStation P360 Ultra)의 엔터프라이즈 타워.
- 산업용 PC: 제조 자동화를 위해 설계된 Advantech 및 Aetina의 견고한 시스템.
지원되는 작업
현재 객체 detect 모델은 Axelera 형식으로 내보낼 수 있습니다. 추가 작업이 통합되고 있습니다:
| 작업 | 상태 |
|---|---|
| 객체 감지 | ✅ 지원됨 |
| 포즈 추정 | 출시 예정 |
| Segmentation | 출시 예정 |
| 지향성 바운딩 박스 | 출시 예정 |
설치
플랫폼 요구 사항
Axelera 형식으로 내보내려면 다음이 필요합니다:
- 운영 체제: Linux만 해당 (Ubuntu 22.04/24.04 권장)
- 하드웨어: Axelera AI 가속기 (Metis 장치)
- python: 버전 3.10 (3.11 및 3.12 출시 예정)
Ultralytics 설치
pip install ultralytics
자세한 지침은 Ultralytics 설치 가이드를 참조하십시오. 어려움이 발생하면 일반적인 문제 가이드를 참조하십시오.
Axelera 드라이버 설치
Axelera 저장소 키 추가:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"apt에 저장소 추가:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"SDK를 설치하고 드라이버를 로드합니다:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
YOLO 모델을 Axelera로 내보내기
표준 Ultralytics export 명령을 사용하여 학습된 YOLO 모델을 내보냅니다.
Axelera 형식으로 내보내기
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera
인수 내보내기
| 인수 | 유형 | 기본값 | 설명 |
|---|---|---|---|
format | str | 'axelera' | Axelera Metis AIPU 하드웨어용 대상 형식 |
imgsz | int 또는 tuple | 640 | 모델 입력용 이미지 크기 |
int8 | bool | True | AIPU용 INT8 양자화 활성화 |
data | str | 'coco128.yaml' | 양자화 보정을 위한 데이터셋 구성 |
fraction | float | 1.0 | 보정을 위한 데이터셋의 비율 (100-400개 이미지 권장) |
device | str | None | 내보내기 장치: GPU (device=0) 또는 CPU (device=cpu) |
모든 내보내기 옵션에 대해서는 내보내기 모드 문서를 참조하십시오.
출력 구조
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
추론 실행
내보낸 모델을 Ultralytics API로 로드하고 ONNX 모델 로드와 유사하게 추론을 실행합니다.
Axelera 모델로 추론
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
알려진 문제
첫 번째 추론 실행 시 오류가 발생할 수 있습니다 ImportError. 이후 실행은 정상적으로 작동합니다. 이 문제는 향후 릴리스에서 해결될 예정입니다.
추론 성능
Metis AIPU는 에너지 소비를 최소화하면서 처리량을 극대화합니다.
| 지표 | Metis PCIe x4 | Metis M.2 | 참고 |
|---|---|---|---|
| 최대 처리량 | 856 TOPS | 214 TOPS | INT8 정밀도 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 입력 |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 입력 |
| 효율성 | 높음 | 매우 높음 | 배터리 전원에 이상적 |
벤치마크는 Axelera AI 데이터를 기반으로 합니다. 실제 FPS는 모델 크기, 배치 처리 및 입력 해상도에 따라 달라집니다.
실제 응용 분야
Axelera 하드웨어의 Ultralytics YOLO는 고급 엣지 컴퓨팅 솔루션을 가능하게 합니다:
- 스마트 리테일: 매장 최적화를 위한 실시간 객체 계수 및 히트맵 분석.
- 산업 안전: 제조 환경에서 저지연 PPE detect.
- 드론 분석: 농업 및 수색-구조를 위한 UAV에서의 고속 객체 detect.
- 교통 시스템: 엣지 기반 번호판 인식 및 속도 추정.
권장 워크플로우
- Ultralytics 훈련 모드를 사용하여 모델을 훈련합니다.
- 내보내기 Axelera 형식으로 변환하여
model.export(format="axelera") - 유효성 검사 정확도를
yolo val최소한의 양자화 손실을 확인합니다 - 예측 사용
yolo predict정성적 검증용
장치 상태 확인
Axelera 장치가 제대로 작동하는지 확인하십시오:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
자세한 진단은 AxDevice 문서를 참조하십시오.
최대 성능
이 통합은 호환성을 위해 단일 코어 구성을 사용합니다. 최대 처리량이 필요한 프로덕션 환경의 경우, Axelera Voyager SDK는 다음을 제공합니다:
- 멀티 코어 활용 (쿼드 코어 Metis AIPU)
- 스트리밍 추론 파이프라인
- 고해상도 카메라를 위한 타일 기반 추론
FPS 벤치마크는 모델-zoo를 참조하거나 프로덕션 지원을 위해 Axelera에 문의하십시오.
알려진 문제
알려진 제한 사항
PyTorch 2.9 호환성: 첫 번째
yolo export format=axelera명령은 PyTorch가 자동으로 2.8로 다운그레이드되어 실패할 수 있습니다. 성공하려면 명령을 두 번째 실행하십시오.M.2 전원 제한: 대형 또는 초대형 모델은 전원 공급 제약으로 인해 M.2 가속기에서 런타임 오류가 발생할 수 있습니다.
첫 번째 추론 ImportError: 첫 번째 추론 실행 시 다음 오류가 발생할 수 있습니다.
ImportError. 이후 실행은 올바르게 작동합니다.
지원에 대해서는 Axelera 커뮤니티를 방문하십시오.
FAQ
Axelera에서 지원되는 YOLO 버전은 무엇인가요?
Voyager SDK는 YOLOv8 및 YOLO26 모델 내보내기를 지원합니다.
사용자 지정 학습 모델을 배포할 수 있습니까?
예. Ultralytics Train Mode를 사용하여 훈련된 모든 모델은 지원되는 레이어와 연산을 사용하는 경우 Axelera 형식으로 내보낼 수 있습니다.
INT8 양자화는 정확도에 어떤 영향을 미치나요?
Axelera의 Voyager SDK는 혼합 정밀도 AIPU 아키텍처를 위해 모델을 자동으로 양자화합니다. 대부분의 객체 감지 작업에서 성능 향상(더 높은 FPS, 더 낮은 전력)은 최소한의 영향보다 훨씬 큽니다. mAP. 양자화는 모델 크기에 따라 몇 초에서 몇 시간까지 걸립니다. 다음을 실행하십시오. yolo val 내보내기 후 정확도를 확인하십시오.
보정 이미지를 몇 개 사용해야 하나요?
100개에서 400개의 이미지를 권장합니다. 400개 이상은 추가적인 이점을 제공하지 않으며 양자화 시간을 증가시킵니다. 100개, 200개, 400개 이미지로 실험하여 최적의 균형을 찾으세요.
Voyager SDK는 어디서 찾을 수 있나요?
SDK, 드라이버 및 컴파일러 도구는 Axelera 개발자 포털을 통해 사용할 수 있습니다.