Axelera AI 내보내기 및 배포

Ultralytics는 Axelera AI와 파트너십을 맺고 Edge AI 장치에서 고성능 및 에너지 효율적인 추론을 지원합니다. Voyager SDK를 사용하여 Ultralytics YOLO 모델Metis® AIPU로 직접 내보내고 배포하십시오.

YOLO용 Axelera AI 엣지 배포 에코시스템

Axelera AI provides dedicated hardware acceleration for computer vision at the edge, using a proprietary dataflow architecture and in-memory computing to deliver up to 856 TOPS with low power consumption.

적절한 하드웨어 선택

Axelera AI는 다양한 배포 제약 조건에 맞는 여러 폼 팩터를 제공합니다. 아래 차트는 Ultralytics YOLO 배포에 최적인 하드웨어를 식별하는 데 도움을 줍니다.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

하드웨어 포트폴리오

Axelera 하드웨어 라인업은 Ultralytics YOLO26 및 이전 버전을 높은 와트당 FPS 효율로 실행하도록 최적화되어 있습니다.

가속기 카드

이 카드들은 기존 호스트 장치에서 AI 가속을 활성화하여 브라운필드 배포를 용이하게 합니다.

제품폼 팩터컴퓨트성능 (INT8)대상 애플리케이션
Metis PCIe x4PCIe Gen3 x164x Metis AIPU856 TOPS고밀도 비디오 분석, 스마트 시티
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPS산업용 PC, 소매점 대기열 관리
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPS드론, 로봇 공학, 휴대용 의료 기기
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPS고급 열 관리가 필요한 환경

통합 시스템

턴키 솔루션을 위해 Axelera는 제조업체와 파트너십을 맺고 Metis AIPU용으로 사전 검증된 시스템을 제공합니다.

  • Metis Compute Board: Metis AIPU와 Rockchip RK3588 ARM CPU를 결합한 독립형 엣지 장치입니다.
  • 워크스테이션: Dell(Precision 3460XE) 및 Lenovo(ThinkStation P360 Ultra)의 엔터프라이즈 타워형 PC입니다.
  • 산업용 PC: 제조 자동화를 위해 설계된 AdvantechAetina의 견고한 시스템입니다.

지원 작업

다음 작업들은 YOLOv8, YOLO11, YOLO26 모델에서 지원됩니다.

태스크YOLOv8YOLO11YOLO26
객체 탐지
포즈 추정
세그멘테이션⚠️ Voyager SDK 전용
방향성 경계 상자
분류
참고

YOLO26 segmentation is not yet supported through the Ultralytics export command. Users who need YOLO26-seg can deploy via the Voyager SDK using deploy.py, which provides a user-space workaround. Native compiler support will be added in a future release.

설치

플랫폼 요구 사항

Axelera 형식으로 내보내려면 다음이 필요합니다:

  • 운영 체제: Linux 전용 (Ubuntu 22.04/24.04 권장)
  • 하드웨어: Axelera AI 가속기 (Metis 장치)
  • Python: 3.10, 3.11, 3.12 버전
  • 시스템 종속성: sudo apt install libgl1 (OpenCV에서 필수, pip를 통해 포함되지 않음)

Ultralytics 설치

pip install ultralytics

자세한 지침은 Ultralytics 설치 가이드를 참조하십시오. 어려움이 발생하면 일반 문제 가이드를 확인하십시오.

Axelera 드라이버 설치

  1. Axelera 저장소 키를 추가하십시오:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
  2. apt에 저장소를 추가하십시오:

    사용 중인 OS에 맞는 아래 스니펫을 선택하십시오.

    # Ubuntu 22.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    # Ubuntu 24.04
    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source ubuntu24 main' > /etc/apt/sources.list.d/axelera.list"
  3. SDK를 설치하고 드라이버를 로드하십시오:

    sudo apt update
    sudo apt install -y metis-dkms=1.4.16
    sudo modprobe metis
첫 실행 시 SDK가 자동으로 다운로드됩니다

첫 번째 yolo export format=axelera 또는 Axelera 모델을 사용한 yolo predict 실행 시 Axelera SDK 패키지가 자동으로 다운로드 및 설치됩니다. 연결 속도에 따라 몇 분 정도 소요될 수 있으며, 다운로드 중에는 진행 상황이 표시되지 않습니다. 사전에 수동으로 설치하려면 다음을 수행하십시오:

pip install axelera-devkit==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple
pip install axelera-rt==1.6.0 --extra-index-url https://software.axelera.ai/artifactory/api/pypi/axelera-pypi/simple

YOLO 모델을 Axelera로 내보내기

표준 Ultralytics 내보내기 명령을 사용하여 학습된 YOLO 모델을 내보내십시오.

Axelera 형식으로 내보내기
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory
종속성 업데이트 후 첫 내보내기가 실패할 수 있음

Axelera 컴파일러는 numpy<2를 요구합니다. 환경에 numpy>=2가 있는 경우, 첫 번째 yolo export는 자동으로 다운그레이드하지만 오래된 모듈 상태로 인해 내보내기가 실패합니다. 동일한 내보내기 명령을 다시 실행하십시오. 두 번째 실행에서는 성공합니다.

내보내기 인수

인수(Argument)유형(Type)기본값(Default)설명
formatstr'axelera'Axelera Metis AIPU 하드웨어용 대상 형식입니다.
imgszint 또는 tuple640모델 입력용 이미지 크기입니다.
batchint1내보낸 모델의 배치 추론 크기 또는 predict 모드에서 내보낸 모델이 동시에 처리할 최대 이미지 수를 지정합니다.
int8boolTrueAIPU를 위한 INT8 양자화를 활성화합니다.
datastr'coco128.yaml'양자화 보정을 위한 데이터셋 구성입니다.
fractionfloat1.0보정을 위한 데이터셋의 비율입니다 (100-400장 권장).
devicestrNone내보내기 장치: GPU (device=0) 또는 CPU (device=cpu)입니다.

모든 내보내기 옵션은 내보내기 모드 문서를 참조하십시오.

출력 구조

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

추론 실행

ONNX 모델을 로드하는 것과 유사하게 Ultralytics API로 내보낸 모델을 로드하고 추론을 실행하십시오.

Axelera 모델을 사용한 추론
from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

Axelera AI 벤치마크

Metis AIPU는 에너지 소비를 최소화하면서 처리량을 극대화합니다.

모델Metis PCIe FPS (초당 프레임 수)Metis M.2 FPS (초당 프레임 수)
YOLOv8n847771
YOLO11n746574
YOLO26n648.6484.9

벤치마크는 Axelera AI 데이터를 기반으로 합니다. 실제 FPS는 모델 크기, 배치 처리, 입력 해상도에 따라 달라집니다.

실제 적용 사례

Axelera 하드웨어에서의 Ultralytics YOLO는 고급 엣지 컴퓨팅 솔루션을 지원합니다:

권장 워크플로

  1. Ultralytics 학습 모드를 사용하여 모델 학습
  2. model.export(format="axelera")를 사용하여 Axelera 형식으로 내보내기
  3. yolo val로 정확도를 검증하여 최소한의 양자화 손실 확인
  4. 정성적 검증을 위해 yolo predict를 사용하여 예측
  5. Deploy to a high-performance end-to-end pipeline without PyTorch dependency — see the YOLO on Voyager SDK examples for composable Python pipelines using axelera-rt

장치 상태 점검

Axelera 장치가 제대로 작동하는지 확인하십시오:

# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice

자세한 진단 정보는 AxDevice 문서를 참조하십시오.

최고 성능

이 통합은 호환성을 위해 싱글 코어 구성을 사용합니다. 최대 처리량이 필요한 프로덕션 환경의 경우, Axelera Voyager SDK가 다음을 제공합니다:

  • 멀티 코어 활용 (쿼드 코어 Metis AIPU)
  • 스트리밍 추론 파이프라인
  • 고해상도 카메라를 위한 타일 기반 추론

FPS 벤치마크는 model-zoo를 참조하거나 프로덕션 지원은 Axelera에 문의하십시오.

알려진 문제

알려진 제한 사항
  • M.2 전력 제한: 대형 또는 초대형 모델은 전원 공급 장치 제약으로 인해 M.2 가속기에서 런타임 오류가 발생할 수 있습니다.

지원이 필요한 경우 Axelera 커뮤니티를 방문하십시오.

FAQ

Axelera에서 지원되는 YOLO 버전은 무엇인가요?

Voyager SDK는 YOLOv8, YOLO11YOLO26 모델의 내보내기를 지원합니다. 모델별 작업 가용성은 지원되는 작업을 참조하십시오.

사용자 지정 학습 모델을 배포할 수 있나요?

네. 지원되는 레이어와 연산을 사용하는 경우, Ultralytics Train 모드를 사용하여 학습된 모든 모델을 Axelera 형식으로 내보낼 수 있습니다.

INT8 양자화가 정확도에 어떤 영향을 미치나요?

Axelera의 Voyager SDK는 혼합 정밀도 AIPU 아키텍처를 위해 모델을 자동으로 양자화합니다. 대부분의 객체 탐지 작업에서 성능 향상(더 높은 FPS, 더 낮은 전력 소모)은 mAP에 미치는 최소한의 영향보다 훨씬 큽니다. 양자화는 모델 크기에 따라 수 초에서 수 시간까지 소요됩니다. 내보내기 후 yolo val을 실행하여 정확도를 확인하십시오.

교정용 이미지는 몇 장을 사용해야 하나요?

100장에서 400장의 이미지를 권장합니다. 400장 이상은 추가적인 이점을 제공하지 않으며 양자화 시간만 증가시킵니다. 100장, 200장, 400장으로 실험하여 최적의 균형을 찾으십시오.

Voyager SDK는 어디에서 찾을 수 있나요?

SDK, 드라이버 및 컴파일러 도구는 Axelera 개발자 포털을 통해 이용할 수 있습니다.

댓글