Axelera AI 내보내기 및 배포

Q: Can I deploy custom-trained models?

예. 지원되는 레이어와 연산을 사용하는 경우 Ultralytics Train Mode를 사용하여 훈련된 모든 모델은 Axelera 형식으로 내보낼 수 있습니다.

실험적 릴리스

이는 Axelera Metis 하드웨어에 배포하는 것을 시연하는 실험적인 통합입니다. Axelera 하드웨어 없이 모델을 내보내고 표준 pip 설치를 통해 2026년 2월까지 완전한 통합이 예상됩니다.

Ultralytics는 Axelera AI와 협력하여 엣지 AI 장치에서 고성능, 에너지 효율적인 추론을 가능하게 합니다. Voyager SDK를 사용하여 Ultralytics YOLO 모델을 Metis® AIPU에 직접 내보내고 배포하세요.

YOLO 위한 Axelera AI 엣지 배포 생태계

Axelera AI는 엣지에서 컴퓨터 비전을 위한 전용 하드웨어 가속을 제공하며, 독점적인 데이터플로우 아키텍처와 인메모리 컴퓨팅을 사용하여 낮은 전력 소비로 최대 856 TOPS를 제공합니다.

올바른 하드웨어 선택

Axelera AI는 다양한 배포 제약 조건에 맞춰 여러 폼 팩터를 제공합니다. 아래 차트는 Ultralytics YOLO 배포에 최적화된 하드웨어를 식별하는 데 도움이 됩니다.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

하드웨어 포트폴리오

Axelera 하드웨어 라인업은 높은 와트당 FPS 효율성으로 Ultralytics YOLO26 및 레거시 버전을 실행하도록 최적화되어 있습니다.

가속기 카드

이 카드들은 기존 호스트 장치에서 AI 가속을 가능하게 하여 브라운필드 배포를 용이하게 합니다.

제품	폼 팩터	컴퓨팅	성능 (INT8)	대상 애플리케이션
Metis PCIe x4	PCIe Gen3 x16	4x Metis AIPU	856 TOPS	고밀도 비디오 분석, 스마트 시티
Metis PCIe x1	PCIe Gen3 x1	1x Metis AIPU	214 TOPS	산업용 PC, 소매점 대기열 관리
Metis M.2	M.2 2280 M-Key	1x Metis AIPU	214 TOPS	Drones, 로봇 공학, 휴대용 의료 기기
Metis M.2 MAX	M.2 2280	1x Metis AIPU	214 TOPS	고급 열 관리가 필요한 환경

통합 시스템

턴키 솔루션을 위해 Axelera는 제조업체와 협력하여 Metis AIPU에 대해 사전 검증된 시스템을 제공합니다.

Metis 컴퓨트 보드: Metis AIPU와 Rockchip RK3588 ARM CPU를 결합한 독립형 엣지 장치.
워크스테이션: Dell (Precision 3460XE) 및 Lenovo (ThinkStation P360 Ultra)의 엔터프라이즈 타워.
산업용 PC: 제조 자동화를 위해 설계된 Advantech 및 Aetina의 견고한 시스템.

지원되는 작업

현재 객체 detect 모델은 Axelera 형식으로 내보낼 수 있습니다. 추가 작업이 통합되고 있습니다:

작업	상태
객체 감지	✅ 지원됨
포즈 추정	출시 예정
Segmentation	출시 예정
지향성 바운딩 박스	출시 예정

설치

플랫폼 요구 사항

Axelera 형식으로 내보내려면 다음이 필요합니다:

운영 체제: Linux만 해당 (Ubuntu 22.04/24.04 권장)
하드웨어: Axelera AI 가속기 (Metis 장치)
python: 버전 3.10 (3.11 및 3.12 출시 예정)

Ultralytics 설치

pip install ultralytics

자세한 지침은 Ultralytics 설치 가이드를 참조하십시오. 어려움이 발생하면 일반적인 문제 가이드를 참조하십시오.

Axelera 드라이버 설치

Axelera 저장소 키 추가:

sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"

apt에 저장소 추가:

sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"

SDK를 설치하고 드라이버를 로드합니다:

sudo apt update
sudo apt install -y axelera-voyager-sdk-base
sudo modprobe metis
yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER

YOLO 모델을 Axelera로 내보내기

표준 Ultralytics export 명령을 사용하여 학습된 YOLO 모델을 내보냅니다.

Axelera 형식으로 내보내기

PythonCLI

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory

yolo export model=yolo26n.pt format=axelera

인수 내보내기

인수	유형	기본값	설명
`format`	`str`	`'axelera'`	Axelera Metis AIPU 하드웨어용 대상 형식
`imgsz`	`int` 또는 `tuple`	`640`	모델 입력용 이미지 크기
`int8`	`bool`	`True`	AIPU용 INT8 양자화 활성화
`data`	`str`	`'coco128.yaml'`	양자화 보정을 위한 데이터셋 구성
`fraction`	`float`	`1.0`	보정을 위한 데이터셋의 비율 (100-400개 이미지 권장)
`device`	`str`	`None`	내보내기 장치: GPU (`device=0`) 또는 CPU (`device=cpu`)

모든 내보내기 옵션에 대해서는 내보내기 모드 문서를 참조하십시오.

출력 구조

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

추론 실행

내보낸 모델을 Ultralytics API로 로드하고 ONNX 모델 로드와 유사하게 추론을 실행합니다.

Axelera 모델로 추론

PythonCLI

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

알려진 문제

첫 번째 추론 실행 시 오류가 발생할 수 있습니다 ImportError. 이후 실행은 정상적으로 작동합니다. 이 문제는 향후 릴리스에서 해결될 예정입니다.

추론 성능

Metis AIPU는 에너지 소비를 최소화하면서 처리량을 극대화합니다.

지표	Metis PCIe x4	Metis M.2	참고
최대 처리량	856 TOPS	214 TOPS	INT8 정밀도
YOLOv5m FPS	~1539 FPS	~326 FPS	640x640 입력
YOLOv5s FPS	N/A	~827 FPS	640x640 입력
효율성	높음	매우 높음	배터리 전원에 이상적

벤치마크는 Axelera AI 데이터를 기반으로 합니다. 실제 FPS는 모델 크기, 배치 처리 및 입력 해상도에 따라 달라집니다.

실제 응용 분야

Axelera 하드웨어의 Ultralytics YOLO는 고급 엣지 컴퓨팅 솔루션을 가능하게 합니다:

스마트 리테일: 매장 최적화를 위한 실시간 객체 계수 및 히트맵 분석.
산업 안전: 제조 환경에서 저지연 PPE detect.
드론 분석: 농업 및 수색-구조를 위한 UAV에서의 고속 객체 detect.
교통 시스템: 엣지 기반 번호판 인식 및 속도 추정.

권장 워크플로우

Ultralytics 훈련 모드를 사용하여 모델을 훈련합니다.
내보내기 Axelera 형식으로 변환하여 model.export(format="axelera")
유효성 검사 정확도를 yolo val 최소한의 양자화 손실을 확인합니다
예측 사용 yolo predict 정성적 검증용

장치 상태 확인

Axelera 장치가 제대로 작동하는지 확인하십시오:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

자세한 진단은 AxDevice 문서를 참조하십시오.

최대 성능

이 통합은 호환성을 위해 단일 코어 구성을 사용합니다. 최대 처리량이 필요한 프로덕션 환경의 경우, Axelera Voyager SDK는 다음을 제공합니다:

멀티 코어 활용 (쿼드 코어 Metis AIPU)
스트리밍 추론 파이프라인
고해상도 카메라를 위한 타일 기반 추론

FPS 벤치마크는 모델-zoo를 참조하거나 프로덕션 지원을 위해 Axelera에 문의하십시오.

알려진 문제

알려진 제한 사항

PyTorch 2.9 호환성: 첫 번째 yolo export format=axelera 명령은 PyTorch가 자동으로 2.8로 다운그레이드되어 실패할 수 있습니다. 성공하려면 명령을 두 번째 실행하십시오.
M.2 전원 제한: 대형 또는 초대형 모델은 전원 공급 제약으로 인해 M.2 가속기에서 런타임 오류가 발생할 수 있습니다.
첫 번째 추론 ImportError: 첫 번째 추론 실행 시 다음 오류가 발생할 수 있습니다. ImportError. 이후 실행은 올바르게 작동합니다.

지원에 대해서는 Axelera 커뮤니티를 방문하십시오.

FAQ

Axelera에서 지원되는 YOLO 버전은 무엇인가요?

Voyager SDK는 YOLOv8 및 YOLO26 모델 내보내기를 지원합니다.

사용자 지정 학습 모델을 배포할 수 있습니까?

예. Ultralytics Train Mode를 사용하여 훈련된 모든 모델은 지원되는 레이어와 연산을 사용하는 경우 Axelera 형식으로 내보낼 수 있습니다.

INT8 양자화는 정확도에 어떤 영향을 미치나요?

Axelera의 Voyager SDK는 혼합 정밀도 AIPU 아키텍처를 위해 모델을 자동으로 양자화합니다. 대부분의 객체 감지 작업에서 성능 향상(더 높은 FPS, 더 낮은 전력)은 최소한의 영향보다 훨씬 큽니다. mAP. 양자화는 모델 크기에 따라 몇 초에서 몇 시간까지 걸립니다. 다음을 실행하십시오. yolo val 내보내기 후 정확도를 확인하십시오.

보정 이미지를 몇 개 사용해야 하나요?

100개에서 400개의 이미지를 권장합니다. 400개 이상은 추가적인 이점을 제공하지 않으며 양자화 시간을 증가시킵니다. 100개, 200개, 400개 이미지로 실험하여 최적의 균형을 찾으세요.

Voyager SDK는 어디서 찾을 수 있나요?

SDK, 드라이버 및 컴파일러 도구는 Axelera 개발자 포털을 통해 사용할 수 있습니다.

5; 3 전에 생성됨 ✏️ 1 개월 전에 업데이트됨

Axelera AI 내보내기 및 배포

올바른 하드웨어 선택

하드웨어 포트폴리오

가속기 카드

통합 시스템

지원되는 작업

설치

Ultralytics 설치

Axelera 드라이버 설치

YOLO 모델을 Axelera로 내보내기

인수 내보내기

출력 구조

추론 실행

추론 성능

실제 응용 분야

권장 워크플로우

장치 상태 확인

최대 성능

알려진 문제

FAQ

Axelera에서 지원되는 YOLO 버전은 무엇인가요?

사용자 지정 학습 모델을 배포할 수 있습니까?

INT8 양자화는 정확도에 어떤 영향을 미치나요?

보정 이미지를 몇 개 사용해야 하나요?

Voyager SDK는 어디서 찾을 수 있나요?

댓글