콘텐츠로 건너뛰기

액셀레라 AI 내보내기 및 배포

실험적 출시

이것은 Axelera Metis 하드웨어에서의 배포를 시연하는 실험적 통합입니다. 2026년 2월까지 Axelera 하드웨어 없이도 모델 내보내기가 가능하고 표준 pip 설치가 이루어지는 완전한 통합이 예상됩니다.

Ultralytics 액셀레라 AI와 Ultralytics 엣지 AI 기기에서 고성능, 에너지 효율적인 추론을 가능하게 합니다. 보이저 SDK를 사용하여 Ultralytics YOLO 메티스® AIPU로 직접 내보내고 배포하세요.

악셀레라 AI 에코시스템

액셀레라 AI는 독자적인 데이터플로우 아키텍처와 인메모리 컴퓨팅을 활용하여 에지에서 컴퓨터 비전을 위한 전용 하드웨어 가속을 제공하며, 낮은 전력 소비로 최대 856 TOPS를 구현합니다.

적합한 하드웨어 선택

Axelera AI는 다양한 배포 제약 조건에 맞는 다양한 폼 팩터를 제공합니다. 아래 차트는 Ultralytics YOLO 배포를 위한 최적의 하드웨어를 식별하는 데 도움이 됩니다.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

하드웨어 포트폴리오

Axelera 하드웨어 라인업은 다음을 실행하도록 최적화되어 있습니다. Ultralytics YOLO11 및 와트당 FPS 효율이 높은 레거시 버전을 실행하도록 최적화되어 있습니다.

액셀러레이터 카드

이 카드를 사용하면 기존 호스트 디바이스에서 AI를 가속화할 수 있어 브라운필드 배포가 용이해집니다.

제품폼 팩터계산성능(INT8)대상 애플리케이션
Metis PCIe x4PCIe Gen3 x164x Metis AIPU856 TOPS고밀도 비디오 분석, 스마트 시티
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPS산업용 PC, 소매점 대기열 관리
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, 로봇 공학, 휴대용 의료 기기
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPS고급 열 관리가 필요한 환경

통합 시스템

턴키 솔루션의 경우, Axelera는 제조업체와 협력하여 Metis AIPU에 대해 사전 검증된 시스템을 제공합니다.

  • Metis 컴퓨팅 보드: Metis AIPU와 Rockchip RK3588 ARM CPU 페어링하는 독립 실행형 에지 디바이스입니다.
  • 워크스테이션: Dell (Precision 3460XE) 및 Lenovo (ThinkStation P360 Ultra)의 엔터프라이즈 타워.
  • 산업용 PC: 제조 자동화를 위해 설계된 어드밴텍과 Aetina의 견고한 시스템.

지원되는 작업

현재 객체 탐지 모델은 Axelera 형식으로 내보낼 수 있습니다. 추가 작업이 통합 중입니다:

작업상태
객체 감지✅ 지원됨
포즈 추정곧 출시 예정
Segmentation곧 출시 예정
방향성 경계 상자곧 출시 예정

설치

플랫폼 요구 사항

Axelera 형식으로 내보내려면 다음이 필요합니다:

  • 운영 체제: Linux 전용 (Ubuntu 22.04/24.04 권장)
  • 하드웨어: Axelera AI 가속기 (Metis 장치)
  • Python: 버전 3.10 (3.11 및 3.12 곧 출시 예정)

Ultralytics 설치

pip install ultralytics

자세한 지침은 Ultralytics 가이드를 참조하십시오. 문제가 발생할 경우 일반적인 문제 해결 가이드를 참고하십시오.

액셀레라 드라이버 설치

  1. Axelera 저장소 키를 추가하세요:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. 리포지토리를 apt에 추가하세요:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. SDK를 설치하고 드라이버를 로드하십시오:

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

Axelera로 YOLO 모델 내보내기

표준 Ultralytics 명령어를 사용하여 훈련된 YOLO 내보내십시오.

악셀레라 형식으로 내보내기

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera

인수 내보내기

인수유형기본값설명
formatstr'axelera'Axelera Metis AIPU 하드웨어 대상 형식
imgszint 또는 tuple640모델 입력용 이미지 크기
int8boolTrueAIPU에 대해 INT8 양자화 활성화
datastr'coco128.yaml'양자화 보정을 위한 데이터셋 구성
fractionfloat1.0보정을 위한 데이터셋의 일부 (100-400장 권장)
devicestrNone수출 장치: GPUdevice=0) 또는 CPUdevice=cpu)

모든 내보내기 옵션에 대해서는 내보내기 모드 문서를 참조하십시오.

출력 구조

yolo11n_axelera_model/
├── yolo11n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

추론 실행

Ultralytics API로 내보낸 모델을 로드하고 추론을 실행합니다. 이는 ONNX 모델을 로드하는 것과 유사하게

Axelera 모델을 활용한 추론

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

알려진 문제

첫 번째 추론 실행은 예외를 발생시킬 수 있습니다. ImportError. 이후 실행은 정상적으로 작동할 것입니다. 이 문제는 향후 릴리스에서 해결될 예정입니다.

추론 성능

메티스 AIPU는 에너지 소비를 최소화하면서 처리량을 극대화합니다.

지표Metis PCIe x4Metis M.2참고
최대 처리량856 TOPS214 TOPSINT8 정밀도
YOLOv5m FPS~1539 FPS~326 FPS640x640 입력
YOLOv5s FPSN/A~827 FPS640x640 입력
효율성높음매우 높음배터리 전원에 이상적

Axelera AI 데이터를 기반으로 한 벤치마크 결과입니다. 실제 FPS는 모델 크기, 배치 크기 및 입력 해상도에 따라 달라집니다.

실제 응용 분야

Axelera 하드웨어의 Ultralytics YOLO 고급 에지 컴퓨팅 솔루션을 지원합니다:

  1. Ultralytics Train Mode를 사용하여 모델을 훈련하세요
  2. 내보내기 Axelera 형식으로 변환하여 model.export(format="axelera")
  3. 유효성 검사 정확성으로 yolo val 최소 양자화 손실을 검증하기 위해
  4. 예측 사용 yolo predict 질적 검증을 위해

기기 상태 점검

Axelera 장치가 정상적으로 작동하는지 확인하십시오:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

자세한 진단 정보는 AxDevice 문서를 참조하십시오.

최대 성능

이 통합은 호환성을 위해 단일 코어 구성을 사용합니다. 최대 처리량이 필요한 프로덕션 환경을 위해 Axelera Voyager SDK는 다음을 제공합니다:

  • 다중 코어 활용 (쿼드 코어 메티스 AIPU)
  • 스트리밍 추론 파이프라인
  • 고해상도 카메라를 위한 타일링 추론

FPS 벤치마크는 모델-주(model-zoo) 를 참조하거나, 생산 지원은 Axelera에 문의하십시오.

알려진 문제점

알려진 제한 사항

  • PyTorch .9 호환성: 첫 번째 yolo export format=axelera PyTorch 자동으로 2.8 버전으로 PyTorch 명령어가 실패할 수 있습니다. 성공하려면 명령어를 다시 실행하십시오.

  • M.2 전원 제한 사항: 대형 또는 초대형 모델은 전원 공급 장치 제약으로 인해 M.2 가속기에서 런타임 오류가 발생할 수 있습니다.

  • 첫 번째 추론 ImportError첫 번째 추론 실행은 예외를 발생시킬 수 있습니다. ImportError. 이후 실행은 정상적으로 작동합니다.

지원이 필요하시면 Axelera 커뮤니티를 방문해 주세요.

FAQ

악셀레라에서 지원되는 YOLO 버전은 무엇인가요?

Voyager SDK는 다음의 내보내기를 지원합니다. YOLOv8YOLO11 모델의 내보내기를 지원합니다.

사용자 정의로 훈련된 모델을 배포할 수 있나요?

예. 지원되는 레이어와 연산을 사용하는 경우 Ultralytics 훈련 모드를 사용하여 훈련된 모든 모델을 Axelera 형식으로 내보낼 수 있습니다.

INT8 양자화는 정확도에 어떤 영향을 미치나요?

Axelera의 Voyager SDK는 혼합 정밀도 AIPU 아키텍처를 위해 모델을 자동으로 양자화합니다. 대부분의 경우 객체 감지 작업에서 성능 향상(더 높은 FPS, 더 낮은 전력)은 최소한의 영향보다 훨씬 더 크다. mAP양자화는 모델 크기에 따라 몇 초에서 몇 시간까지 소요됩니다. 실행 yolo val 수출 후 정확성을 확인하기 위해.

교정 이미지를 몇 장 사용해야 하나요?

100개에서 400개 사이의 이미지를 권장합니다. 400개를 초과하면 추가적인 이점이 없으며 양자화 시간이 증가합니다. 최적의 균형을 찾기 위해 100개, 200개, 400개 이미지로 실험해 보십시오.

Voyager SDK는 어디에서 찾을 수 있나요?

SDK, 드라이버 및 컴파일러 도구는 Axelera 개발자 포털을 통해 사용할 수 있습니다.



📅 20일 전에 생성됨 ✏️ 3일 전에 업데이트됨
glenn-jocherpderrengerambitious-octopusonuralpszr

댓글