Intel OpenVINO 내보내기

OpenVINO Intel AI inference toolkit

이 가이드에서는 YOLO26 모델을 OpenVINO 형식으로 내보내는 방법을 다룹니다. 이 형식은 CPU 속도를 최대 3배까지 향상시킬 수 있으며, Intel GPUNPU 하드웨어에서 YOLO 추론을 가속화합니다.

Open Visual Inference & Neural Network Optimization toolkit의 약자인 OpenVINO는 AI 추론 모델을 최적화하고 배포하기 위한 포괄적인 툴킷입니다. 이름에 'Visual'이 포함되어 있지만, OpenVINO는 언어, 오디오, 시계열 등을 포함한 다양한 추가 작업도 지원합니다.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

사용 예시

YOLO26n 모델을 OpenVINO 형식으로 내보내고 내보낸 모델로 추론을 실행합니다.

예시
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

# Run inference with specified device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = ov_model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")

내보내기 인수

인수유형기본값설명
formatstr'openvino'내보낸 모델의 대상 형식으로, 다양한 배포 환경과의 호환성을 정의합니다.
imgszint 또는 tuple640모델 입력에 필요한 이미지 크기입니다. 정사각형 이미지의 경우 정수를, 특정 치수의 경우 튜플 (height, width)을 사용할 수 있습니다.
halfboolFalseFP16(반정밀도) 양자화를 활성화하여 모델 크기를 줄이고 지원되는 하드웨어에서 추론 속도를 높일 수 있습니다.
int8boolFalseINT8 양자화를 활성화하여 모델을 추가로 압축하고 정확도 손실을 최소화하면서 추론 속도를 높입니다. 주로 엣지 장치용입니다.
dynamicboolFalse동적 입력 크기를 허용하여 다양한 이미지 크기를 처리할 때 유연성을 높입니다.
nmsboolFalse정확하고 효율적인 탐지 후처리에 필수적인 NMS(Non-Maximum Suppression)를 추가합니다.
batchint1내보낸 모델의 배치 추론 크기 또는 predict 모드에서 내보낸 모델이 동시에 처리할 최대 이미지 수를 지정합니다.
datastr'coco8.yaml'양자화에 필수적인 데이터셋 구성 파일 경로(기본값: coco8.yaml)입니다.
fractionfloat1.0INT8 양자화 보정에 사용할 데이터셋의 비율을 지정합니다. 전체 데이터셋의 일부만으로 보정할 수 있어 실험이나 자원이 제한된 경우 유용합니다. INT8이 활성화된 상태에서 지정하지 않으면 전체 데이터셋이 사용됩니다.

내보내기 프로세스에 대한 자세한 내용은 Ultralytics 내보내기 관련 문서 페이지를 참조하십시오.

경고

OpenVINO™는 대부분의 Intel® 프로세서와 호환되지만 최적의 성능을 보장하려면 다음을 확인하십시오:

  1. OpenVINO™ 지원 확인 Intel 호환성 목록을 사용하여 귀하의 Intel® 칩이 OpenVINO™에서 공식적으로 지원되는지 확인하십시오.

  2. 가속기 식별 Intel 하드웨어 가이드를 참조하여 프로세서에 통합 NPU(신경망 처리 장치) 또는 GPU(통합 GPU)가 포함되어 있는지 확인하십시오.

  3. 최신 드라이버 설치 칩이 NPU나 GPU를 지원하는데 OpenVINO™가 이를 감지하지 못하는 경우, 관련 드라이버를 설치하거나 업데이트해야 할 수 있습니다. 드라이버 설치 지침을 따라 전체 가속 기능을 활성화하십시오.

이 세 단계를 따르면 Intel® 하드웨어에서 OpenVINO™가 최적으로 실행되도록 보장할 수 있습니다.

OpenVINO의 이점

  1. 성능: OpenVINO는 Intel CPU, 통합 및 외장 GPU, FPGA의 성능을 활용하여 고성능 추론을 제공합니다.
  2. 이기종 실행 지원: OpenVINO는 한 번 작성하여 모든 지원되는 Intel 하드웨어(CPU, GPU, FPGA, VPU 등)에 배포할 수 있는 API를 제공합니다.
  3. Model Optimizer: OpenVINO provides a Model Optimizer that imports, converts, and optimizes models from popular deep learning frameworks such as PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle, and Caffe.
  4. 사용 편의성: 이 툴킷은 툴킷의 다양한 측면을 가르치는 80개 이상의 튜토리얼 노트북(YOLO26 최적화 포함)과 함께 제공됩니다.

OpenVINO 내보내기 구조

모델을 OpenVINO 형식으로 내보내면 다음이 포함된 디렉터리가 생성됩니다:

  1. XML 파일: 네트워크 토폴로지를 설명합니다.
  2. BIN 파일: 가중치 및 편향 이진 데이터를 포함합니다.
  3. 매핑 파일: 원본 모델 출력 텐서와 OpenVINO 텐서 이름 간의 매핑을 보유합니다.

이 파일들을 사용하여 OpenVINO 추론 엔진으로 추론을 실행할 수 있습니다.

배포 시 OpenVINO 내보내기 사용

모델이 OpenVINO 형식으로 성공적으로 내보내지면 추론 실행을 위한 두 가지 주요 옵션이 있습니다:

  1. 상위 수준 API를 제공하고 OpenVINO Runtime을 래핑하는 ultralytics 패키지를 사용합니다.

  2. 추론 동작에 대해 더 고급 또는 사용자 지정 제어를 위해 기본 openvino 패키지를 사용합니다.

Ultralytics를 이용한 추론

ultralytics 패키지를 사용하면 predict 메서드를 통해 내보낸 OpenVINO 모델을 사용하여 쉽게 추론을 실행할 수 있습니다. 또한 device 인수를 사용하여 대상 장치(예: intel:gpu, intel:npu, intel:cpu)를 지정할 수 있습니다.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

이 방식은 빠른 프로토타이핑이나 추론 파이프라인에 대한 완전한 제어가 필요하지 않은 배포에 이상적입니다.

OpenVINO Runtime을 이용한 추론

OpenVINO Runtime은 모든 지원되는 Intel 하드웨어 전반에서 추론을 위한 통합 API를 제공합니다. 또한 Intel 하드웨어 간의 부하 분산 및 비동기 실행과 같은 고급 기능을 제공합니다. 추론 실행에 대한 자세한 정보는 YOLO26 노트북을 참조하십시오.

Runtime으로 모델을 올바르게 설정하고 사용하려면 XML 및 BIN 파일뿐만 아니라 입력 크기, 정규화를 위한 스케일 계수 등과 같은 응용 프로그램별 설정이 필요하다는 점을 기억하십시오.

배포 응용 프로그램에서는 일반적으로 다음 단계를 수행합니다:

  1. core = Core()를 생성하여 OpenVINO를 초기화합니다.
  2. core.read_model() 메서드를 사용하여 모델을 로드합니다.
  3. core.compile_model() 함수를 사용하여 모델을 컴파일합니다.
  4. 입력(이미지, 텍스트, 오디오 등)을 준비합니다.
  5. compiled_model(input_data)를 사용하여 추론을 실행합니다.

더 자세한 단계와 코드 스니펫은 OpenVINO 문서 또는 API 튜토리얼을 참조하십시오.

OpenVINO YOLO26 벤치마크

Ultralytics 팀은 다양한 모델 형식과 정밀도에 걸쳐 YOLO26을 벤치마킹하여 OpenVINO와 호환되는 다양한 Intel 장치에서 속도와 정확도를 평가했습니다.

참고
  • 아래 벤치마킹 결과는 참조용이며 시스템의 정확한 하드웨어 및 소프트웨어 구성과 벤치마크 실행 당시 시스템의 현재 작업 부하에 따라 달라질 수 있습니다.

  • 모든 벤치마크는 openvino Python 패키지 버전 2026.2.0.dev20260501로 실행되었습니다. 버전 2026.2.0이 릴리스되면 안정적인 빌드로 벤치마크를 업데이트할 예정입니다.

  • NPU에서의 YOLO26 모델은 2xxV 시리즈 및 3xx 시리즈 이상의 Intel® Core™ Ultra™ 시스템에서만 지원됩니다.

Intel® Core™ Ultra

Intel® Core™ Ultra™ 시리즈는 게이머와 크리에이터부터 AI를 활용하는 전문가까지 현대 사용자의 진화하는 요구를 충족하도록 설계된 고성능 컴퓨팅의 새로운 기준을 제시합니다. 이 차세대 라인업은 단순한 기존 CPU 시리즈를 넘어 강력한 CPU 코어, 통합 고성능 GPU 기능, 그리고 전용 신경망 처리 장치(NPU)를 단일 칩 내에 결합하여 다양하고 집약적인 컴퓨팅 작업을 위한 통합 솔루션을 제공합니다.

Intel® Core Ultra™ 아키텍처의 핵심은 기존 처리 작업, GPU 가속 작업, AI 기반 작업 전반에서 탁월한 성능을 발휘하는 하이브리드 설계입니다. NPU를 포함함으로써 온디바이스 AI 추론을 강화하여 광범위한 응용 프로그램에서 더 빠르고 효율적인 기계 학습 및 데이터 처리를 지원합니다.

Core Ultra™ 제품군은 에너지 효율적인 설계부터 'H' 명칭이 붙은 고전력 변형 모델까지 다양한 성능 요구 사항에 맞춘 여러 모델을 포함하고 있으며, 이는 강력한 컴퓨팅 성능을 요구하는 노트북과 소형 폼 팩터에 이상적입니다. 라인업 전반에서 사용자는 CPU, GPU, NPU 통합의 시너지를 통해 놀라운 효율성, 응답성, 멀티태스킹 기능을 누릴 수 있습니다.

Intel의 지속적인 혁신의 일환으로 Core Ultra™ 시리즈는 미래형 컴퓨팅의 새로운 표준을 정립합니다. 여러 모델을 사용할 수 있고 더 많은 모델이 예정되어 있는 이 시리즈는 지능형 AI 강화 장치의 차세대를 위해 최첨단 솔루션을 제공하려는 Intel의 의지를 강조합니다.

아래 벤치마크는 FP32, FP16, INT8 정밀도에서 Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V 및 Intel® Core™ Ultra™ 7 155H에서 실행되었습니다.

Intel® Core™ Ultra™ X7 358H

벤치마크
Intel Core Ultra GPU benchmarks
상세 벤치마크 결과
모델형식정밀도상태크기 (MB)metrics/mAP50-95(B)추론 시간 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Intel® Core™ Ultra™ 7 258V

벤치마크
Intel Core Ultra GPU benchmarks
상세 벤치마크 결과
모델형식정밀도상태크기 (MB)metrics/mAP50-95(B)추론 시간 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Intel® Core™ Ultra™ 7 155H

벤치마크
Intel Core Ultra GPU benchmarks
상세 벤치마크 결과
모델형식정밀도상태크기 (MB)metrics/mAP50-95(B)추론 시간 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

결과 재현하기

모든 내보내기 형식에서 위 Ultralytics 벤치마크 결과를 재현하려면 다음 코드를 실행하십시오:

예시
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

벤치마크 결과는 시스템의 정확한 하드웨어 및 소프트웨어 구성과 벤치마크 실행 당시 시스템의 현재 작업 부하에 따라 다를 수 있습니다. 가장 신뢰할 수 있는 결과를 얻으려면 많은 수의 이미지가 포함된 데이터셋, 즉 data='coco.yaml'(5000개의 검증 이미지)을 사용하십시오.

결론

벤치마크 결과는 YOLO26 모델을 OpenVINO 형식으로 내보낼 때의 이점을 명확하게 보여줍니다. 다양한 모델과 하드웨어 플랫폼 전반에 걸쳐 OpenVINO 형식은 정확도를 유지하면서도 추론 속도 면에서 다른 형식을 지속적으로 능가합니다.

이 벤치마크는 딥러닝 모델 배포를 위한 도구로서 OpenVINO의 효율성을 강조합니다. 모델을 OpenVINO 형식으로 변환함으로써 개발자는 상당한 성능 향상을 달성할 수 있으며, 이를 통해 실제 애플리케이션에 해당 모델을 더 쉽게 배포할 수 있습니다.

OpenVINO 사용에 대한 자세한 정보와 지침은 공식 OpenVINO 문서를 참조하십시오.

FAQ

YOLO26 모델을 OpenVINO 형식으로 어떻게 내보내나요?

YOLO26 모델을 OpenVINO 형식으로 내보내면 CPU 속도를 크게 향상시키고 Intel 하드웨어에서 GPU 및 NPU 가속을 활성화할 수 있습니다. 내보내려면 아래와 같이 Python 또는 CLI를 사용할 수 있습니다:

예시
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

자세한 내용은 내보내기 형식 문서를 참조하십시오.

YOLO26 모델에 OpenVINO를 사용할 때의 이점은 무엇인가요?

Intel의 OpenVINO 툴킷을 YOLO26 모델과 함께 사용하면 다음과 같은 여러 이점이 있습니다:

  1. 성능: CPU 추론에서 최대 3배의 속도 향상을 달성하고 Intel GPU 및 NPU를 가속에 활용할 수 있습니다.
  2. 모델 최적화: PyTorch, TensorFlow, ONNX와 같은 인기 있는 프레임워크의 모델을 변환, 최적화 및 실행할 수 있습니다.
  3. 사용 편의성: YOLO26을 포함하여 사용자가 시작하는 데 도움이 되는 80개 이상의 튜토리얼 노트북을 제공합니다.
  4. 이종 실행: 통합 API를 사용하여 다양한 Intel 하드웨어에 모델을 배포할 수 있습니다.

자세한 성능 비교는 벤치마크 섹션을 방문하십시오.

OpenVINO로 내보낸 YOLO26 모델을 사용하여 추론을 실행하려면 어떻게 해야 하나요?

YOLO26n 모델을 OpenVINO 형식으로 내보낸 후, Python 또는 CLI를 사용하여 추론을 실행할 수 있습니다:

예시
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

자세한 내용은 예측 모드 문서를 참조하십시오.

OpenVINO 내보내기를 위해 왜 다른 모델보다 Ultralytics YOLO26을 선택해야 하나요?

Ultralytics YOLO26은 높은 정확도와 속도를 갖춘 실시간 객체 탐지를 위해 최적화되었습니다. 특히 OpenVINO와 결합했을 때 YOLO26은 다음을 제공합니다:

  • Intel CPU에서 최대 3배의 속도 향상
  • Intel GPU 및 NPU에서의 원활한 배포
  • 다양한 내보내기 형식에 걸친 일관되고 비교 가능한 정확도

심층적인 성능 분석을 위해 다양한 하드웨어에서의 자세한 YOLO26 벤치마크를 확인하십시오.

PyTorch, ONNX, OpenVINO와 같은 다양한 형식에서 YOLO26 모델을 벤치마킹할 수 있나요?

네, PyTorch, TorchScript, ONNX, OpenVINO를 포함한 다양한 형식으로 YOLO26 모델을 벤치마킹할 수 있습니다. 다음 코드 스니펫을 사용하여 선택한 데이터셋에서 벤치마크를 실행하십시오:

예시
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

자세한 벤치마크 결과는 벤치마크 섹션내보내기 형식 문서를 참조하십시오.

댓글