Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 배포 옵션에 대한 비교 분석#

Link to this section소개#

YOLO26과 함께 긴 여정을 달려오셨습니다. 데이터를 성실히 수집하고 꼼꼼하게 라벨링했으며, 커스텀 YOLO26 모델을 학습하고 엄격하게 평가하는 데 많은 시간을 투자하셨을 것입니다. 이제 특정 애플리케이션, 유스케이스 또는 프로젝트를 위해 모델을 실제로 활용할 시점입니다. 하지만 그 전에 해결해야 할 중요한 결정 사항이 있습니다. 바로 모델을 어떻게 효과적으로 내보내고 배포할 것인가 하는 점입니다.



Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀

본 가이드는 YOLO26의 배포 옵션과 프로젝트에 적합한 옵션을 선택하기 위해 고려해야 할 필수 요소들을 안내합니다.

Link to this sectionYOLO26 모델에 적합한 배포 옵션을 선택하는 방법#

YOLO26 모델을 배포할 시기가 되면 적절한 내보내기 형식을 선택하는 것이 매우 중요합니다. Ultralytics YOLO26 모드 문서에서 설명하는 바와 같이, model.export() 함수를 사용하면 학습된 모델을 다양한 환경과 성능 요구 사항에 맞춰 여러 형식으로 변환할 수 있습니다.

이상적인 형식은 모델의 의도된 운영 컨텍스트, 즉 속도, 하드웨어 제약, 통합의 용이성 사이의 균형에 따라 결정됩니다. 수동 내보내기 없이 관리형 배포를 원하신다면 Ultralytics Platform이 43개 글로벌 지역에서 자동 확장을 지원하는 즉시 사용 가능한 추론 엔드포인트를 제공합니다. 다음 섹션에서는 각 내보내기 옵션을 자세히 살펴보고, 언제 어떤 옵션을 선택해야 할지 알아보겠습니다.

Link to this sectionYOLO26의 배포 옵션#

다양한 YOLO26 배포 옵션을 단계별로 살펴보겠습니다. 내보내기 프로세스에 대한 자세한 안내는 Ultralytics 내보내기 문서 페이지를 방문해 주시기 바랍니다.

Link to this sectionPyTorch#

PyTorch는 딥러닝인공지능 분야에서 널리 사용되는 오픈 소스 머신러닝 라이브러리입니다. 높은 수준의 유연성과 속도를 제공하여 연구자와 개발자들 사이에서 인기가 높습니다.

  • 성능 벤치마크: PyTorch는 사용 편의성과 유연성으로 잘 알려져 있으며, 더 전문화되고 최적화된 다른 프레임워크와 비교했을 때 순수 성능 면에서는 약간의 절충이 필요할 수 있습니다.
  • 호환성 및 통합: Python의 다양한 데이터 과학 및 머신러닝 라이브러리와 우수한 호환성을 제공합니다.
  • 커뮤니티 지원 및 생태계: 가장 활발한 커뮤니티 중 하나로, 학습 및 문제 해결을 위한 방대한 리소스를 보유하고 있습니다.
  • 사례 연구: 연구 프로토타입에 일반적으로 사용되며, 많은 학술 논문에서 PyTorch로 배포된 모델을 참조합니다.
  • 유지 관리 및 업데이트: 활발한 개발과 새로운 기능에 대한 지원으로 정기적인 업데이트가 제공됩니다.
  • 보안 고려 사항: 보안 문제에 대한 정기적인 패치가 제공되지만, 보안은 주로 모델이 배포되는 전반적인 환경에 의존합니다.
  • 하드웨어 가속: 모델 학습 및 추론 속도를 높이는 데 필수적인 GPU 가속을 위해 CUDA를 지원합니다.

Link to this sectionTorchScript#

TorchScript는 모델을 C++ 런타임 환경에서 실행할 수 있도록 내보내 PyTorch의 기능을 확장합니다. 이는 Python을 사용할 수 없는 프로덕션 환경에 적합합니다.

  • 성능 벤치마크: 특히 프로덕션 환경에서 일반 PyTorch보다 향상된 성능을 제공할 수 있습니다.
  • 호환성 및 통합: PyTorch에서 C++ 프로덕션 환경으로 원활하게 전환하도록 설계되었으나, 일부 고급 기능은 완벽하게 변환되지 않을 수 있습니다.
  • 커뮤니티 지원 및 생태계: PyTorch의 거대한 커뮤니티로부터 혜택을 받지만, 전문 개발자의 범위는 상대적으로 좁습니다.
  • 사례 연구: Python의 성능 오버헤드가 병목 현상이 되는 산업 환경에서 널리 사용됩니다.
  • 유지 관리 및 업데이트: PyTorch와 함께 유지 관리되며 일관된 업데이트를 제공합니다.
  • 보안 고려 사항: 전체 Python 설치 없이 모델을 실행할 수 있도록 하여 보안성을 향상시킵니다.
  • 하드웨어 가속: PyTorch의 CUDA 지원을 계승하여 효율적인 GPU 활용을 보장합니다.

Link to this sectionONNX#

Open Neural Network Exchange (ONNX)는 다양한 프레임워크 간의 모델 상호 운용성을 지원하는 형식으로, 여러 플랫폼에 배포할 때 매우 중요합니다.

  • 성능 벤치마크: ONNX 모델은 배포되는 특정 런타임에 따라 성능이 가변적일 수 있습니다.
  • 호환성 및 통합: 프레임워크에 구애받지 않는 특성 덕분에 여러 플랫폼 및 하드웨어 전반에서 높은 상호 운용성을 제공합니다.
  • 커뮤니티 지원 및 생태계: 많은 조직의 지원을 받아 광범위한 생태계와 다양한 최적화 도구를 갖추고 있습니다.
  • 사례 연구: 서로 다른 머신러닝 프레임워크 간에 모델을 이동할 때 자주 사용되며, 그 유연성을 입증합니다.
  • 유지 관리 및 업데이트: 개방형 표준인 ONNX는 새로운 연산과 모델을 지원하기 위해 정기적으로 업데이트됩니다.
  • 보안 고려 사항: 모든 크로스 플랫폼 도구와 마찬가지로 변환 및 배포 파이프라인에서 보안 관행을 준수하는 것이 필수적입니다.
  • 하드웨어 가속: ONNX Runtime을 통해 모델이 다양한 하드웨어 최적화를 활용할 수 있습니다.

Link to this sectionOpenVINO#

OpenVINO는 Intel 하드웨어 전반에서 딥러닝 모델의 배포를 용이하게 하여 성능과 속도를 향상시키도록 설계된 Intel 툴킷입니다.

  • 성능 벤치마크: Intel CPU, GPU 및 VPU에 맞게 특별히 최적화되어 호환되는 하드웨어에서 상당한 성능 향상을 제공합니다.
  • 호환성 및 통합: Intel 생태계 내에서 가장 잘 작동하지만, 다양한 다른 플랫폼도 지원합니다.
  • 커뮤니티 지원 및 생태계: Intel의 지원을 받으며, 특히 컴퓨터 비전 분야에서 탄탄한 사용자 기반을 보유하고 있습니다.
  • 사례 연구: Intel 하드웨어가 널리 보급된 IoT 및 엣지 컴퓨팅 시나리오에서 자주 활용됩니다.
  • 유지 관리 및 업데이트: Intel은 최신 딥러닝 모델과 Intel 하드웨어를 지원하기 위해 OpenVINO를 정기적으로 업데이트합니다.
  • 보안 고려 사항: 민감한 애플리케이션 배포에 적합한 강력한 보안 기능을 제공합니다.
  • 하드웨어 가속: 전용 명령어 세트와 하드웨어 기능을 활용하여 Intel 하드웨어에 맞춘 가속을 지원합니다.

OpenVINO를 사용한 배포에 대한 자세한 내용은 Ultralytics 통합 문서인 Intel OpenVINO 내보내기를 참조하십시오.

Link to this sectionTensorRT#

TensorRT는 NVIDIA의 고성능 딥러닝 추론 최적화 도구 및 런타임으로, 속도와 효율성이 필요한 애플리케이션에 이상적입니다.

  • 성능 벤치마크: NVIDIA GPU에서 최고 수준의 성능을 제공하며 고속 추론을 지원합니다.
  • 호환성 및 통합: NVIDIA 하드웨어에 가장 적합하며, 이 환경 외에서는 지원이 제한적입니다.
  • 커뮤니티 지원 및 생태계: NVIDIA의 개발자 포럼과 문서를 통해 강력한 지원 네트워크를 제공합니다.
  • 사례 연구: 비디오 및 이미지 데이터의 실시간 추론이 필요한 산업 분야에서 널리 채택되고 있습니다.
  • 유지 관리 및 업데이트: NVIDIA는 성능 향상과 새로운 GPU 아키텍처 지원을 위해 TensorRT를 자주 업데이트합니다.
  • 보안 고려 사항: 많은 NVIDIA 제품과 마찬가지로 보안에 중점을 두고 있으나, 구체적인 내용은 배포 환경에 따라 다릅니다.
  • 하드웨어 가속: NVIDIA GPU 전용으로 설계되어 심층적인 최적화 및 가속을 제공합니다.

TensorRT 배포에 대한 자세한 정보는 TensorRT 통합 가이드를 확인하십시오.

Link to this sectionCoreML#

CoreML은 iOS, macOS, watchOS, tvOS를 포함한 Apple 생태계 내 온디바이스 성능을 위해 최적화된 Apple의 머신러닝 프레임워크입니다.

  • 성능 벤치마크: 최소한의 배터리 사용으로 Apple 하드웨어에서 온디바이스 성능을 발휘하도록 최적화되었습니다.
  • 호환성 및 통합: Apple 생태계 전용으로, iOS 및 macOS 애플리케이션을 위한 간소화된 워크플로우를 제공합니다.
  • 커뮤니티 지원 및 생태계: Apple과 전용 개발자 커뮤니티의 강력한 지원을 받으며, 방대한 문서와 도구를 제공합니다.
  • 사례 연구: Apple 제품에서 온디바이스 머신러닝 기능이 필요한 애플리케이션에 일반적으로 사용됩니다.
  • 유지 관리 및 업데이트: 최신 머신러닝 발전 사항과 Apple 하드웨어를 지원하기 위해 Apple이 정기적으로 업데이트합니다.
  • 보안 고려 사항: 사용자 개인정보 보호와 데이터 보안에 대한 Apple의 집중적인 노력을 활용합니다.
  • 하드웨어 가속: Apple의 뉴럴 엔진과 GPU를 최대한 활용하여 머신러닝 작업을 가속화합니다.

Link to this sectionTF SavedModel#

TF SavedModel은 머신러닝 모델을 저장하고 서비스하기 위한 TensorFlow의 형식으로, 확장 가능한 서버 환경에 특히 적합합니다.

  • 성능 벤치마크: 특히 TensorFlow Serving과 함께 사용할 때 서버 환경에서 확장 가능한 성능을 제공합니다.
  • 호환성 및 통합: 클라우드 및 엔터프라이즈 서버 배포를 포함하여 TensorFlow 생태계 전반에서 광범위한 호환성을 제공합니다.
  • 커뮤니티 지원 및 생태계: TensorFlow의 인기 덕분에 거대한 커뮤니티 지원을 받으며, 배포 및 최적화를 위한 다양한 도구를 갖추고 있습니다.
  • 사례 연구: 딥러닝 모델을 대규모로 서비스하기 위한 프로덕션 환경에서 광범위하게 사용됩니다.
  • 유지 관리 및 업데이트: Google과 TensorFlow 커뮤니티의 지원을 받아 정기적인 업데이트와 새로운 기능을 제공합니다.
  • 보안 고려 사항: TensorFlow Serving을 사용한 배포는 엔터프라이즈급 애플리케이션을 위한 강력한 보안 기능을 포함합니다.
  • 하드웨어 가속: TensorFlow 백엔드를 통해 다양한 하드웨어 가속을 지원합니다.

Link to this sectionTF GraphDef#

TF GraphDef는 모델을 그래프로 표현하는 TensorFlow 형식으로, 정적 연산 그래프가 필요한 환경에 유리합니다.

  • 성능 벤치마크: 일관성과 신뢰성에 중점을 두고 정적 연산 그래프에 안정적인 성능을 제공합니다.
  • 호환성 및 통합: TensorFlow 인프라 내에서 쉽게 통합되지만 SavedModel에 비해 유연성이 떨어집니다.
  • 커뮤니티 지원 및 생태계: TensorFlow 생태계의 좋은 지원을 받으며, 정적 그래프 최적화를 위한 많은 리소스를 사용할 수 있습니다.
  • 사례 연구: 특정 임베디드 시스템과 같이 정적 그래프가 필요한 시나리오에서 유용합니다.
  • 유지 관리 및 업데이트: TensorFlow의 핵심 업데이트와 함께 정기적으로 업데이트됩니다.
  • 보안 고려 사항: TensorFlow의 확립된 보안 관행을 통해 안전한 배포를 보장합니다.
  • 하드웨어 가속: SavedModel만큼 유연하지는 않지만 TensorFlow의 하드웨어 가속 옵션을 활용할 수 있습니다.

TF GraphDef에 대한 자세한 내용은 TF GraphDef 통합 가이드를 참조하십시오.

Link to this sectionTF Lite#

TF Lite는 모바일 및 임베디드 기기 머신러닝을 위한 TensorFlow의 솔루션으로, 온디바이스 추론을 위한 경량 라이브러리를 제공합니다.

  • 성능 벤치마크: 모바일 및 임베디드 기기에서 속도와 효율성을 위해 설계되었습니다.
  • 호환성 및 통합: 가벼운 특성 덕분에 광범위한 기기에서 사용할 수 있습니다.
  • 커뮤니티 지원 및 생태계: Google의 지원을 받으며, 탄탄한 커뮤니티와 개발자를 위한 증가하는 리소스를 갖추고 있습니다.
  • 사례 연구: 최소한의 설치 공간으로 온디바이스 추론이 필요한 모바일 애플리케이션에서 인기가 많습니다.
  • 유지 관리 및 업데이트: 모바일 기기를 위한 최신 기능과 최적화를 포함하도록 정기적으로 업데이트됩니다.
  • 보안 고려 사항: 최종 사용자 기기에서 모델을 실행하기 위한 안전한 환경을 제공합니다.
  • 하드웨어 가속: GPU 및 DSP를 포함한 다양한 하드웨어 가속 옵션을 지원합니다.

Link to this sectionTF Edge TPU#

TF Edge TPU는 Google의 Edge TPU 하드웨어에서 고속 및 효율적인 컴퓨팅을 위해 설계되었으며, 실시간 처리가 필요한 IoT 기기에 적합합니다.

  • 성능 벤치마크: Google의 Edge TPU 하드웨어에서 고속의 효율적인 컴퓨팅을 위해 특별히 최적화되었습니다.
  • 호환성 및 통합: Edge TPU 기기에서 TensorFlow Lite 모델과 전용으로 작동합니다.
  • 커뮤니티 지원 및 생태계: Google과 서드파티 개발자가 제공하는 리소스로 지원이 확대되고 있습니다.
  • 사례 연구: 낮은 지연 시간으로 실시간 처리가 필요한 IoT 기기 및 애플리케이션에 사용됩니다.
  • 유지 관리 및 업데이트: 새로운 Edge TPU 하드웨어 릴리스의 기능을 활용하기 위해 지속적으로 개선됩니다.
  • 보안 고려 사항: IoT 및 엣지 기기를 위한 Google의 강력한 보안과 통합됩니다.
  • 하드웨어 가속: Google Coral 기기를 최대한 활용하도록 맞춤 설계되었습니다.

Link to this sectionHailo HEF#

Hailo HEF는 Hailo-8, Hailo-8L 및 Hailo-15 기기를 포함한 Hailo AI 가속기를 위한 컴파일된 실행 파일 형식입니다. Ultralytics YOLO 탐지 모델은 먼저 ONNX로 내보낸 다음, 외부 Hailo Dataflow Compiler를 사용하여 HEF로 컴파일됩니다. HEF는 직접적인 Ultralytics 내보내기 대상이 아니므로, 지원되는 엣지 가속 워크플로우를 보려면 Axelera AIDeepX를 먼저 비교하십시오.

  • 성능 벤치마크: Hailo 하드웨어, Hailo SDK 버전, 모델 스크립트, NMS 구성 및 보정 데이터에 따라 달라집니다.
  • 호환성 및 통합: Hailo 기반 임베디드 시스템, 산업용 게이트웨이 및 Raspberry Pi AI Kit 배포 전용입니다.
  • 커뮤니티 지원 및 생태계: Hailo Developer Zone, HailoRT, TAPPAS, Hailo Model Zoo를 통해 지원됩니다.
  • 사례 연구: 카메라, 로봇 공학, 출입 통제, 스마트 시티 및 산업용 검사 장치에서의 실시간 객체 탐지에 유용합니다.
  • 유지보수 및 업데이트: 새로운 가속기 타겟을 위한 Hailo SDK, 펌웨어 및 모델 주(model-zoo) 업데이트에 의존합니다.
  • 보안 고려 사항: 데이터가 엣지에 유지되는 로컬 온디바이스 추론을 지원합니다.
  • 하드웨어 가속: 컴파일된 HEF 아티팩트를 통해 Hailo NPU 실행을 사용합니다.

단계별 워크플로우는 Hailo 통합 가이드를 참조하십시오.

Link to this sectionTF.js#

TensorFlow.js (TF.js)는 머신 러닝 기능을 브라우저로 직접 가져오는 라이브러리로, 웹 개발자와 사용자 모두에게 새로운 가능성의 영역을 제공합니다. 이를 통해 백엔드 인프라 없이도 웹 애플리케이션에 머신 러닝 모델을 통합할 수 있습니다.

  • 성능 벤치마크: 클라이언트 기기에 따라 합리적인 성능으로 브라우저에서 직접 머신 러닝을 활성화합니다.
  • 호환성 및 통합: 웹 기술과의 호환성이 뛰어나 웹 애플리케이션에 쉽게 통합할 수 있습니다.
  • 커뮤니티 지원 및 생태계: 웹 및 Node.js 개발자 커뮤니티의 지원을 받으며, 브라우저에 ML 모델을 배포하기 위한 다양한 도구를 제공합니다.
  • 사례 연구: 서버 측 처리가 필요 없이 클라이언트 측 머신 러닝의 이점을 활용하는 인터랙티브 웹 애플리케이션에 이상적입니다.
  • 유지보수 및 업데이트: 오픈 소스 커뮤니티의 기여와 함께 TensorFlow 팀에서 유지관리합니다.
  • 보안 고려 사항: 브라우저의 보안 컨텍스트 내에서 실행되며, 웹 플랫폼의 보안 모델을 활용합니다.
  • 하드웨어 가속: WebGL과 같은 하드웨어 가속에 액세스하는 웹 기반 API를 통해 성능을 향상시킬 수 있습니다.

Link to this sectionPaddlePaddle#

PaddlePaddle은 Baidu에서 개발한 오픈 소스 딥 러닝 프레임워크입니다. 연구원에게는 효율적이고 개발자에게는 사용하기 쉽도록 설계되었습니다. 특히 중국에서 인기가 높으며 중국어 처리 작업에 대한 전문적인 지원을 제공합니다.

  • 성능 벤치마크: 사용 편의성과 확장성에 중점을 둔 경쟁력 있는 성능을 제공합니다.
  • 호환성 및 통합: Baidu 생태계 내에 잘 통합되어 있으며 광범위한 애플리케이션을 지원합니다.
  • 커뮤니티 지원 및 생태계: 전 세계적으로 커뮤니티 규모는 작지만 특히 중국 내에서 빠르게 성장하고 있습니다.
  • 사례 연구: 중국 시장 및 주요 프레임워크의 대안을 찾는 개발자들이 흔히 사용합니다.
  • 유지보수 및 업데이트: 중국어 AI 애플리케이션 및 서비스 제공에 중점을 두고 정기적으로 업데이트됩니다.
  • 보안 고려 사항: 중국 데이터 거버넌스 표준을 준수하며 데이터 개인정보 보호 및 보안을 강조합니다.
  • 하드웨어 가속: Baidu의 자체 Kunlun 칩을 포함하여 다양한 하드웨어 가속을 지원합니다.

Link to this sectionMNN#

MNN은 매우 효율적이고 가벼운 딥 러닝 프레임워크입니다. 딥 러닝 모델의 추론 및 학습을 지원하며 온디바이스 추론 및 학습 분야에서 업계 최고의 성능을 자랑합니다. 또한 MNN은 IoT와 같은 임베디드 기기에서도 사용됩니다.

  • 성능 벤치마크: ARM 시스템에 최적화된 모바일 기기용 고성능 모델입니다.
  • 호환성 및 통합: 모바일 및 임베디드 ARM 시스템과 X86-64 CPU 아키텍처와 잘 작동합니다.
  • 커뮤니티 지원 및 생태계: 모바일 및 임베디드 머신 러닝 커뮤니티의 지원을 받습니다.
  • 사례 연구: 모바일 시스템에서 효율적인 성능이 필요한 애플리케이션에 이상적입니다.
  • 유지보수 및 업데이트: 모바일 기기에서 높은 성능을 보장하기 위해 정기적으로 유지관리됩니다.
  • 보안 고려 사항: 데이터를 로컬에 유지함으로써 온디바이스 보안 이점을 제공합니다.
  • 하드웨어 가속: 최대 효율을 위해 ARM CPU 및 GPU에 최적화되어 있습니다.

Link to this sectionNCNN#

NCNN은 모바일 플랫폼에 최적화된 고성능 신경망 추론 프레임워크입니다. 가볍고 효율적이라는 점이 특징이며, 리소스가 제한적인 모바일 및 임베디드 기기에 특히 적합합니다.

  • 성능 벤치마크: 모바일 플랫폼에 고도로 최적화되어 있으며 ARM 기반 기기에서 효율적인 추론을 제공합니다.
  • 호환성 및 통합: ARM 아키텍처를 사용하는 휴대폰 및 임베디드 시스템 애플리케이션에 적합합니다.
  • 커뮤니티 지원 및 생태계: 모바일 및 임베디드 ML 애플리케이션에 중점을 둔 니치하지만 활발한 커뮤니티의 지원을 받습니다.
  • 사례 연구: Android 및 기타 ARM 기반 시스템에서 효율성과 속도가 중요한 모바일 애플리케이션에 선호됩니다.
  • 유지보수 및 업데이트: 다양한 ARM 기기에서 높은 성능을 유지하기 위해 지속적으로 개선됩니다.
  • 보안 고려 사항: 온디바이스 처리의 고유한 보안을 활용하여 기기 내에서 로컬로 실행하는 데 중점을 둡니다.
  • 하드웨어 가속: 이러한 아키텍처에 대한 특정 최적화와 함께 ARM CPU 및 GPU를 위해 맞춤 설계되었습니다.

Link to this sectionYOLO26 배포 옵션에 대한 비교 분석#

다음 표는 YOLO26 모델에 사용할 수 있는 다양한 배포 옵션을 요약한 것으로, 몇 가지 중요한 기준에 따라 프로젝트 요구 사항에 가장 적합한 옵션을 평가하는 데 도움이 됩니다. 각 배포 옵션의 형식에 대한 자세한 내용은 Ultralytics 내보내기 형식에 관한 문서 페이지를 참조하십시오.

배포 옵션성능 벤치마크호환성 및 통합커뮤니티 지원 및 생태계사례 연구유지보수 및 업데이트보안 고려 사항하드웨어 가속
PyTorch우수한 유연성; 원시 성능과 맞바꿀 수 있음Python 라이브러리와 우수한 호환성방대한 리소스 및 커뮤니티연구 및 프로토타입정기적이고 활발한 개발배포 환경에 따라 다름GPU 가속을 위한 CUDA 지원
TorchScriptPyTorch보다 프로덕션 환경에 더 적합함PyTorch에서 C++로의 원활한 전환전문적이지만 PyTorch보다는 범위가 좁음Python이 병목 현상인 산업 분야PyTorch와 일관된 업데이트전체 Python 없이 보안 향상PyTorch로부터 CUDA 지원 상속
ONNX런타임에 따라 다름다양한 프레임워크 전반에서 높음폭넓은 생태계, 많은 조직의 지원ML 프레임워크 간의 유연성새로운 연산을 위한 정기 업데이트안전한 변환 및 배포 관행 보장다양한 하드웨어 최적화
OpenVINOIntel 하드웨어에 최적화Intel 생태계 내에서 최고컴퓨터 비전 도메인에서 견고함Intel 하드웨어를 사용하는 IoT 및 엣지Intel 하드웨어를 위한 정기 업데이트민감한 애플리케이션을 위한 강력한 기능Intel 하드웨어에 맞춤 설계됨
TensorRTNVIDIA GPU에서 최상위 등급NVIDIA 하드웨어에 최적NVIDIA를 통한 강력한 네트워크실시간 비디오 및 이미지 추론새로운 GPU를 위한 빈번한 업데이트보안 강조NVIDIA GPU를 위해 설계됨
CoreML온디바이스 Apple 하드웨어에 최적화Apple 생태계 전용강력한 Apple 및 개발자 지원Apple 제품에서의 온디바이스 ML정기적인 Apple 업데이트개인정보 보호 및 보안에 중점Apple Neural Engine 및 GPU
TF SavedModel서버 환경에서 확장 가능TensorFlow 생태계 내에서 폭넓은 호환성TensorFlow 인기로 인한 방대한 지원대규모 모델 서빙Google 및 커뮤니티의 정기 업데이트엔터프라이즈를 위한 강력한 기능다양한 하드웨어 가속
TF GraphDef정적 계산 그래프에 대해 안정적TensorFlow 인프라와 잘 통합됨정적 그래프 최적화를 위한 리소스정적 그래프가 필요한 시나리오TensorFlow 코어와 함께 업데이트확립된 TensorFlow 보안 관행TensorFlow 가속 옵션
TF Lite모바일/임베디드 기기에서의 속도 및 효율성폭넓은 기기 지원Google이 지원하는 강력한 커뮤니티최소한의 풋프린트를 갖춘 모바일 애플리케이션모바일용 최신 기능최종 사용자 기기에서의 보안 환경GPU 및 DSP 등
TF Edge TPUGoogle의 Edge TPU 하드웨어에 최적화Edge TPU 기기 전용Google 및 타사 리소스와 함께 성장 중실시간 처리가 필요한 IoT 기기새로운 Edge TPU 하드웨어를 위한 개선 사항Google의 강력한 IoT 보안Google Coral을 위해 맞춤 설계됨
Hailo HEF하드웨어 전용 및 외부 컴파일 방식Hailo 기기 및 Raspberry Pi AI KitHailo Developer Zone 및 Model Zoo기존 Hailo 배포Hailo SDK 및 펌웨어 업데이트온디바이스 추론으로 데이터 로컬 유지HEF 아티팩트를 통한 Hailo NPU
TF.js합리적인 브라우저 내 성능웹 기술 활용 시 높음웹 및 Node.js 개발자 지원인터랙티브 웹 애플리케이션TensorFlow 팀 및 커뮤니티 기여웹 플랫폼 보안 모델WebGL 및 기타 API로 향상됨
PaddlePaddle경쟁력 있고 사용하기 쉬우며 확장 가능함Baidu 생태계, 폭넓은 애플리케이션 지원중국을 중심으로 빠르게 성장 중중국 시장 및 언어 처리중국 AI 애플리케이션에 집중데이터 개인정보 보호 및 보안 강조Baidu의 Kunlun 칩 포함
MNN모바일 기기를 위한 고성능모바일 및 임베디드 ARM 시스템과 X86-64 CPU모바일/임베디드 ML 커뮤니티모바일 시스템 효율성모바일 기기에서의 고성능 유지온디바이스 보안의 이점ARM CPU 및 GPU 최적화
NCNN모바일 ARM 기반 기기에 최적화모바일 및 임베디드 ARM 시스템틈새시장이지만 활발한 모바일/임베디드 ML 커뮤니티Android 및 ARM 시스템 효율성ARM에서의 고성능 유지온디바이스 보안의 이점ARM CPU 및 GPU 최적화

이 비교 분석은 상위 수준의 개요를 제공합니다. 배포 시 프로젝트의 특정 요구 사항과 제약 조건을 고려하고, 각 옵션에 대해 제공되는 상세 문서 및 리소스를 참조하는 것이 필수적입니다.

Link to this section커뮤니티 및 지원#

YOLO26을 시작할 때, 도움이 되는 커뮤니티와 지원은 큰 영향을 미칠 수 있습니다. 관심사를 공유하는 사람들과 소통하고 필요한 지원을 받는 방법은 다음과 같습니다.

Link to this section더 넓은 커뮤니티와 교류하기#

  • GitHub Discussions: YOLO26 repository on GitHub에는 질문을 하고, 문제를 보고하며, 개선 사항을 제안할 수 있는 "Discussions" 섹션이 있습니다.
  • Ultralytics Discord Server: Ultralytics는 Discord server를 운영하며, 이곳에서 다른 사용자 및 개발자와 교류할 수 있습니다.

Link to this section공식 문서 및 리소스#

  • Ultralytics YOLO26 Docs: 공식 문서는 YOLO26에 대한 포괄적인 개요와 함께 설치, 사용법 및 문제 해결에 대한 가이드를 제공합니다.

이러한 리소스는 문제를 해결하고 YOLO26 커뮤니티의 최신 트렌드와 모범 사례를 파악하는 데 도움이 될 것입니다.

Link to this section결론#

이 가이드에서는 YOLO26을 위한 다양한 배포 옵션을 살펴보았습니다. 또한 선택 시 고려해야 할 중요한 요소들에 대해서도 논의했습니다. 이러한 옵션을 통해 모델을 다양한 환경과 성능 요구 사항에 맞게 사용자 지정할 수 있어 실제 애플리케이션에 적합하게 만들 수 있습니다.

YOLO26 및 Ultralytics community가 귀중한 도움의 원천임을 잊지 마십시오. 다른 개발자 및 전문가와 소통하여 일반 문서에서는 찾을 수 없는 고유한 팁과 솔루션을 배워보십시오. 지식을 탐구하고, 새로운 아이디어를 탐색하며, 경험을 계속 공유해 주시기 바랍니다.

Link to this sectionFAQ#

Link to this section다양한 하드웨어 플랫폼에서 YOLO26을 배포하기 위한 옵션에는 무엇이 있습니까?#

Ultralytics YOLO26은 다양한 배포 형식을 지원하며, 각 형식은 특정 환경과 하드웨어 플랫폼을 위해 설계되었습니다. 주요 형식은 다음과 같습니다:

  • PyTorch: 연구 및 프로토타이핑용으로, 뛰어난 Python 통합 기능을 제공합니다.
  • TorchScript: Python을 사용할 수 없는 프로덕션 환경용입니다.
  • ONNX: 플랫폼 간 호환성 및 하드웨어 가속용입니다.
  • OpenVINO: Intel 하드웨어에서 최적화된 성능을 제공합니다.
  • TensorRT: NVIDIA GPU에서 고속 추론을 제공합니다.

각 형식은 고유한 장점이 있습니다. 자세한 절차는 내보내기 프로세스 문서를 참조하십시오.

Link to this sectionIntel CPU에서 YOLO26 모델의 추론 속도를 어떻게 향상합니까?#

Intel CPU에서 추론 속도를 향상하려면 Intel의 OpenVINO 툴킷을 사용하여 YOLO26 모델을 배포할 수 있습니다. OpenVINO는 모델을 최적화하여 Intel 하드웨어를 효율적으로 활용함으로써 상당한 성능 향상을 제공합니다.

  1. model.export() 함수를 사용하여 YOLO26 모델을 OpenVINO 형식으로 변환하십시오.
  2. Intel OpenVINO 내보내기 문서의 자세한 설정 가이드를 따르십시오.

더 많은 통찰력을 얻으려면 블로그 게시물을 확인하십시오.

Link to this section모바일 기기에 YOLO26 모델을 배포할 수 있습니까?#

네, YOLO26 모델은 Android 및 iOS 플랫폼 모두를 위해 TensorFlow Lite(TF Lite)를 사용하여 모바일 기기에 배포할 수 있습니다. TF Lite는 모바일 및 임베디드 기기를 위해 설계되었으며 효율적인 온디바이스 추론을 제공합니다.

예시
# Export command for TFLite format
model.export(format="tflite")

모바일에 모델을 배포하는 방법에 대한 자세한 내용은 TF Lite 통합 가이드를 참조하십시오.

Link to this sectionYOLO26 모델의 배포 형식을 선택할 때 어떤 요소를 고려해야 합니까?#

YOLO26 배포 형식을 선택할 때는 다음 요소를 고려하십시오:

  • 성능: TensorRT와 같은 형식은 NVIDIA GPU에서 뛰어난 속도를 제공하며, OpenVINO는 Intel 하드웨어에 최적화되어 있습니다.
  • 호환성: ONNX는 다양한 플랫폼에서 폭넓은 호환성을 제공합니다.
  • 통합 용이성: CoreML이나 TF Lite와 같은 형식은 각각 iOS 및 Android와 같은 특정 생태계에 맞게 조정되었습니다.
  • 커뮤니티 지원: PyTorch 및 TensorFlow와 같은 형식은 광범위한 커뮤니티 리소스와 지원을 제공합니다.

비교 분석을 보려면 내보내기 형식 문서를 참조하십시오.

Link to this section웹 애플리케이션에 YOLO26 모델을 어떻게 배포합니까?#

웹 애플리케이션에 YOLO26 모델을 배포하려면 TensorFlow.js(TF.js)를 사용할 수 있습니다. 이를 통해 브라우저에서 직접 머신러닝 모델을 실행할 수 있습니다. 이 방식은 백엔드 인프라의 필요성을 없애고 실시간 성능을 제공합니다.

  1. YOLO26 모델을 TF.js 형식으로 내보내십시오.
  2. 내보낸 모델을 웹 애플리케이션에 통합하십시오.

단계별 지침은 TensorFlow.js 통합 가이드를 참조하십시오.

댓글