Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 대 YOLOv5#

성공적인 컴퓨터 비전 파이프라인을 프로덕션에 배포하려면 올바른 신경망 아키텍처를 선택하는 것이 매우 중요합니다. 이 페이지에서는 실시간 객체 탐지의 진화 과정에서 큰 영향력을 발휘한 두 모델인 YOLOv10YOLOv5를 비교하는 심층 기술 분석을 제공합니다. 두 모델 모두 AI 커뮤니티에 상당한 영향을 미쳤지만, 심층 학습 아키텍처 설계에 있어 서로 다른 시대와 철학을 나타냅니다.

이 가이드는 평균 정밀도(mAP), 추론 지연 시간, 매개변수 효율성 및 생태계 지원을 기준으로 이러한 아키텍처를 평가하여 사용자의 배포 요구 사항에 가장 적합한 모델을 선택하도록 돕습니다.

Link to this section모델 개요#

Link to this sectionYOLOv10: 실시간 엔드투엔드 객체 탐지#

칭화대학교 연구진이 개발한 YOLOv10은 후처리 과정을 없앰으로써 객체 탐지에 대한 새로운 접근 방식을 도입했습니다.

YOLOv10의 결정적인 돌파구는 엔드투엔드(End-to-End) NMS-Free 설계입니다. 역사적으로 YOLO 모델은 중복된 경계 상자를 필터링하기 위해 비최대 억제(NMS)에 의존해 왔습니다. YOLOv10은 NMS 없는 학습을 위해 일관된 이중 할당을 활용하며, 이는 추론 지연 시간의 변동성을 크게 줄이고 배포 로직을 단순화합니다. 또한, 이 아키텍처는 컴퓨팅 중복성을 줄이기 위해 다양한 구성 요소를 철저히 최적화하는 전체론적 효율성-정확도 기반 설계를 특징으로 합니다.

YOLOv10에 대해 더 알아보기

Link to this sectionYOLOv5: 사용 편의성의 업계 표준#

Ultralytics PyTorch 저장소가 생성된 직후 출시된 YOLOv5는 개발자들이 오픈 소스 비전 AI 프레임워크에 기대하는 바를 재정의했습니다. 이 모델은 전 세계적으로 가장 널리 배포된 아키텍처 중 하나로 남아 있습니다.

YOLOv5는 사용 편의성과 매우 잘 관리된 생태계로 유명합니다. 전체가 PyTorch로 작성되어 학습, 검증 및 ONNXTensorRT 같은 형식으로의 내보내기를 즉시 지원하는 원활한 "zero-to-hero" 경험을 제공합니다. 주로 순수 객체 탐지에 중점을 둔 YOLOv10과 달리, YOLOv5는 동일한 통합 Python API 내에서 인스턴스 분할이미지 분류를 지원하는 뛰어난 범용성을 보여줍니다.

YOLOv5에 대해 더 알아보기

Link to this section성능 및 지표 비교#

속도와 정확도 사이의 관계를 시각화하는 것은 주어진 속도 제약 조건에서 최고의 정확도를 제공하는 모델을 식별하는 데 필수적입니다. 이러한 성능 지표를 이해하는 것은 특정 하드웨어 제약 조건에 맞는 모델을 선택하는 데 기본이 됩니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this section기술 분석#

  1. 정확도(mAP): YOLOv10은 정확도 면에서 확실한 세대적 이점을 보여줍니다. 예를 들어, YOLOv10-X 모델은 54.4% mAPval를 달성하여 YOLOv5x(50.7% mAP)를 능가합니다. 이러한 비약적인 발전은 주로 2024년에 도입된 NMS-free 학습 전략과 아키텍처 개선 덕분입니다.
  2. 추론 지연 시간: YOLOv5 모델은 원시 T4 TensorRT 벤치마크(예: YOLOv5n의 경우 1.12ms)에서 매우 빠르지만, YOLOv10은 후처리 NMS 단계를 완전히 제거했습니다. 실제 엔드투엔드 배포에서 YOLOv10의 NMS-free 설계는 자율 주행 자동차 및 로봇 공학과 같은 실시간 애플리케이션에 필수적인 더욱 일관되고 결정론적인 지연 시간을 제공합니다.
  3. 매개변수 효율성: YOLOv10 모델은 매우 경쟁력 있는 성능 균형을 유지합니다. YOLOv10-S는 7.2M 매개변수만으로 46.7% mAP를 달성하는 반면, YOLOv5s는 9.1M 매개변수로 37.4% mAP를 달성합니다.
배포 팁

When deploying to edge AI devices like the NVIDIA Jetson, models without NMS logic (like YOLOv10 and YOLO26) often compile more cleanly to TensorRT, avoiding fallback operations to the CPU.

Link to this section활용 사례 및 권장 사항#

YOLOv10과 YOLOv5 중 하나를 선택하는 것은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOv10을 선택해야 할 때#

YOLOv10은 다음 용도에 강력한 선택지입니다:

  • NMS 없는 실시간 탐지: Non-Maximum Suppression 없이 엔드 투 엔드 탐지를 수행하여 배포 복잡성을 줄이는 애플리케이션.
  • 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 스케일 전반에서 추론 속도와 탐지 정확도 사이의 강력한 균형이 필요한 프로젝트.
  • 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.

Link to this sectionYOLOv5를 선택해야 하는 경우#

YOLOv5 권장 대상:

  • 검증된 프로덕션 시스템: YOLOv5의 긴 안정성 이력, 광범위한 문서, 방대한 커뮤니티 지원이 가치 있게 평가되는 기존 배포 환경.
  • 리소스가 제한된 학습: YOLOv5의 효율적인 학습 파이프라인과 낮은 메모리 요구 사항이 유리한, GPU 자원이 제한된 환경.
  • 광범위한 내보내기 형식 지원: ONNX, TensorRT, CoreML, TFLite를 포함한 다양한 형식으로 배포가 필요한 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 장점#

YOLOv10은 훌륭한 탐지 기능을 제공하지만, 학술적 저장소에 의존하는 것은 때때로 프로덕션 파이프라인을 복잡하게 만들 수 있습니다. 공식 Ultralytics Python 패키지를 사용하면 고급 기능을 비롯하여 YOLOv5와 YOLOv10을 모두 지원하는 통합 생태계에 액세스할 수 있습니다.

  • 학습 효율성: Ultralytics YOLO 아키텍처는 학습 중 메모리 요구 사항을 낮추기 위해 깊이 최적화되어 있습니다. 막대한 CUDA 메모리가 필요한 무거운 Transformer 모델(예: RT-DETR)과 달리, 일반적인 소비자용 GPU에서도 YOLOv5와 YOLOv10을 편안하게 학습시킬 수 있습니다.
  • 생태계 통합: Ultralytics 플랫폼과의 통합을 통해 개발자는 데이터 세트를 시각적으로 관리하고, Weights & Biases를 사용하여 실험을 추적하며, 하이퍼파라미터를 자동으로 조정할 수 있습니다.

Link to this section코드 예제: 원활한 학습#

Ultralytics 라이브러리를 사용하면 모델 문자열을 변경하는 것만으로 이러한 아키텍처 간의 전환이 간단해집니다. 학습 파이프라인은 데이터 증강, 스케일링 및 옵티마이저 구성을 자동으로 처리합니다.

from ultralytics import YOLO

# To use YOLOv5:
# model = YOLO("yolov5s.pt")

# To use YOLOv10:
model = YOLO("yolov10s.pt")

# Train the model on a custom dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device=0,  # Use GPU 0
)

# Export the trained model to ONNX format
path = model.export(format="onnx")

Link to this section차세대: Ultralytics YOLO26#

오늘 새로운 머신 러닝 프로젝트를 시작한다면 최신 **Ultralytics YOLO26**을 평가해 보실 것을 강력히 권장합니다. 2026년 1월에 출시된 이 모델은 지난 5년간의 최고의 혁신을 결합하여 절대적인 최신 기술(state-of-the-art)을 대표합니다.

YOLO26은 YOLOv10이 개척한 엔드투엔드(End-to-End) NMS-Free 설계를 기본적으로 통합하여 신속하고 결정론적인 배포를 보장합니다. 또한 YOLO26은 몇 가지 중요한 돌파구를 도입했습니다:

  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss) 모듈을 제거함으로써 YOLO26은 표준 CPU에서 대폭적인 속도 향상을 달성하여 모바일 배포 및 저전력 IoT 센서에 가장 적합한 선택지가 되었습니다.
  • MuSGD 옵티마이저: Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM) 학습 기법에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드를 활용합니다. 이는 YOLOv10에 사용된 AdamW 옵티마이저에 비해 매우 안정적인 학습 실행과 훨씬 가속화된 수렴을 보장합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 드론 이미지 및 항공 보안 애플리케이션에 필수적인 소형 객체 인식에서 현저한 개선을 가져옵니다.
  • 작업별 숙련도: YOLOv10은 엄격하게 경계 상자 탐지기인 반면, YOLO26은 자세 추정을 위한 RLE(Residual Log-Likelihood Estimation)와 OBB(Oriented Bounding Boxes)를 위한 특수 각도 손실을 포함하여 모든 작업에 대한 전용 아키텍처 개선 사항을 제공합니다.
추가 탐색

더 넓은 객체 탐지 분야를 탐색하고 있다면, 다른 프레임워크와 이러한 아키텍처를 비교하는 것에도 관심이 있을 수 있습니다. 더 포괄적인 벤치마킹을 위해 YOLO11 대 EfficientDet 또는 RT-DETR 대 YOLOv8에 대한 심층 분석을 확인해 보십시오.

YOLOv5의 강력한 레거시, YOLOv10의 NMS-free 혁신, 또는 YOLO26의 비교할 수 없는 최첨단 성능 중 무엇을 신뢰하든, Ultralytics 생태계는 비전 AI 애플리케이션을 신속하고 효율적으로 구현하는 데 필요한 도구를 제공합니다.

댓글