YOLOv10 대 YOLOv5: 종합적인 기술 비교

성공적인 컴퓨터 비전 파이프라인을 프로덕션 환경에 배포하려면 올바른 신경망 아키텍처를 선택하는 것이 중요합니다. 이 페이지에서는 실시간 객체 탐지 분야의 진화에 있어 매우 영향력 있는 두 모델인 YOLOv10YOLOv5를 비교하는 심층 기술 분석을 제공합니다. 두 모델 모두 AI 커뮤니티에 큰 영향을 미쳤지만, 딥러닝 아키텍처 설계에 있어 서로 다른 시대와 철학을 대표합니다.

이 가이드는 평균 정밀도(mAP), 추론 지연 시간, 매개변수 효율성 및 생태계 지원을 기준으로 이러한 아키텍처를 평가하며, 귀하의 배포 요구사항에 가장 적합한 모델을 선택하도록 돕습니다.

모델 개요

YOLOv10: 실시간 엔드투엔드 객체 탐지

칭화대학교 연구진이 개발한 YOLOv10은 후처리 과정의 필요성을 제거함으로써 객체 탐지에 대한 새로운 접근 방식을 도입했습니다.

YOLOv10의 결정적인 돌파구는 엔드투엔드 NMS-Free 설계입니다. 역사적으로 YOLO 모델들은 중복된 바운딩 박스를 필터링하기 위해 비최대 억제(NMS)에 의존해 왔습니다. YOLOv10은 NMS-Free 학습을 위해 일관된 이중 할당을 사용하여 추론 지연 시간의 변동성을 크게 줄이고 배포 로직을 단순화합니다. 또한, 이 아키텍처는 계산상의 중복을 줄이기 위해 다양한 구성 요소를 철저히 최적화하는 전체론적 효율성-정확도 기반 설계를 특징으로 합니다.

YOLOv10에 대해 더 알아보기

YOLOv5: 사용성을 위한 업계 표준

Ultralytics PyTorch 리포지토리의 시작 직후에 출시된 YOLOv5는 개발자들이 오픈소스 비전 AI 프레임워크에 기대하는 바를 재정의했습니다. 이 모델은 전 세계적으로 가장 널리 배포된 아키텍처 중 하나로 남아 있습니다.

YOLOv5는 사용 편의성과 매우 잘 관리된 생태계로 유명합니다. 전체가 PyTorch로 작성되어 학습, 검증 및 ONNXTensorRT와 같은 형식으로의 내보내기를 즉시 지원하는 원활한 "zero-to-hero" 경험을 제공했습니다. 주로 순수 객체 탐지에 초점을 맞춘 YOLOv10과 달리, YOLOv5는 동일한 통합 Python API 내에서 인스턴스 분할이미지 분류를 지원하는 뛰어난 범용성을 보여줍니다.

YOLOv5에 대해 더 알아보기

성능 및 메트릭 비교

속도와 정확도 간의 관계를 시각화하는 것은 주어진 속도 제약 조건 내에서 최상의 정확도를 제공하는 모델을 식별하는 데 필수적입니다. 이러한 성능 지표를 이해하는 것은 특정 하드웨어 제약 조건에 맞는 모델을 선택하는 데 기본이 됩니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

기술 분석

  1. 정확도(mAP): YOLOv10은 정확도 면에서 세대적인 이점을 분명히 보여줍니다. 예를 들어, YOLOv10-X 모델은 54.4%의 mAPval을 달성하여 YOLOv5x(50.7% mAP)를 능가합니다. 이러한 도약은 2024년에 도입된 NMS-Free 학습 전략과 아키텍처 개선 덕분입니다.
  2. 추론 지연 시간: YOLOv5 모델은 원시 T4 TensorRT 벤치마크에서 매우 빠르지만(예: 1.12ms의 YOLOv5n), YOLOv10은 후처리 NMS 단계를 완전히 제거합니다. 실제 엔드투엔드 배포 환경에서 YOLOv10의 NMS-Free 설계는 자율 주행 자동차 및 로봇 공학과 같은 실시간 애플리케이션에 중요한, 보다 일관되고 결정론적인 지연 시간을 제공합니다.
  3. 매개변수 효율성: YOLOv10 모델은 매우 경쟁력 있는 성능 균형을 유지합니다. YOLOv10-S는 7.2M 개의 매개변수만으로 46.7%의 mAP를 달성하는 반면, YOLOv5s는 9.1M 개의 매개변수로 37.4%의 mAP를 달성합니다.
배포 팁

When deploying to edge AI devices like the NVIDIA Jetson, models without NMS logic (like YOLOv10 and YOLO26) often compile more cleanly to TensorRT, avoiding fallback operations to the CPU.

사용 사례 및 권장 사항

YOLOv10과 YOLOv5 중 무엇을 선택할지는 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

YOLOv10을 선택해야 하는 경우

YOLOv10은 다음 경우에 강력한 선택입니다:

  • NMS-free 실시간 탐지: Non-Maximum Suppression 없이 엔드투엔드 탐지 기능을 활용하여 배포 복잡성을 줄여야 하는 애플리케이션.
  • 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 규모 전반에서 추론 속도와 탐지 정확도 간의 강력한 균형이 필요한 프로젝트.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

YOLOv5를 선택해야 할 때

YOLOv5는 다음의 경우 권장됩니다:

  • 검증된 프로덕션 시스템: YOLOv5의 오랜 안정성 기록, 광범위한 문서화 및 방대한 커뮤니티 지원이 가치 있게 평가되는 기존 배포 환경.
  • 자원 제약이 있는 학습 환경: GPU 자원이 제한적인 환경에서 YOLOv5의 효율적인 학습 파이프라인과 낮은 메모리 요구사항이 유리한 경우.
  • 광범위한 내보내기 형식 지원: ONNX, TensorRT, CoreML, TFLite를 포함한 다양한 형식으로 배포해야 하는 프로젝트.

Ultralytics(YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최적의 조합을 제공합니다:

  • NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.

Ultralytics의 강점

YOLOv10은 뛰어난 탐지 기능을 제공하지만, 학계 리포지토리에 의존하는 것은 때때로 프로덕션 파이프라인을 복잡하게 만들 수 있습니다. 공식 Ultralytics Python 패키지를 사용하면 YOLOv5와 YOLOv10을 모두 지원하는 통합 생태계에 액세스할 수 있으며 고급 기능도 활용할 수 있습니다.

  • 학습 효율성: Ultralytics YOLO 아키텍처는 학습 중 메모리 요구사항을 낮추기 위해 깊이 최적화되어 있습니다. 막대한 CUDA 메모리가 필요한 무거운 Transformer 모델(RT-DETR 등)과 달리, 일반 소비자용 GPU에서도 YOLOv5와 YOLOv10을 편안하게 학습시킬 수 있습니다.
  • 생태계 통합: Ultralytics Platform과의 통합을 통해 개발자는 데이터셋을 시각적으로 관리하고, Weights & Biases를 사용하여 실험을 추적하며, 하이퍼파라미터를 자동으로 튜닝할 수 있습니다.

코드 예제: 원활한 학습

Ultralytics 라이브러리를 사용하면 모델 문자열을 변경하는 것만큼 간단하게 아키텍처 간을 전환할 수 있습니다. 학습 파이프라인은 데이터 증강, 스케일링 및 옵티마이저 구성을 자동으로 처리합니다.

from ultralytics import YOLO

# To use YOLOv5:
# model = YOLO("yolov5s.pt")

# To use YOLOv10:
model = YOLO("yolov10s.pt")

# Train the model on a custom dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device=0,  # Use GPU 0
)

# Export the trained model to ONNX format
path = model.export(format="onnx")

차세대 모델: Ultralytics YOLO26

오늘 새로운 머신러닝 프로젝트를 시작한다면 최신 **Ultralytics YOLO26**을 평가해 보시길 강력히 권장합니다. 2026년 1월에 출시된 이 모델은 지난 5년간의 가장 뛰어난 혁신을 결합하여 절대적인 최첨단 기술을 대표합니다.

YOLO26은 YOLOv10이 개척한 엔드투엔드 NMS-Free 설계를 기본적으로 통합하여 신속하고 결정론적인 배포를 보장합니다. 또한, YOLO26은 몇 가지 중요한 돌파구를 도입했습니다:

  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss) 모듈을 제거함으로써 YOLO26은 일반 CPU에서 엄청난 속도 향상을 달성하여 모바일 배포 및 저전력 IoT 센서를 위한 최고의 선택지가 되었습니다.
  • MuSGD 옵티마이저: Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM) 학습 기술에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드를 사용합니다. 이는 YOLOv10에서 사용된 AdamW 옵티마이저에 비해 매우 안정적인 학습 실행과 훨씬 빠른 수렴 속도를 보장합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 드론 영상 및 항공 보안 애플리케이션에 중요한 소형 객체 인식 성능을 크게 향상시킵니다.
  • 작업별 마스터리: YOLOv10은 엄격히 바운딩 박스 탐지기이지만, YOLO26은 포즈 추정을 위한 RLE(Residual Log-Likelihood Estimation)와 OBB(Oriented Bounding Boxes)를 위한 특수 각도 손실을 포함한 모든 작업에 대해 전용 아키텍처 개선 사항을 제공합니다.
더 알아보기

객체 탐지의 더 넓은 분야를 탐색하고 있다면, 다른 프레임워크와 이러한 아키텍처를 비교하는 것에도 관심이 있을 수 있습니다. 더 종합적인 벤치마킹을 위해 YOLO11 대 EfficientDet 또는 RT-DETR 대 YOLOv8에 대한 심층 분석을 확인해 보십시오.

YOLOv5의 강력한 유산, YOLOv10의 NMS-Free 혁신, 또는 YOLO26의 비할 데 없는 최첨단 성능 중 무엇에 의존하든, Ultralytics 생태계는 귀하의 비전 AI 애플리케이션을 빠르고 효율적으로 구현하는 데 필요한 도구를 제공합니다.

댓글