콘텐츠로 건너뛰기

YOLO26 대 YOLOv5: 아키텍처, 속도 및 사용 사례 비교

객체 탐지 모델의 진화는 빠르고 혁신적이었습니다. 본 비교 분석에서는 Ultralytics Ultralytics YOLOv5의 독특한 특성을 살펴보고, 아키텍처와 훈련 방법론의 발전이 어떻게 그들의 능력을 형성했는지 분석합니다. YOLOv5 컴퓨터 비전 커뮤니티의 기초적인 기둥으로 YOLOv5 반면, 새로 출시된 YOLO26은 차세대 에지 배포 및 고속 추론을 위해 설계된 획기적인 효율성을 도입합니다.

모델 개요

두 모델 모두 YOLO You Only Look Once) 아키텍처 역사에서 중요한 이정표를 나타냅니다. 실시간 성능과 사용 편의성에 대한 공통된 목표를 지니면서도, AI 발전의 서로 다른 시대를 대표합니다.

Ultralytics YOLO26

YOLO26은 2026년 1월 출시된 Ultralytics 최신 버전입니다. 이는 비최대 억제(NMS) 후처리 과정이 필요 없는 네이티브 엔드투엔드 아키텍처로의 전환을 의미합니다. 엣지 컴퓨팅을 염두에 두고 설계되어 배포를 간소화하면서도 정확도의 한계를 확장합니다.

  • 저자: 글렌 조커와 징 치우
  • 조직:Ultralytics
  • 날짜:14
  • 문서:YOLO26 문서
  • 핵심 혁신: 종단 간 NMS 검출, DFL 제거 및 MuSGD 최적화기.

YOLO26에 대해 더 알아보기

Ultralytics YOLOv5

YOLOv5 2020년 중반에 출시된 YOLOv5는 속도, 정확도, 사용자 친화적인 설계의 균형으로 빠르게 업계 표준이 되었습니다. 수백만 개발자에게 PyTorch 소개했으며, 안정성과 레거시 지원이 가장 중요한 생산 환경에서 여전히 널리 사용되고 있습니다.

  • 작성자: Glenn Jocher
  • 조직:Ultralytics
  • 날짜:26
  • 문서:5 문서
  • 핵심 혁신: 사용자 친화적인 PyTorch , 모자이크 증강, 자동 앵커 메커니즘.

5에 대해 자세히 알아보기

아키텍처의 차이점

YOLOv5 전환은 물체 탐지 방식과 훈련 중 모델 최적화 방식에 근본적인 변화를 수반합니다.

종단 간 처리 vs. 후처리

YOLOv5 중복 경계 상자를 걸러내기 위해 비최대 억제(NMS) 에 YOLOv5 . 효과적이긴 하지만, NMS 특히 CPU 제한된 에지 디바이스에서 추론 시 병목 현상을 일으킬 수 있는 휴리스틱 NMS . 특정 데이터셋에 맞게 조정해야 하는 IoU 같은 하이퍼파라미터를 도입합니다.

반면 YOLO26은 본질적으로 엔드투엔드 방식입니다. 최초로 도입된 설계를 채택함으로써 YOLOv10에서 처음 도입된 설계를 채택함으로써, YOLO26은 NMS 없이도 네트워크 출력으로부터 직접 정확한 객체 집합을 예측합니다. 이는 모델 출력이 최종 결과이므로 배포 파이프라인을 상당히 단순화합니다.

배포 간편성

NMS 제거는 다음과 같은 형식으로 내보낼 때 복잡한 후처리 단계를 컴파일할 필요가 없음을 의미합니다. CoreML 이나 TensorRT과 같은 형식으로 내보낼 때 더 이상 복잡한 후처리 단계를 컴파일할 필요가 없음을 의미합니다. 원시 모델 출력이 바로 사용 가능하므로 지연 시간과 통합 복잡성이 감소합니다.

손실 함수와 최적화

YOLO26은 프로그레시브 손실 균형(ProgLoss)소형 대상 인식 라벨 할당(STAL)을 도입합니다. 이러한 혁신은 항공 이미지나 복잡한 장면에서 소형 물체를 탐지하기 어려운 점과 같은 객체 탐지의 일반적인 취약점을 특별히 겨냥합니다. ProgLoss는 훈련 중 다양한 손실 구성 요소의 가중치를 동적으로 조정하여 수렴을 안정화합니다.

또한 YOLO26은 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받은 SGD 뮤온 SGD Muon) 최적화기의 하이브리드인 MuSGD 최적화기를 활용합니다. 이는 LLM 훈련의 안정성을 컴퓨터 비전 분야에 도입하여 더 빠른 수렴과 더 견고한 가중치를 가능하게 합니다.

간소화된 헤드 구조

YOLOv26의 주요 변경점은 분포 초점 손실(DFL)의 제거입니다. DFL은 이전 버전들(예: YOLOv8과 같은 이전 버전에서는 박스 정밀도 향상에 기여했지만, 내보내기 과정에서 계산 오버헤드와 복잡성을 증가시켰습니다. 회귀 손실을 정교화함으로써 YOLO26은 DFL 없이도 높은 정밀도를 달성하며, 이전 세대에 비해 CPU에서 최대 43% 더 빠른 속도를 보여줍니다. 이는 엣지 AI 애플리케이션에 있어 중요한 지표입니다.

성능 지표 비교

다음 표는 COCO YOLOv5 성능을 비교합니다. YOLO26은 정확도(mAP)와 추론 속도 모두에서 상당한 향상을 보여주며, 특히 CPU 그 아키텍처 최적화가 두드러지게 나타납니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

주요 내용

  1. 정확도 도약: YOLO26n(나노)은 40.9 mAP 달성하여 28.0 mAP YOLOv5n을 크게 능가합니다. 이를 통해 사용자는 탐지 품질을 저하시키지 않으면서 더 작은 모델을 배포할 수 있습니다.
  2. CPU : YOLO26의 아키텍처 단순화로 인해 CPU 속도가 획기적으로 빨라졌습니다. 예를 들어, YOLO26n은 CPU 약 39ms에 실행되는 반면, YOLOv5n은 약 74ms가 소요되어 라즈베리 파이 또는 모바일 배포에 이상적입니다.
  3. 매개변수 효율성: YOLO26은 많은 경우 더 적은 매개변수로 더 높은 정확도를 달성합니다(예: YOLO26l은 2480만 매개변수, YOLOv5l은 5320만 매개변수). 이는 훈련 및 추론 시 메모리 사용량을 줄여줍니다.

학습 및 생태계

두 모델 모두 강력한 Ultralytics 혜택을 받지만, YOLO26은 최신 도구와 더 깊은 통합을 활용합니다.

사용 편의성 및 API

두 모델 모두 통합된 ultralytics Python (YOLOv5 원래YOLOv5 현재 통합됨). 이를 통해 모델 간 전환이 모델 이름 문자열 변경만큼 간단해집니다.

from ultralytics import YOLO

# Load YOLO26 for state-of-the-art performance
model_26 = YOLO("yolo26n.pt")
model_26.train(data="coco8.yaml", epochs=100)

# Load YOLOv5 for legacy comparison
model_v5 = YOLO("yolov5nu.pt")
model_v5.train(data="coco8.yaml", epochs=100)

고급 교육 기능

YOLO26은 개선된 데이터 증강 전략과 새로운 MuSGD 최적화기를 지원하며, 이는 YOLOv5 SGD 국소적 최소값에서 더 효과적으로 벗어나는 데 도움이 됩니다. 또한 YOLO26은 자세 추정용 잔차 로그 가능도 추정(RLE)방향성 경계 상자(OBB) 작업용 특수 각도 손실과 같은 작업별 개선 사항을 제공합니다. 이러한 기능들은 YOLOv5 없거나 덜 정교했습니다.

사용자는 Ultralytics 활용하여 데이터셋을 관리하고, 클라우드에서 모델을 훈련시키며, 다양한 엔드포인트에 원활하게 배포할 수 있습니다.

이상적인 사용 사례

YOLO26을 선택해야 할 때

YOLO26은 우수한 정확도 대 지연 시간 비율로 인해 거의 모든 신규 프로젝트에 권장되는 선택입니다.

  • 에지 AI 및 IoT: DFL 제거 및 NMS 추론을 통해 YOLO26은 NVIDIA , Raspberry Pi 또는 모바일 폰과 같이 CPU 효율성이 중요한 장치에 완벽합니다.
  • 소형 물체 탐지: STAL 덕분에 YOLO26은 드론 이미지나 제조 현장의 결함 탐지와 같이 대상이 이미지 크기에 비해 매우 작은 상황에서 탁월한 성능을 발휘합니다.
  • 실시간 영상 분석: 속도 향상으로 더 높은 프레임 속도 처리가 가능해져 교통 모니터링이나 스포츠 분석에 필수적입니다.

5 선택해야 할 때

구형이지만 YOLOv5 틈새 시장을 차지하고 있습니다:

  • 레거시 시스템: 2020년 당시 YOLOv5 구조를 엄격히 따르도록 구축된 기존 파이프라인은 이전 모델을 유지하는 것이 마이그레이션보다 더 쉬울 수 있습니다.
  • 가장 광범위한 하드웨어 지원: 오래된 모델인 YOLOv5 사실상 모든 플랫폼에 YOLOv5 , 최신 아키텍처에 대한 최적화된 지원이 아직 제공되지 않을 수 있는 매우 생소한 마이크로컨트롤러까지 포함됩니다.

결론

한편 YOLOv5 가 접근성과 신뢰성으로 현대 객체 탐지의 토대를 마련했다면, YOLO26은 상당한 도약을 이루었습니다. 엔드투엔드 NMS 프리 설계 채택, 에지 하드웨어 최적화, MuSGD 및 ProgLoss 같은 고급 훈련 기법 통합을 통해 YOLO26은 최고의 성능을 추구하는 개발자들에게 매력적인 업그레이드를 제공합니다.

대부분의 사용자에게 선택은 분명합니다: YOLO26은 오늘날 까다로운 컴퓨터 비전 애플리케이션에 필요한 속도, 정확성 및 다용도성을 제공합니다.

다른 모델 살펴보기

다른 아키텍처를 탐색하고 싶다면 다음을 확인해 보세요 YOLO11를 살펴보거나, 개방형 어휘 탐지 기능을 원하신다면 YOLO 확인해 보세요.


댓글