콘텐츠로 건너뛰기

YOLOv5 YOLO26: 실시간 객체 탐지의 진화

물체 탐지의 진화는 효율성과 정확성에서 상당한 도약을 보여왔다. 수년간, YOLOv5 는 속도와 사용 편의성의 균형으로 사랑받으며 업계 표준으로 자리매김해 왔습니다. 그러나 컴퓨터 비전 분야는 빠르게 변화하고 있습니다. Ultralytics의 최신 세대인 YOLO26이 등장하며, 에지 디바이스와 고성능 서버 모두에서 가능한 한계를 재정의합니다.

이 가이드는 전설적인 YOLOv5 최첨단 YOLOv5 기술적 비교를 제공하며, 두 모델의 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석하여 다음 컴퓨터 비전 프로젝트에 적합한 도구를 선택하는 데 도움을 드립니다.

한눈에 보는 비교

두 모델 모두 Ultralytics 접근성 높은 AI 구현 노력의 산물이지만, 서로 다른 설계 철학의 시대를 대표합니다. YOLOv5 견고하고 사용자 친화적인 생태계 구축에 YOLOv5 반면, YOLO26은 지연 시간과 아키텍처 효율성의 한계를 뛰어넘고 있습니다.

YOLOv5: 레거시 표준

2020년 6월 글렌 조커(Glenn Jocher)가 공개한 YOLOv5 객체 탐지의 접근성을 혁신 YOLOv5 . 이는 PyTorch 내에서 직접 원활한 훈련 환경을 제공하는 최초의 모델 중 하나였습니다. PyTorch 생태계 내에서 직접 원활한 훈련 환경을 제공하는 최초의 모델 중 하나였으며, 이전 모델들의 다크넷 프레임워크에서 벗어났습니다.

  • 날짜:26
  • 작성자: Glenn Jocher
  • 조직:Ultralytics
  • 주요 기능: 비최대 억제(NMS)가 필요한 앵커 기반 탐지.

YOLOv5 특히 추론 파이프라인 업데이트 비용이 발생할 수 있는 레거시 시스템에서 여전히 믿을 만한 주력 모델로 YOLOv5 . 이 모델의 "앵커 기반" 아키텍처는 객체 위치를 예측하기 위해 사전 정의된 박스에 의존하는데, 이는 효과적인 방법이지만 하이퍼파라미터의 세심한 조정이 필요합니다.

5에 대해 자세히 알아보기

YOLO26: 새로운 개척지

글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)가 2026년 1월에 공개한 YOLO26은 엣지 AI 시대를 위해 설계된 급진적인 아키텍처 변경을 도입합니다. 앵커와 복잡한 후처리에서 벗어나 정확도를 저하시키지 않으면서 순수한 속도를 제공합니다.

  • 날짜:14
  • 저자: Glenn Jocher, Jing Qiu
  • 조직:Ultralytics
  • 주요 기능: 엔드투엔드 NMS, MuSGD 최적화기, DFL 제거.

YOLO26은 최대 처리량이 필요한 개발자를 위해 설계되었습니다. NMS(네트워크 관리 시스템)의 필요성을 제거함으로써 배포 로직을 단순화하고 지연 시간을 줄여, CPU 및 모바일 기기에서의 실시간 애플리케이션에 최적의 선택지입니다.

YOLO26에 대해 더 알아보기


기술 성능 비교

다음 지표들은 성능에서 세대적 도약을 보여줍니다. 테스트는 객체 탐지 작업의 표준 벤치마크인 COCO 수행되었습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

주요 내용

  1. CPU : YOLO26n은 YOLOv5n CPU 거의 2배 빠른 속도를 보여주며 정확도도 크게 향상되었습니다( mAP 28.0% vs 40.9%). 이는 GPU 없는 라즈베리 파이 또는 모바일 기기에서의 배포에 매우 중요합니다.
  2. 매개변수 효율성: YOLO26x는 YOLOv5x(50.7%)보다 훨씬 높은 정확도(57.5% mAP)를 달성하면서 매개변수 수는 거의 절반 수준(55.7M vs 97.2M)으로 줄였습니다. 모델 크기의 감소는 메모리 요구량과 저장 비용을 낮춥니다.
  3. 정확도/속도 상충 관계: YOLO26의 "나노" 버전은 더 작은 모델 클래스임에도 불구하고 YOLOv5 "스몰" 버전보다 정확도 YOLOv5 우수한 성능을 보입니다.

YOLOv5OLOv5에서 업그레이드

현재 YOLOv5s를 사용 중이라면, YOLO26n으로 전환하면 정확도와 추론 속도를 동시에 향상시킬 수 있어 컴퓨팅 비용과 지연 시간을 모두 줄일 수 있습니다.

심층적인 아키텍처 분석

성능 격차는 모델들이 탐지 문제를 접근하는 방식의 근본적인 차이에서 비롯된다.

1. 종단 간 NMS 설계

YOLOv5 수천 개의 잠재적 바운딩 박스를 생성하는 전통적인 접근법을 YOLOv5 . 이를 최종 탐지 결과로 필터링하기 위해서는 비최대 억제(NMS) 라는 후처리 단계가 필요합니다. 이 단계는 종종 느리고 FPGA나 NPU 같은 하드웨어에서 가속하기 어렵습니다.

YOLO26은 기본적으로 엔드투엔드 방식입니다. 훈련 과정에서 이중 레이블 할당 전략을 활용하여 모델이 개체당 단일 고품질 박스를 예측하도록 강제합니다. 이를 통해 추론 단계에서 NMS 완전히 제거합니다.

  • 장점: 더 낮은 지연 시간과 더 단순한 배포 파이프라인(사용자 정의 내보내기를 CUDA C++ 또는 CUDA NMS 구현할 필요가 없음).
  • 결과: 중량급 후처리 작업에 의존하는 이전 세대에 비해 최대 43% 빠른 CPU 성능.

2. 손실 함수: DFL 제거 및 ProgLoss

YOLOv5 및 후속 버전인 YOLOv8)는 박스 경계를 정교화하기 위해 분포 초점 손실(DFL)을 활용했습니다. 효과적이긴 하지만, DFL은 내보내기 과정에 계산 오버헤드와 복잡성을 추가합니다.

YOLO26은 DFL을 제거하고 INT8 배포를 위해 양자화하기 쉬운 단순화된 회귀 헤드로 되돌립니다. 잠재적인 정확도 손실을 보상하기 위해 YOLO26은 ProgLoss(진보적 손실 균형)STAL(소형 표적 인식 라벨 할당)을 도입합니다.

  • STAL: 특히 "작은 물체" 문제를 대상으로 하여, 원거리 또는 아주 작은 표적에서의 성능을 향상시킵니다. 이는 v5를 포함한 이전 YOLO 일반적인 약점이었습니다.
  • ProgLoss: 훈련 중 다양한 손실 구성 요소의 가중치를 동적으로 조정하여 수렴을 안정화합니다.

3. MuSGD 최적화기

YOLO26 팀은 훈련 안정성에 중점을 두었습니다. YOLOv5 표준 SGD Adam 사용한 반면, YOLO26은 Moonshot AI의 Kimi K2와 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받은 하이브리드 최적화기인 MuSGD를 통합했습니다.

  • 혁신: 뮤온 최적화의 안정성을 컴퓨터 비전에 도입하여, 손실 급증 위험 없이 더 높은 학습률과 더 빠른 수렴을 가능하게 합니다.

다용도성과 작업 지원

두 모델 모두 Ultralytics 통합되어 있어 다양한 컴퓨터 비전 작업을 지원합니다. 그러나 YOLO26은 YOLOv5 작업 특화 아키텍처 개선 사항을 포함하고 있습니다.

기능5YOLO26
객체 감지✅ 표준 앵커 기반NMS, 소형 물체용 STAL
Segmentation✅ v7.0에 추가됨의미 손실 및 다중 스케일 프로토
포즈 추정❌ (포크에서 사용 가능)✅ 잔차 로그우도 추정( RLE )
OBB❌ (포크에서 사용 가능)✅ 정밀 회전을 위한 각도 손실
분류✅ 지원됨✅ 최적화된 아키텍처

YOLO26의 잔차 로그우도 추정(RLE) 지원은 자세 추정을 위한 키포인트 정확도를 현저히 향상시켜, 스포츠 분석 및 의료 애플리케이션에 탁월한 성능을 제공합니다.

훈련 및 사용법

Ultralytics 생태계의 강점 중 하나는 통합된 API입니다. 현대식 패키지를 통해 YOLOv5 사용하든 YOLO26을 사용하든, 코드는 일관되고 간단하게 유지됩니다.

Python 예시

다음은 두 모델을 사용하여 훈련하고 추론하는 방법입니다. ultralytics 패키지. YOLOv5 경우, 최신 패키지는 yolov5u 기본적으로 호환성을 높이기 위해 앵커 프리(anchor-free)로 조정된 가중치를 사용하지만, 이 비교는 해당 아키텍처에서도 유효합니다.

from ultralytics import YOLO

# Load the models
model_v5 = YOLO("yolov5s.pt")  # Legacy standard
model_26 = YOLO("yolo26n.pt")  # New NMS-free standard

# Comparison: Inference on an image
# YOLO26 requires no NMS post-processing arguments in export/deployment
results_v5 = model_v5("https://ultralytics.com/images/bus.jpg")
results_26 = model_26("https://ultralytics.com/images/bus.jpg")

# Print results to see speed differences
print(f"YOLOv5 Speed: {results_v5[0].speed}")
print(f"YOLO26 Speed: {results_26[0].speed}")

# Train YOLO26 on custom data
# The MuSGD optimizer is handled automatically
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)

Ultralytics (구 HUB)은 코드 작성 없이 클라우드에서 데이터셋을 관리하고 두 모델을 모두 훈련할 수 있도록 하여 이 과정을 더욱 간소화합니다. 다만 플랫폼에서 생성된 신규 프로젝트의 경우 YOLO26이 권장되는 기본 모델입니다.

배포 및 에코시스템

YOLOv5 방대한 기존 생태계를 YOLOv5 . 수천 개의 튜토리얼, 제3자 저장소, 그리고 YOLOv5 전용으로 작성된 하드웨어 통합 솔루션이 존재합니다. yolov5 형식. YOLOv5 정확한 출력 tensor 엄격히 요구하는 경직된 구형 하드웨어 파이프라인을 사용하는 경우, 여전히 유효한 선택지입니다.

그러나 현대적인 배포를 위해서는 YOLO26이 더 우수한 내보내기 옵션을 제공합니다.

  • 엣지 AI: DFL과 NMS 제거함으로써 YOLO26 모델을 TensorRT와 같은 형식으로 변환하는 것이 훨씬 NMS . TensorRTOpenVINO.
  • 양자화: YOLO26은 양자화에 친화적으로 설계되어 모바일 프로세서용 INT8로 변환 시에도 높은 정확도를 유지합니다.

결론

한편 YOLOv5 가 객체 탐지를 대중화한 전설적인 모델로 남아 있지만, YOLO26은 미래를 대표합니다. 엔드투엔드 NMS 설계, 무거운 손실 함수의 제거, MuSGD와 같은 LLM에서 영감을 받은 최적화기 통합을 통해 YOLO26은 YOLOv5 따라잡을 YOLOv5 성능 프로필을 제공합니다.

새로운 프로젝트를 시작하는 개발자에게는 YOLO26이 확실한 추천입니다. 더 낮은 지연 시간에서 더 높은 정확도를 제공하며, 메모리 사용량을 줄이고 배포 경로도 더 간단합니다.

다른 모델 살펴보기

특화된 아키텍처에 관심이 있는 사용자는 다음을 살펴보시기 바랍니다 YOLO11를 살펴보시기 바랍니다. 이는 YOLO26의 직접적인 전신으로 우수한 범용 성능을 제공합니다. 또는 YOLO 를 detect 바랍니다.


댓글