YOLOv5 vs YOLO26: 실시간 객체 탐지의 세대적 도약

컴퓨터 비전의 발전은 더 빠르고, 더 정확하며, 더 접근하기 쉬운 모델을 향한 끊임없는 추진력에 의해 정의되어 왔습니다. Ultralytics YOLOv5와 최첨단 Ultralytics YOLO26을 비교하면, 견고한 레거시 시스템과 현대 AI 배포의 최전선을 잇는 패러다임의 전환을 보게 됩니다.

이 가이드는 두 아키텍처에 대한 포괄적인 기술적 분석을 제공하며, 성능 지표, 구조적 차이점 및 이상적인 배포 시나리오를 강조합니다.

모델 개요

YOLOv5: 업계의 주력 모델

2020년에 출시된 YOLOv5는 객체 탐지의 접근성을 혁신했습니다. 아키텍처를 PyTorch 프레임워크로 기본 이식함으로써 개발자들에게 전례 없는 "zero-to-hero" 경험을 제공했습니다.

YOLOv5는 꾸준히 유지 관리되는 Ultralytics 생태계의 기반을 마련했습니다. 이 모델은 적극적인 데이터 증강 기법, 효율적인 훈련 루프, 그리고 CoreMLONNX와 같은 에지 포맷으로의 고도로 최적화된 내보내기 경로를 도입했습니다. 훈련 중 사용 편의성과 낮은 메모리 요구 사항 덕분에 전 세계 스타트업과 연구원들에게 필수적인 도구가 되었습니다.

YOLOv5에 대해 더 알아보기

YOLO26: 차세대 비전 AI 표준

2026년 1월로 넘어가서, Ultralytics YOLO26은 실시간 비전 AI의 정점을 대표합니다. 이 모델은 YOLOv8YOLO11과 같은 중간 세대에서 얻은 교훈을 기본적으로 통합하는 동시에, 거대 언어 모델(LLM) 훈련에서 영감을 받은 대규모 혁신을 도입했습니다.

YOLO26은 성능 균형에 대한 새로운 벤치마크를 설정하며, 최첨단 정확도를 제공하는 동시에 에지 컴퓨팅 시나리오를 압도하도록 설계되었습니다.

YOLO26에 대해 더 알아보기

기타 Ultralytics 모델

기존 코드베이스를 마이그레이션하는 경우, 자세 추정 및 방향성 경계 상자(OBB)와 같은 다양한 작업에 대한 초기 지원을 도입했던 이전 세대 모델인 YOLO11과 YOLOv5를 비교하는 것도 고려해 볼 수 있습니다.

YOLO26의 아키텍처적 혁신

YOLOv5가 앵커 기반 탐지 헤드와 표준 손실 함수에 의존하는 반면, YOLO26은 내부 메커니즘을 완전히 개편하여 배포 병목 현상을 제거했습니다.

  1. 엔드투엔드 NMS-Free 설계: 가장 큰 차이점은 YOLO26의 기본 엔드투엔드 아키텍처입니다. 중복된 경계 상자를 필터링하기 위해 수동 NMS(Non-Maximum Suppression)가 필요한 YOLOv5와 달리, YOLO26은 이 후처리 단계를 완전히 제거합니다. 이는 결정론적 추론 지연 시간을 보장하며 C++ 또는 임베디드 하드웨어로의 통합을 획기적으로 단순화합니다.
  2. DFL 제거: YOLO26은 DFL(Distribution Focal Loss)을 제거합니다. 이러한 아키텍처적 선택은 모델 내보내기를 크게 단순화하고, 복잡한 연산자로 인해 어려움을 겪는 저전력 에지 장치 및 마이크로컨트롤러와의 호환성을 향상시킵니다.
  3. MuSGD 옵티마이저: Moonshot AI의 Kimi K2에서 힌트를 얻은 YOLO26은 SGD와 Muon의 하이브리드인 MuSGD 옵티마이저를 사용합니다. 이는 LLM 훈련에서 나타나는 안정성과 빠른 수렴을 컴퓨터 비전으로 가져와, 트랜스포머 기반 모델에 비해 낮은 메모리 사용량과 더 빠른 훈련 주기를 실현합니다.
  4. ProgLoss + STAL: YOLO26은 정교한 ProgLoss 및 STAL 함수를 사용하여 YOLOv5의 역사적 난제였던 작고 조밀한 객체를 탐지하는 능력을 크게 향상시켰습니다.

성능 비교

COCO 데이터세트에서 모델을 비교할 때, YOLO26은 파라미터 수와 CPU 추론 속도를 동시에 줄이면서 정밀도(mAP)에서 엄청난 향상을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

참고: YOLO26 Nano(YOLO26n)는 DFL 제거와 NMS-Free 헤드 덕분에 최대 43% 더 빠른 CPU 추론을 제공하면서도, YOLOv5n의 28.0 mAP와 비교되는 40.9 mAP라는 놀라운 성능을 달성합니다.

다양성 및 태스크 지원

YOLOv5는 주로 객체 탐지로 유명합니다. 이후 업데이트에서 기본적인 세그멘테이션 기능이 추가되었지만, YOLO26은 처음부터 통합된 다중 작업 엔진으로 설계되었습니다.

YOLO26은 기본적으로 다음을 지원합니다:

  • 인스턴스 세그멘테이션: 작업별 다중 스케일 프로토와 시맨틱 세그멘테이션 손실을 특징으로 합니다.
  • 자세 추정: 매우 정확한 키포인트 탐지를 위해 RLE(Residual Log-Likelihood Estimation)를 활용합니다.
  • 방향성 경계 상자(OBB): 위성 이미지 분석에 중요한 경계 불연속성 문제를 해결하기 위해 특화된 각도 손실을 포함합니다.
  • 이미지 분류: 표준 전체 이미지 분류 기능을 제공합니다.
생태계 통합

두 모델 모두 원활한 데이터 주석, 자동 하이퍼파라미터 튜닝, 원클릭 클라우드 배포를 제공하는 Ultralytics 플랫폼의 혜택을 받습니다. 그러나 YOLO26은 최신 API 구조를 최대한 활용합니다.

사용 및 코드 예제

Ultralytics Python API를 사용하면 모델 간 전환이 매우 간단합니다. 두 모델 모두 잘 관리되는 동일한 생태계를 공유하므로, 기존 YOLOv5 파이프라인을 YOLO26으로 업데이트하려면 가중치 파일만 변경하면 됩니다.

Python 예제

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

CLI 예제

최대 GPU 처리량을 위해 TensorRT 통합을 사용하여 명령줄에서 직접 YOLO26을 배포할 수 있습니다:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

이상적인 활용 사례

YOLO26을 선택해야 하는 경우

모든 현대 컴퓨터 비전 프로젝트에서 YOLO26은 의심할 여지 없이 권장되는 모델입니다.

  • 에지 AI 및 IoT: 43% 더 빠른 CPU 추론과 DFL 제거 덕분에 Raspberry Pi나 모바일 기기 배포에 완벽합니다.
  • 고속 파이프라인: NMS-Free 아키텍처는 자율 로봇 공학 및 실시간 보안 경보 시스템에 중요한 안정적이고 예측 가능한 지연 시간을 보장합니다.
  • 복잡한 시나리오: 애플리케이션에 작은 객체 추적(예: 드론 모니터링)이나 회전하는 객체(OBB) 탐지가 필요한 경우, YOLO26의 고급 손실 함수(ProgLoss + STAL)가 압도적인 정확도 우위를 제공합니다.

YOLOv5를 선택해야 하는 경우

  • 레거시 시스템: 프로덕션 환경에서 YOLOv5의 특정 앵커 생성이나 NMS 파싱 로직에 하드코딩된 종속성이 있는 경우, 마이그레이션 시 약간의 리팩토링 기간이 필요할 수 있습니다.
  • 특정 학술적 기준: 연구자들은 종종 객체 탐지 아키텍처의 역사적 발전을 보여주기 위해 YOLOv5를 클래식 베이스라인으로 사용합니다.

요약

YOLOv5에서 YOLO26으로의 전환은 단순한 반복적 업데이트가 아니라, 객체 탐지 모델이 훈련되고 배포되는 방식에서의 근본적인 도약입니다. MuSGD 옵티마이저를 활용하고, NMS-Free 설계를 통해 복잡한 후처리를 제거하며, CPU 속도를 대폭 가속화함으로써 Ultralytics YOLO26은 속도와 정밀도의 타협 없는 균형을 제공합니다.

YOLOv5는 비전 AI를 대중화한 모델로 항상 기억되겠지만, 견고하고 프로덕션 수준의 미래 지향적인 애플리케이션을 구축하려는 개발자는 자신 있게 YOLO26을 기반으로 구축해야 합니다.

댓글