콘텐츠로 건너뛰기

YOLOv8 YOLO26: 실시간 비전 AI를 위한 기술적 진화

컴퓨터 비전의 빠르게 변화하는 세계에서 YOLOv8 에서 YOLO26로의 진화는 효율성, 속도 및 아키텍처 정교화 측면에서 중대한 도약을 의미합니다. 2023년 출시 당시 YOLOv8 다용도성과 사용 편의성 측면에서 업계 표준을 YOLOv8 , 2026년 출시된 YOLO26은 엔드투엔드 NMS 탐지 및 LLM에서 영감을 받은 최적화와 같은 획기적인 변화를 도입했습니다.

이 가이드는 개발자, 연구원 및 엔지니어가 특정 배포 요구 사항에 적합한 모델을 선택할 수 있도록 심층적인 기술적 비교를 제공합니다.

모델 개요

Ultralytics YOLOv8

저자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속:Ultralytics
날짜: 2023-01-10
GitHub:ultralytics
문서:YOLOv8

2023년 초 출시된 YOLOv8 는 비전 AI의 사용자 경험을 재정의했습니다. 객체 탐지, 인스턴스 분할, 자세 추정, 분류를 위한 통합 프레임워크를 도입했습니다. PyTorch 기반으로 구축된 이 프레임워크는 앵커 프리 탐지 헤드와 모자이크 데이터 증강 파이프라인을 특징으로 하며, 균형 잡힌 속도와 정확도의 벤치마크가 되었습니다.

8에 대해 자세히 알아보기

Ultralytics YOLO26

저자: 글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)
소속:Ultralytics
날짜: 2026-01-14
GitHub:ultralytics
문서:YOLO26 문서

YOLO26은 에지 최적화 성능에 대한 증가하는 수요를 해결하기 위해 설계된 Ultralytics 최신 버전입니다. 이 모델은 추론 과정에서 병목 현상을 일으키는 후처리 단계를 제거하는 네이티브 엔드투엔드 NMS 프리 아키텍처를 최초로 도입했습니다. MuSGD 최적화기 적용 및 분포 초점 손실(DFL) 제거 등의 최적화를 통해 YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 제공합니다.

YOLO26에 대해 더 알아보기

아키텍처의 차이점

YOLOv8 전환은 네트워크가 이미지를 처리하고 데이터로부터 학습하는 방식에 근본적인 변화를 수반한다.

1. 종단 간 NMS 설계

가장 중요한 차이점 중 하나는 중복 경계 상자의 처리 방식입니다.

  • YOLOv8: 후처리 과정에서 중첩된 박스를 걸러내기 위해 비최대 억제(NMS) 에 의존합니다. 효과적이긴 하지만, NMS 특히 비표준 하드웨어에서 지연 변동성과 배포 복잡성을 NMS .
  • YOLO26: 유사한 네이티브 엔드투엔드 접근법을 채택합니다 YOLOv10과 유사한 네이티브 엔드투엔드 접근 방식을 채택합니다. 객체당 정확히 하나의 박스를 출력하도록 모델을 훈련함으로써 NMS 완전히 제거합니다. 이로 인해 결정론적 지연 시간과 TensorRT와 같은 형식으로의 더 단순한 내보내기 파이프라인이 구현됩니다. TensorRT , CoreML과 같은 형식으로의 내보내기 파이프라인을 단순화합니다.

NMS-Free가 중요한 이유

NMS 제거는 에지 배포에 있어 판도를 바꾸는 NMS . 이는 CPU의 계산 오버헤드를 줄이고, 장면에서 탐지된 객체 수와 무관하게 모델의 추론 시간이 일관되도록 보장합니다.

2. 손실 함수와 최적화

YOLO26은 대규모 언어 모델(LLM) 훈련에서 얻은 교훈을 적용하여 안정성과 수렴성을 개선합니다.

  • ProgLoss + STAL: YOLO26은 ProgLoss와 STAL (Soft Target Assignment Loss)을 활용하여 더 부드러운 기울기를 제공하고, 특히 소형 물체 탐지에서 어려운 샘플을 더 잘 처리합니다.
  • MuSGD 최적화기: Moonshot AI의 Kimi K2에서 영감을 받은 MuSGD 최적화기는 SGD Muon 최적화기와 유사한 모멘텀 업데이트를 결합합니다. 이 혁신은 더 높은 학습률에서도 훈련을 안정화시켜 총 훈련 시간을 단축합니다.
  • DFL 제거: YOLOv8 박스 경계선을 정밀하게 조정하기 위해 분포 초점 손실(DFL) YOLOv8 . YOLO26은 DFL을 제거하여 에지 디바이스용 아키텍처를 단순화함으로써, 정밀도를 저하시키지 않으면서도 출력 채널 수와 메모리 사용량을 줄였습니다.

3. 작업별 향상 기능

YOLOv8 여러 작업을 포괄적으로 YOLOv8 반면, YOLO26은 다음과 같은 특화된 개선 사항을 추가합니다:

  • 세분화: 더 선명한 마스크 경계를 위해 의미적 세분화 손실과 다중 스케일 프로토 모듈을 도입합니다.
  • Pose: 잔차 로그우도 추정(RLE) 을 사용하여 키포인트 위치 결정의 불확실성을 더 잘 포착합니다.
  • OBB: 방향성 경계 상자(Oriented Bounding Box ) 작업에서 경계 불연속성을 해결하기 위해 특수한 각도 손실 함수를 적용합니다.

성능 비교

아래는 COCO 대한 성능 지표의 상세 비교입니다. YOLO26은 모든 모델 규모에서 우수한 속도와 효율성을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

참고: YOLO26n은 YOLOv8n 대비 CPU 시간을 43%나 현저히 YOLOv8n 정확도도 3.6 mAP 향상시켰습니다.

교육 및 사용성

두 모델 모두 "초보자도 쉽게 전문가 수준으로"라는 단순성으로 유명한 강력한 Ultralytics 혜택을 누립니다.

사용 편의성 및 생태계

YOLOv8 선택하든 YOLO26 YOLOv8 , 동일한 통합 API를 사용할 수 있습니다. 모델 간 전환은 코드에서 문자열 하나만 변경하는 것만큼 간단합니다.

from ultralytics import YOLO

# Load YOLOv8
model_v8 = YOLO("yolov8n.pt")

# Load YOLO26 (Recommended)
model_26 = YOLO("yolo26n.pt")

# Training is identical
model_26.train(data="coco8.yaml", epochs=100)

두 모델 모두 Ultralytics (구 HUB)과 완벽하게 통합되어 원활한 데이터셋 관리, 클라우드 기반 훈련 및 원클릭 배포가 가능합니다.

교육 효율성

YOLOv8CUDA 는 매우 효율적이지만 일반적으로 표준 SGD AdamW 필요합니다. MuSGD 최적화기를 사용하는 YOLO26은 종종 더 빠르게 수렴하여 소중한 GPU 절약합니다. 또한 YOLO26은 일반적으로 RT-DETR와 같은 트랜스포머 중심 아키텍처에 비해 일반적으로 더 적은 CUDA 메모리를 필요로 하여, NVIDIA 3060이나 4090과 같은 소비자 등급 GPU에서도 더 큰 배치로 훈련할 수 있게 합니다.

이상적인 사용 사례

YOLOv8을 고수해야 할 때

  • 레거시 프로젝트: YOLOv8 중심으로 이미 구축된 안정적인 생산 파이프라인이 있으며 YOLOv8 업그레이드에 필요한 검증 시간을 감당할 수 없는 경우.
  • 연구 기준선: YOLOv8 광범위한 채택과 인용으로 인해 비교를 위한 표준 학술 기준선으로 YOLOv8 .

YOLO26로 업그레이드할 시점

  • 에지 배포: 라즈베리 파이, 모바일 기기 또는 임베디드 시스템에서 실행되는 애플리케이션의 경우 43%의 CPU 매우 중요합니다.
  • 실시간 지연: 자율주행이나 로봇공학과 같은 애플리케이션이 결정론적 지연을 요구하는 경우, NMS 프리 설계는 혼잡한 장면에서 후처리로 인한 지터를 제거합니다.
  • 높은 정확도 요구 사항: YOLO26은 모든 mAP YOLOv8 지속적으로 능가하여, 의료 영상이나 결함 검출과 같은 정밀도가 중요한 작업에 더 나은 선택입니다.

결론

한편 YOLOv8 여전히 강력하고 다재다능한 도구이지만, YOLO26은 효율적인 컴퓨터 비전의 미래를 대표합니다. Ultralytics 사용 편의성과 NMS 없는 탐지, LLM에서 영감을 받은 최적화와 같은 최첨단 아키텍처 혁신을 결합함으로써, YOLO26은 매력적인 업그레이드 경로를 제공합니다.

현재 신규 프로젝트를 시작하는 개발자에게는 YOLO26이 권장되는 선택지입니다. 2026년 기준 속도, 정확도, 자원 효율성 측면에서 가장 우수한 균형을 제공합니다.

추가 자료

  • 다른 모델도 살펴보세요 YOLO11 과 같은 다른 모델을 살펴보고 비교해 보세요.
  • ONNX TensorRT 모델 내보내기에 대해 알아보세요.
  • 최신 튜토리얼과 사례 연구를 보려면 Ultralytics 확인하세요.

댓글