YOLOv8 YOLO26 비교: 실시간 비전 AI의 진화
컴퓨터 비전 분야는 급속히 진화해 왔으며, You Only Look Once(YOLO) 계열의 각 세대가 속도와 정확도 측면에서 새로운 기준을 제시해 왔습니다. 이 계보에서 두 가지 중요한 이정표는 Ultralytics YOLOv8 와 최첨단 기술인 Ultralytics . YOLOv8 업계 리더들이 의존하는 견고한 생태계와 다중 작업 능력을 YOLOv8 , YOLO26은 엔드투엔드 추론 및 에지 디바이스 최적화와 같은 획기적인 아키텍처 변화를 도입했습니다.
이 가이드는 클라우드 기반 분석부터 리소스 제약이 있는 IoT 애플리케이션에 이르기까지 연구자와 개발자가 특정 배포 요구 사항에 적합한 모델을 선택할 수 있도록 상세한 기술적 비교를 제공합니다.
모델 개요
Ultralytics YOLOv8
2023년 1월 출시된 YOLOv8 객체 탐지, 인스턴스 분할, 자세 추정, 분류, 방향성 바운딩 박스(OBB) 작업을 지원하는 통합 프레임워크로의 중요한 전환점을 YOLOv8 . 앵커 프리 탐지 및 새로운 손실 함수를 도입하여 다양한 산업 분야에서 다용도로 활용 가능한 선택지가 되었습니다.
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직:Ultralytics
- 날짜:10
- GitHub:Ultralytics 리포지토리
Ultralytics YOLO26
2026년 1월 출시된 YOLO26은 효율성과 성능에서 차원이 다른 도약을 보여줍니다. 본질적으로 엔드투엔드(E2E)로 설계되어 추론 과정에서 비최대 억제(NMS) 가 필요하지 않습니다. 이로 인해 특히 CPU 및 에지 하드웨어에서 더 빠른 속도를 구현합니다. 분포 초점 손실(DFL)을 제거하고 MuSGD 최적화기를 도입함으로써, YOLO26은 현대적 배포 제약 조건에 맞게 간소화되었습니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜:14
- GitHub:Ultralytics 리포지토리
아키텍처의 차이점
YOLOv8 전환은 지연 시간 감소와 훈련 안정성 향상을 목표로 하는 근본적인 구조적 변화를 수반합니다.
종단 간 NMS 설계
YOLOv8 같은 기존 탐지기의 가장 큰 병목 현상 중 하나는 중첩된 경계 상자를 걸러내는 NMS(최소 중첩 점수)라는 후처리 YOLOv8 .
- YOLOv8: 고도로 최적화되었지만 필수적인 NMS 사용합니다. 이는 배포 파이프라인을 복잡하게 만들 수 있으며, 특히 ONNX 이나 TensorRT 과 같은 형식으로 내보낼 때 효율적인 NMS 지원이 달라질 수 있습니다.
- YOLO26: NMS(네비게이션 모드 선택)가 NMS 아키텍처를 채택하며, 이는 YOLOv10이 개척한 NMS 없는 아키텍처를 채택합니다. 네트워크에서 직접 1대1 예측을 생성함으로써 내보내기 로직을 단순화하고 추론 지연 시간을 줄여, 라즈베리 파이 또는 모바일 기기에서의 실시간 애플리케이션에 이상적입니다.
손실 함수와 최적화
YOLO26은 훈련 레시피에 몇 가지 새로운 구성 요소를 도입합니다:
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받은 SGD 하이브리드 방식입니다. 이 최적화기는 훈련 모멘텀을 안정화시켜 이전 버전에 SGD 표준 AdamW SGD 비해 더 빠른 수렴을 이끌어냅니다.
- DFL 제거: 분포 초점 손실(DFL)을 제거함으로써 회귀 헤드가 단순화됩니다. 이러한 복잡도 감소는 YOLO26이 CPU에서 최대 43% 더 빠르게 실행될 수 있는 핵심 요소입니다.
- ProgLoss + STAL: 점진적 손실 균형화(Progressive Loss Balancing)와 소형 표적 인식 라벨 할당(Small-Target-Aware Label Assignment, STAL)은 항공 이미지 또는 산업 검사에 사용되는 범용 탐지기의 일반적인 약점인 소형 물체에 대한 성능을 크게 향상시킵니다.
경고: 에지 배포
YOLO26에서 NMS DFL을 제거함으로써 8비트 양자화에 매우 적합해졌습니다. TFLite 또는 CoreML를 사용하여 에지 하드웨어에 배포하는 경우, YOLO26은 YOLOv8 비해 낮은 정밀도에서도 종종 더 높은 정확도를 유지합니다.
성능 지표
다음 표는 COCO YOLOv8 YOLO26 모델의 성능을 비교합니다. YOLO26은 모든 모델 규모에서 우수한 속도와 정확도를 보여주며, 특히 아키텍처 최적화가 빛을 발하는 CPU 두드러집니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
참고: 굵은 글씨는 더 우수한 성능 지표(더 높은 mAP, 더 낮은 속도/매개변수/FLOPs)를 나타냅니다.
학습 효율성 및 사용 편의성
두 모델 모두 "초보자도 쉽게 전문가 수준으로"라는 단순성으로 유명한 성숙한 Ultralytics 혜택을 받습니다.
간소화된 API
YOLOv8 YOLO26을 사용할 때 Python 일관성을 유지합니다. 이를 통해 개발자는 단 한 줄의 코드 변경만으로 아키텍처 간 전환이 가능해져 벤치마킹과 A/B 테스트를 쉽게 수행할 수 있습니다.
from ultralytics import YOLO
# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Load a YOLO26 model
model_26 = YOLO("yolo26n.pt")
# Train YOLO26 on your custom dataset
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)
메모리 및 리소스
YOLO26은 RT-DETR 이전 YOLO 같은 트랜스포머 기반 모델에 비해 훈련 중 메모리 효율성이 현저히 우수합니다. 단순화된 손실 함수와 MuSGD 최적화기를 통해 동일한 GPU 더 큰 배치 크기를 사용할 수 있어 훈련 인프라의 총 소유 비용을 절감합니다. VRAM이 제한된 사용자도 편안하게 미세 조정을 수행할 수 있습니다. yolo26s 또는 yolo26m 표준 소비자용 GPU에서 모델들.
이상적인 사용 사례
YOLOv8 YOLO26 사이의 선택은 특정 제약 조건과 배포 환경에 따라 달라집니다.
8 선택해야 할 때
- 레거시 호환성: YOLOv8 후처리 로직과 깊이 통합되어 쉽게 업데이트할 수 없는 기존 파이프라인이 있는 경우.
- 특정 커뮤니티 플러그인: 일부 오래된 타사 도구나 깊이 내장된 시스템은 여전히 YOLOv8 형식에 대한 경직된 의존성을 가질 수 있으나, Ultralytics 모듈은 대부분의 변환을 원활하게 처리합니다.
YOLO26을 선택해야 할 때
- 에지 컴퓨팅: NVIDIA , 모바일 기기 또는 임베디드 CPU에서 실행되는 애플리케이션에 적용되며, 지연 시간이 1밀리초 단위로 중요한 환경에서 활용됩니다. 43%의 CPU 배터리 구동 장치에 혁신적인 변화를 가져옵니다.
- 소형 물체 탐지: ProgLoss와 STAL의 개선으로 인해 YOLO26은 대상이 종종 멀리 떨어져 있고 작을 때 드론 모니터링이나 농업 검사에 탁월한 선택이 됩니다.
- 간편한 배포: 비표준 환경(예: 맞춤형 FPGA 또는 특수 AI 가속기) NMS 구현의 번거로움을 피하고 싶다면, YOLO26의 종단 간 특성이 이상적입니다.
- 고성능 작업: 의료 영상이나 안전이 중요한 자율 주행 구성 요소 등 가능한 최고 수준의 정확도가 요구되는 작업을 위한 것입니다.
결론
YOLOv8 컴퓨터 비전 분야에서 여전히 강력하고 신뢰할 수 있는 도구로 YOLOv8 있지만, YOLO26은 효율적이고 고성능인 탐지의 미래를 대표합니다. 이 모델의 아키텍처 혁신은 NMS 같은 오랜 배포 과정의 마찰점을 NMS 최첨단 정확도를 제공합니다.
최첨단 기술을 유지하고자 하는 개발자에게 YOLO26으로의 업그레이드는 사용 편의성을 저해하지 않으면서도 속도와 모델 크기 측면에서 즉각적인 이점을 제공합니다. Ultralytics 발전을 최대한 활용하기 위해 신규 프로젝트는 YOLO26으로 시작할 것을 권장합니다.
살펴볼 다른 모델
- YOLO11: YOLO26의 직접적인 전신으로, 구버전에서 전환하는 사용자를 위해 성능과 기능의 균형을 제공합니다.
- YOLOv10: NMS 필요 없는 접근법을 최초로 도입한 모델로, 아키텍처 전환에 대한 학술적 연구에 유용합니다.
- YOLO: 맞춤형 데이터셋 훈련 없이도 물체 식별에 완벽한 오픈 어휘 탐지기로, 탐지를 위해 텍스트 프롬프트를 활용합니다.