YOLO26 대YOLO: 실시간 객체 탐지 기술의 진화
컴퓨터 비전 분야의 급속한 발전 속에서, 정확도, 속도, 배포 가능성 사이의 균형을 맞추기 위해서는 올바른 객체 탐지 모델을 선택하는 것이 매우 중요합니다. 본 비교 분석에서는 YOLO26, 즉 Ultralytics의 최신 에지 최적화 제품인 YOLO26과 알리바바 그룹이 개발한 고성능 탐지기 YOLO 비교합니다. 두 모델 모두 중요한 아키텍처 혁신을 도입했지만, 배포 파이프라인에서 약간 다른 우선순위를 목표로 합니다.
모델 개요
Ultralytics YOLO26
YOLO26은 단순성과 에지 효율성을 향한 패러다임 전환을 상징합니다. 2026년 1월 출시된 이 모델은 CPU 장치에서도 최첨단 성능을 제공하면서 기존 후처리 과정의 복잡성을 제거하도록 설계되었습니다. 객체 탐지, 인스턴스 분할, 자세 추정, 분류, 방향성 바운딩 박스(OBB) 탐지 등 다양한 작업을 기본적으로 지원합니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜: 2026년 1월 14일
- GitHub:Ultralytics 리포지토리
DAMO-YOLO
YOLO 고급 신경망 아키텍처 검색(NAS)과 중대한 재매개변수를 통해 속도와 정확도 간의 균형 최적화에 중점을 둡니다. 알리바바의 TinyVision 팀이 개발한 이 모델은 RepGFPN 및 ZeroHead와 같은 새로운 구성 요소를 도입하여 특징 추출 효율을 극대화하며, 주로 범용 GPU 대상으로 합니다.
- 작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- Organization: Alibaba Group
- 날짜: 2022년 11월 23일
- Arxiv:YOLO
- GitHub:YOLO 리포지토리
기술 아키텍처 비교
종단 간 대 전통적 NMS
가장 중요한 운영상의 차이는 예측이 최종 확정되는 방식에 있다.
YOLO26은 기본적으로 종단 간 NMS Suppression)NMS NMS 설계를 활용합니다. 네트워크에서 직접 최종 예측을 생성함으로써 NMS 필요성을 제거합니다. 이러한 후처리 제거는 지연 시간 변동성을 줄이고 배포 파이프라인을 단순화합니다. 특히 라즈베리 파이(Raspberry Pi )나 모바일 기기와 같은 에지 하드웨어에서 NMS 병목 현상이 될 수 있는 경우에 더욱 그렇습니다. 이 접근법은 YOLOv10 에서 성공적으로 선구적으로 도입되었으며, 여기서 더욱 정교화되었습니다.
YOLO 중첩된 박스를 NMS 필요한 보다 전통적인 밀집 예측 헤드(ZeroHead)에 의존합니다. 효과적이긴 하지만, 이는 추론 과정에서 탐지된 객체 수에 비례하여 증가하는 계산 단계를 추가하여 혼잡한 장면에서 잠재적으로 지연 변동을 유발할 수 있습니다.
훈련 혁신: MuSGD 대 NAS
YOLO26은 MuSGD 최적화기를 도입합니다. 이는 SGD 과 뮤온(Muon )의 하이브리드입니다. Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM) 훈련의 혁신에서 영감을 받은 이 최적화기는 더 안정적인 훈련 역학과 더 빠른 수렴을 제공하여 사용자가 더 적은 에포크로 최적의 성능에 도달할 수 있도록 합니다.
YOLO MAE-NAS 방식을 통해 신경망 구조 탐색(NAS) 을 활용하여 효율적인 백본 구조를 자동으로 발견합니다. 또한 다중 스케일에서 특징을 융합하는 중량급 재매개변수화 넥(heavy re-parameterization neck)인 효율적인 RepGFPN을 사용합니다. 이러한 NAS 기반 아키텍처는 강력하지만, Ultralytics 수동으로 설계된 간소화된 블록에 비해 수정하거나 미세 조정하기가 직관적이지 않을 수 있습니다.
손실 함수
YOLO26은 Distribution Focal Loss(DFL)를 제거하여 다음과 같은 형식으로의 내보내기를 간소화합니다. CoreML 및 TensorRT으로의 내보내기를 간소화합니다. 대신 ProgLoss와 소형 대상 인식 라벨 할당(STAL) 을 사용하는데, 이는 항공 촬영 및 의료 분석과 같은 분야에서 흔히 발생하는 문제점인 소형 객체에 대한 성능을 크게 향상시킵니다.
YOLO 분류와 회귀 작업 간의 불일치를 해결하는 레이블 할당 전략인 AlignedOTA를 활용합니다. 이는 훈련 과정에서 고품질 앵커가 가장 관련성 높은 지상 진실에 할당되도록 보장하는 데 중점을 둡니다.
YOLO26의 에지 최적화
DFL과 NMS 제거함으로써 YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 달성합니다. 이는 GPU 없는 환경, 예를 들어 기기 내 스마트 주차 관리와 같은 "엣지 AI" 애플리케이션에 특히 적합합니다.
성능 지표
다음 표는 성능 차이를 보여줍니다. YOLO26은 특히 매개변수 수와 FLOPs 측면에서 뛰어난 효율성을 보여주면서도 경쟁력 있는 또는 우수한 정확도를 유지합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
주요 내용
- 효율성: YOLO26n(Nano)은 DAMO-YOLOt 대비 매개변수 규모가 약 3.5배 작고 FLOPs가 3.3배 낮으면서도 유사한 정확도를 달성합니다. 이러한 계산 부하의 급격한 감소로 인해 YOLO26은 모바일 및 IoT 배포에 훨씬 더 적합합니다.
- 정확도 확장성: 모델 규모가 커질수록 YOLO26m은 DAMO-YOLOm보다 약 4.0 mAP 높은 성능을 보이며, 더 적은 매개변수(20.4M vs 28.2M)를 사용합니다.
- 속도: YOLO26은 모든 규모에서 T4 GPU 상에서 지속적으로 더 빠른 추론 시간을 제공하며, 이는 영상 분석과 같은 고처리량 애플리케이션에 매우 중요합니다.
사용성 및 에코시스템
단순성과 문서화
특징 중 하나는 Ultralytics 모델의 장점은 사용 편의성입니다. YOLO26은 통합되어 있습니다. ultralytics Python , 사용자가 단 몇 줄의 코드로 모델을 훈련, 검증 및 배포할 수 있게 해줍니다.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)
반면 YOLO 연구 중심의 저장소입니다. 훈련 및 추론을 위한 스크립트를 제공하지만, Ultralytics 제공하는 통합 API, 포괄적인 가이드, 광범위한 OS 지원(Windows, Linux, macOS)은 부족합니다.
배포 및 내보내기
YOLO26은 10가지 이상의 형식으로 원클릭 내보내기를 지원합니다. ONNX, OpenVINO, CoreML, TFLite 등 10개 이상의 포맷으로 원클릭 내보내기를 지원합니다. 이러한 유연성은 연구 단계에서 생산 단계로 넘어가는 엔지니어에게 매우 중요합니다. DFL과 같은 복잡한 모듈을 제거함으로써 이러한 내보내기가 견고해지고 더 다양한 하드웨어 가속기와 호환됩니다.
YOLO 내보내기 과정에서 신중하게 처리해야 하는 특정 재매개변수화 단계를 기반으로YOLO . 훈련 모드에서 배포 모드로 올바르게 "전환"되지 않을 경우 모델 성능이 저하되거나 실행에 실패할 수 있어 사용자에게 추가적인 복잡성을 초래합니다.
실제 사용 사례
YOLO26의 이상적인 시나리오
- 에지 디바이스 및 IoT: 최소한의 메모리 공간(2.4M 파라미터부터 시작)을 차지하는 특성 덕분에 YOLO26은 전력과 RAM이 제한된 보안 카메라 및 드론에 이상적입니다.
- 실시간 스포츠 분석: NMS 설계로 일관된 지연 시간을 보장하며, 이는 스포츠 애플리케이션에서 빠르게 움직이는 물체를 추적하는 데 매우 중요합니다.
- 멀티태스킹 시스템: YOLO26은 세그멘테이션, 포즈, OBB를 기본적으로 지원하므로 방향과 그랩 포인트가 필요한 로봇 조작과 같은 복잡한 파이프라인에 최적의 선택입니다.
YOLO 위한 이상적인 시나리오
- 학술 연구: NAS(네트워크 아키텍처 검색) 및 고급 증류 기법을 활용함으로써, 이 연구는 아키텍처 검색 방법론을 연구하는 연구자들에게 유력한 후보로 부상하고 있다.
- 고성능 GPU : 하드웨어 제약이 전혀 없고 특정 벤치마크에서 정확도의 극미한 차이까지 중요한 시나리오에서는YOLO 강력한 백본을 효과적으로 활용할 수 있습니다.
결론
YOLO 2022년 당시 인상적인 아키텍처 탐색 및 재매개변수화 개념을YOLO , YOLO26은 2026년의 최첨단 기술을 대표합니다. 엔드투엔드 단순성에 집중하고 NMS DFL과 같은 병목 현상을 제거하며 매개변수 수를 대폭 줄임으로써, YOLO26은 현대 AI 개발자에게 보다 실용적이고 빠르며 사용자 친화적인 솔루션을 제공합니다.
오늘날 강력한 컴퓨터 비전 솔루션을 배포하려는 사용자에게는 Ultralytics 플랫폼과의 원활한 통합과 뛰어난 와트당 성능 효율성 덕분에 YOLO26이 확실한 추천 솔루션입니다.
추가 자료
다른 건축적 접근법에 관심이 있는 분들은 문서에서 다음과 같은 관련 모델을 살펴보세요:
- YOLO11 - 다용도와 정확성을 위한 이전 세대 표준.
- RT-DETR - 변압기 기반 실시간 검출기로, NMS 없이도 추론이 가능합니다.
- YOLOv10 - YOLO26에 사용된 엔드투엔드 NMS 훈련 방식의 선구자.