YOLO26 대 YOLO11: 컴퓨터 비전 엔지니어를 위한 기술적 비교
실시간 객체 탐지 및 컴퓨터 비전 분야는 계속해서 빠르게 진화하고 있습니다. Ultralytics 이 진화의 최전선에 Ultralytics 속도, 정확성, 사용 편의성의 한계를 지속적으로 넓혀가고 Ultralytics . 본 기술 비교는 YOLO26과 YOLO11의 아키텍처 발전, 성능 지표 및 이상적인 사용 사례를 심층적으로 분석하여 개발자와 연구자가 배포 요구사항에 최적의 모델을 선택할 수 있도록 지원합니다.
경영진 요약
YOLO26은 2026년 1월에 출시된 YOLO 최신 최첨단(SOTA) 모델입니다. 이 모델은 에지 배포를 위해 간소화되고 CPU 최적화된, 기본적으로 종단 간(NMS) 아키텍처를 도입했습니다. YOLO11는 2024년 9월 출시된 전작으로 여전히 강력하고 견고한 선택지이지만, YOLO26은 특히GPU 추론 속도와 아키텍처 단순성 측면에서 이를 능가합니다.
대부분의 신규 프로젝트에서는 우수한 속도-정확도 균형과 간소화된 배포 파이프라인 덕분에 YOLO26이 권장되는 선택입니다.
아키텍처 진화
YOLO11 전환은 높은 정확도를 유지하면서 지연 시간과 복잡성을 줄이기 위한 상당한 구조적 변경을 수반합니다.
YOLO26: 간소화되고 종단 간
YOLO26은 본질적으로 종단간(end-to-end) 설계를 채택함으로써 패러다임 전환을 이루었습니다. 중첩된 바운딩 박스를 필터링하기 위해 비최대 억제(NMS)에 의존하는 기존 YOLO 달리, YOLO26은 이 단계를 완전히 제거했습니다. 이 혁신은 최초로 YOLOv10에서 최초로 제시된 이 혁신은 배포 파이프라인을 단순화하고 추론 지연 시간을 줄여 실시간 애플리케이션에 특히 유리합니다.
YOLO26의 주요 아키텍처 혁신은 다음과 같습니다:
- DFL 제거: 분포 초점 손실(DFL) 모듈이 제거되었습니다. 이 간소화는 저전력 프로세서의 병목 현상을 유발할 수 있는 복잡한 수학적 연산을 TensorRT 에지 디바이스와의 호환성을 향상시키고 ONNX TensorRT 같은 형식으로의 내보내기를 가속화합니다.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법에서 영감을 얻은 YOLO26은 SGD Muon(Moonshot AI의 Kimi K2에서 유래) SGD 결합한 하이브리드 최적화기를 활용합니다. 이를 통해 더 안정적인 훈련 역학과 빠른 수렴을 달성합니다.
- ProgLoss + STAL: 점진적 손실 균형(ProgLoss)과 소형 대상 인식 라벨 할당(STAL)은 드론 영상 및 원격 감지에 있어 핵심 요소인 소형 물체에 대한 성능을 크게 향상시킵니다.
YOLO11: 강력한 선행 모델
YOLO11 C3k2 블록과 SPPF(Spatial Pyramid Pooling - Fast) 모듈을 YOLO11 고효율을 YOLO11 . 정교화된 C2PSA 블록에 어텐션 메커니즘을 적용해 특징 추출 능력을 향상시켰습니다. 매우 효과적이지만, NMS 과정에 의존하는 특성상 YOLO26의 엔드투엔드 접근 방식에 비해 추론 시 약간의 계산 오버헤드가 발생합니다.
엔드투엔드가 중요한 이유
NMS 제거는 모델 출력에 필요한 후처리 코드가 줄어든다는 의미입니다. 이는 배포 시 발생하는 버그 위험을 감소시키고, 추론 시간이 탐지된 객체 수에 따라 변동되지 않으므로 일관된 지연 시간을 보장합니다.
성능 벤치마크
다음 표는 COCO 두 모델 간의 성능 차이를 보여줍니다. YOLO26은 정확도(mAP)와 CPU 속도 모두에서 뚜렷한 우위를 보입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
메트릭 분석
- CPU 속도: YOLO26n은 YOLO11n CPU 약 43% 더 빠릅니다(38.9ms 대 56.1ms). 이로 인해 YOLO26은 라즈베리 파이, 모바일 기기 및 표준 CPU에 배포할 때 더 우수한 선택입니다.
- 정확도(mAP): 모든 스케일에서 YOLO26은 지속적으로 더 높은 평균 정밀도( mAP )를 달성합니다. 'nano' 모델은 39.5에서 40. mAP 크게 향상되어 고속 주행 시 더 우수한 탐지 성능을 제공합니다.
- 모델 효율성: YOLO26은 일반적으로 더 나은 성능을 위해 더 적은 매개변수와 FLOPs를 필요로 하며, 이는 아키텍처 정제와 DFL 헤드 제거로 인한 효율성 향상을 보여줍니다.
훈련 및 최적화
두 모델 모두 강력한 Ultralytics 혜택을 받아 훈련이 용이하고 효율적으로 이루어집니다.
- 사용 편의성: YOLO26과 YOLO11 동일한 통합 Python YOLO11 CLI그들 사이를 전환하는 것은 모델 문자열을 변경하는 것만큼 간단합니다.
yolo11n.pt에서yolo26n.pt. - 훈련 효율성: YOLO26의 MuSGD 최적화기는 훈련 실행을 안정화시켜 수렴에 도달하는 데 필요한 에포크 수를 잠재적으로 줄일 수 있습니다. 이는 특히 ImageNet과 같은 대규모 데이터셋에서 컴퓨팅 비용과 시간을 절약합니다. ImageNet과 같은 대규모 데이터셋의 경우 특히 그렇습니다.
- 메모리 요구 사항: Ultralytics 트랜스포머 기반 대안들에 비해 낮은 메모리 사용량으로 유명합니다. YOLO26은 중복된 헤드 계산을 제거함으로써 이를 더욱 최적화하여 소비자용 GPU에서 더 큰 배치 크기를 허용합니다.
훈련 예시
Ultralytics Python 사용하여 최신 YOLO26 모델을 훈련하는 방법은 다음과 같습니다:
from ultralytics import YOLO
# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
작업의 다용도성과 사용 사례
두 모델 계열 모두 검출, 분할, 분류, 자세 추정, 방향 객체 검출(OBB)을 포함한 광범위한 컴퓨터 비전 작업을 지원합니다.
YOLO26의 이상적인 사용 사례
- 엣지 컴퓨팅: 최대 43% 빠른 CPU 자랑하는 YOLO26은 GPU 부족한 IoT 기기, 스마트 카메라 및 모바일 애플리케이션에 최적입니다.
- 소형 물체 탐지: ProgLoss와 STAL 덕분에 YOLO26은 미세한 세부 사항 탐지가 중요한 항공 감시, 품질 검사, 의료 영상과 같은 시나리오에서 탁월한 성능을 발휘합니다.
- 실시간 로봇공학: NMS 설계는 자율 주행 및 로봇 조작의 제어 루프에 필수적인 결정론적 지연 시간을 보장합니다.
YOLO11의 이상적인 사용 사례
- 레거시 시스템: YOLO11 이미 최적화된 워크플로우나 NMS 중심으로 특정 후처리 파이프라인이 하드코딩된 경우, YOLO11 안정적이고 지원되는 선택지로 YOLO11 .
- 범용 GPU : 강력한 데이터 센터 GPU(예: T4)에서 YOLO11 경쟁력 있는 YOLO11 CPU 덜 중요한 서버 측 배치 처리에 적합합니다.
에코시스템 및 지원
Ultralytics 사용의 가장 큰 장점 중 하나는 주변 생태계입니다. YOLO26과 YOLO11 모두 Ultralytics 에 완벽하게 YOLO11 원활한 모델 관리, 시각화 및 배포가 가능합니다.
- 문서화: 포괄적인 가이드가 데이터 주석 부터 모델 내보내기까지 모든 것을 다룹니다.
- 커뮤니티: GitHub와 Discord의 활발한 커뮤니티를 통해 개발자들은 지원과 공유된 지식을 이용할 수 있습니다.
- 통합: 두 모델 모두 다음과 같은 형식으로의 간편한 내보내기를 지원합니다 ONNX, OpenVINO, TensorRT를 지원하여 다양한 하드웨어 환경에서의 배포를 용이하게 합니다.
결론
YOLO11 매우 우수한 성능을 지닌 모델이지만, YOLO26은 효율성과 아키텍처 단순성 측면에서 획기적인 발전을 이루었습니다. 엔드투엔드 설계, 감소된 CPU , 소형 물체에 대한 향상된 정확도로 인해 현대 컴퓨터 비전 애플리케이션에 최적의 선택입니다. 에지에서 배포하든 클라우드에서 훈련하든, YOLO26은 현재 이용 가능한 성능과 사용성의 최상의 균형을 제공합니다.
모델 상세 정보
YOLO26
저자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2026-01-14
GitHub | 문서
YOLO11
저자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2024-09-27
GitHub | 문서
다른 옵션을 찾는 개발자들은 또한 다음을 살펴볼 수 있습니다 YOLOv10 를 살펴볼 수 있으며, 개방형 어휘 탐지 작업에는 YOLO 활용할 수 있습니다.