YOLO26 대 YOLO11: 비전 AI의 세대적 도약
최첨단 컴퓨터 비전 시스템을 구축할 때 정확도, 지연 시간, 자원 효율성 사이의 균형을 맞추기 위해서는 올바른 모델 선택이 매우 중요합니다. 빠르게 진화하는 인공지능 환경에서, Ultralytics 은 가능성의 한계를 계속해서 넓혀가고 있습니다. 이 상세한 기술 비교는 매우 성공적인 YOLO11 에서 혁신적인 신기술 YOLO26으로의 전환 과정을 분석하여, AI 엔지니어와 연구자들이 정보에 기반한 아키텍처 결정을 내리는 데 필요한 통찰력을 제공합니다.
모델 계보 및 메타데이터
두 모델 모두 Ultralytics 개발되었지만, 객체 탐지 및 다중 작업 비전 모델의 발전 과정에서 서로 다른 패러다임을 대표합니다.
YOLO26 세부 사항:
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜:14
- GitHub:Ultralytics 리포지토리
- 문서:YOLO26 공식 문서
YOLO11 :
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜:27
- GitHub:Ultralytics 리포지토리
- 문서:YOLO11 문서
기타 아키텍처
YOLO26이 당사의 가장 진보된 실시간 모델이지만, 고도로 전문화된 하드웨어나 대용량 메모리를 다루는 사용자는 다음과 같은 트랜스포머 기반 아키텍처도 고려해볼 수 있습니다. RT-DETR 이나 획기적인 NMS 선구자 YOLOv10을 살펴볼 수도 있습니다.
건축적 차이점과 혁신
YOLO11 도약은 모델 아키텍처와 기초적인 훈련 방식 모두에서 근본적인 변화를 수반합니다. YOLO11 객체 탐지 및 다중 작업 학습을 위한 견고한 기준점을 YOLO11 , YOLO26은 엣지 컴퓨팅을 위한 배포 파이프라인을 완전히 개편합니다.
종단 간 NMS 설계
YOLO26의 가장 중요한 업그레이드 중 하나는 기본적으로 엔드투엔드(end-to-end) 아키텍처를 채택했다는 점입니다. 중첩된 바운딩 박스를 필터링하기 위해 비최대 억제(NMS) 후처리 단계에 의존하는 YOLO11 달리, YOLO26은 이 단계를 완전히 제거했습니다. 이 개념은 최초로 YOLOv10에서 처음 도입된 이 개념은 지연 시간 변동성을 획기적으로 줄이고 다양한 에지 디바이스 전반에 걸친 배포 로직을 단순화합니다.
에지 효율성을 위한 DFL 제거
YOLO11 경계 상자 추정 정밀도를 높이기 위해 분포 초점 손실(DFL)을 YOLO11 . 그러나 DFL은 복잡한 소프트맥스 연산에 의존하는데, 이는 저전력 에지 가속기에서 제대로 지원되지 않는 경우가 많습니다. YOLO26은 정확도를 저하시키지 않으면서 DFL을 성공적으로 제거했습니다. 이러한 아키텍처 단순화는 임베디드 시스템과의 호환성을 크게 향상시켰으며, YOLO26이 이전 버전 대비 최대 43% 빠른 CPU 달성할 수 있게 했습니다.
MuSGD 최적화기
훈련 안정성과 속도가 가장 중요합니다. YOLO26은 무스샷 AI의 Kimi K2에서 영감을 받은 확률적 경사 하강법(SGD)과 뮤온(Muon)의 하이브리드인 MuSGD 최적화기를 도입합니다. 이 최적화기는 컴퓨터 비전 분야에 언어 모델 훈련의 안정성을 가져와, 무거운 트랜스포머 기반 대안들에 비해 더 빠른 수렴을 보장하고 훈련 중 메모리 사용량을 줄입니다.
프로그레시브 손실 및 STAL
항공 이미지나 드론 애플리케이션을 다루는 연구자들에게 미세한 특징을 탐지하는 것은 오랜 과제였습니다. YOLO26은 STAL(Scale-Targeted Attention Loss)과 결합된 ProgLoss를 도입하여 YOLO11 대비 소형 물체 인식 성능에서 현저한 개선을 이루었습니다.
성능 및 지표 비교
두 모델을 직접 비교했을 때, YOLO26은 정확도와 에지 디바이스 효율성 측면에서 뚜렷한 우위를 보이며, 동시에 Ultralytics 특징인 놀라울 정도로 낮은 메모리 요구 사항을 유지합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
참고: YOLO26 nano(YOLO26n) 모델은 YOLO11n 대비 CPU 약 31% 향상된 성능(38.9ms 대 56.1ms)을 보여주며, 이는 에지 우선 설계 철학을 잘 보여줍니다.
다양한 컴퓨터 비전 작업에 걸친 다용도성
두 모델 모두 철저히 관리되는 Ultralytics 혜택을 받아 통합된 Python 통해 비교할 수 없는 사용 편의성을 제공합니다. 이들은 단순한 객체 탐지기가 아닌 다중 작업의 핵심 엔진입니다. 그러나 YOLO26은 여러 작업별 개선 사항을 포함합니다:
- 인스턴스 분할: YOLO26은 개선된 의미론적 분할 손실과 다중 스케일 프로토타이핑을 사용하여 YOLO11 선명한 마스크 경계를 생성합니다. 분할 워크플로에 대해 자세히 알아보세요.
- 자세 추정: 잔차 로그 가능도 추정(RLE)을 통합함으로써 YOLO26은 복잡한 인간 자세에서 키포인트 정확도를 획기적으로 향상시킵니다. 자세 추정 기능을 확인해 보세요.
- 방향성 바운딩 박스(OBB): 특수한 각도 손실 함수가 과거 경계 불연속성 문제를 해결하여, YOLO26이 위성 영상에서 회전된 물체를 탐지하는 데 탁월한 신뢰성을 제공합니다. OBB 작업에 대해 알아보세요.
- 이미지 분류: 두 모델 모두 고속 분류를 효율적으로 처리하며, YOLO26은 ImageNet 상위 1위 정확도에서 미미한 개선을 보여줍니다.
훈련 및 추론 코드 예시
Ultralytics 개발자 경험으로 Ultralytics . 최첨단 모델을 훈련하거나 추론 스크립트를 실행하는 데는 몇 줄의 코드만으로도 충분하여, 반복적인 코드 작업을 최소화하고 생산성을 극대화합니다. 또한 YOLO 훈련에는 대규모 트랜스포머 네트워크보다 훨씬 적은 CUDA 필요합니다.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()
이상적인 사용 사례 및 배포 전략
YOLO26과 YOLO11 사이의 선택은 전적으로 생산 환경의 제약 조건에 YOLO11 .
YOLO26을 언제 배포해야 할까?
YOLO26은 현대적인 신규 프로젝트를 위한 최적의 선택입니다. 특히 다음과 같은 용도로 설계되었습니다:
- 엣지 컴퓨팅과 IoT: 놀라운 CPU DFL 제거 기능으로 라즈베리 파이, 코랄 NPU, 모바일 프로세서 같은 장치들의 최강자로 자리매김했습니다.
- 드론 및 항공 분석: ProgLoss와 STAL의 통합으로 광활한 지형에서 작고 빠르게 움직이는 물체를 추적하는 독보적인 능력을 갖추게 되었습니다.
- 지연 시간이 중요한 애플리케이션: 자율 로봇 공학이나 제조 품질 관리 분야에서 NMS 설계는 예상치 못한 후처리 지연 증가 없이 결정론적 지연 시간을 보장합니다.
YOLO11 유지해야 할 때
YOLO26이 더 우수하지만, YOLO11 매우 뛰어난 성능을 지닌 모델입니다. YOLO11 계속 사용할 수 있습니다:
- 레거시 파이프라인: 기존 C++ 배포 인프라는 구형 아키텍처의 특정 앵커 기반 출력 및 NMS 긴밀하게 결합되어 있습니다.
- 학술적 기준선: 귀하는 연구를 발표 중이며, 귀하의 새로운 알고리즘을 평가하기 위한 높은 인지도의 2024년 기준이 필요합니다.
Ultralytics 힘
YOLO11 배포하든 YOLO26을 YOLO11 , Ultralytics 활용한다는 것은 빈번한 업데이트와 방대한 커뮤니티 지원을 갖춘 잘 관리된 생태계를 활용하는 것을 의미합니다.
기업 팀을 위해 Ultralytics 데이터 어노테이션, 모델 훈련 및 원활한 클라우드 배포를 위한 종단간 솔루션을 제공합니다. 훈련된 가중치를 내보내는 것부터 CoreML 또는 TensorRT로 내보내는 것부터 고급 하이퍼파라미터 튜닝 구성에 이르기까지, 제공되는 도구는 AI 라이프사이클을 최대한 간소화합니다.