콘텐츠로 건너뛰기

YOLO26 대YOLO: 실시간 객체 탐지의 진화

컴퓨터 비전 분야는 속도와 정확성의 한계를 끊임없이 넓혀가는 새로운 아키텍처로 인해 급속히 진화하고 있다. 이 과정에서 두 가지 중요한 이정표는 2022년 말 알리바바 그룹이 개발한 YOLO Ultralytics 발표한 최첨단 모델 YOLO26이다.

YOLO YOLO 신경망 구조 탐색(NAS)과 같은 혁신적인 개념을YOLO , YOLO26은 네이티브 엔드투엔드 처리와 에지 우선 설계로의 패러다임 전환을 상징합니다. 본 상세 비교는 이 두 강력한 모델의 아키텍처 차이점, 성능 지표, 배포 현실을 탐구하여 개발자가 객체 탐지 요구에 맞는 적절한 도구를 선택할 수 있도록 돕습니다.

성능 지표 비교

다음 표는 YOLO26과YOLO 성능을 비교합니다. 특히 CPU 기반 작업에서 추론 속도가 크게 개선된 점을 주목하십시오. 이는 YOLO26 아키텍처의 특징입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics : 새로운 표준

2026년 1월 Ultralytics에서 출시된 YOLO26은 YOLO11YOLOv8의 유산을 계승하면서 탐지 파이프라인에 근본적인 변화를 도입했습니다. 주요 설계 철학은 배포 및 훈련 과정의 병목 현상을 제거하는 데 중점을 두어, 고성능 GPU와 제한된 에지 디바이스 모두에서 가장 효율적인 모델로 자리매김했습니다.

주요 혁신

  1. 엔드투엔드 NMS 설계: 이전 세대 및YOLO 같은 경쟁 모델과 달리, YOLO26은 본질적으로 엔드투엔드 구조입니다. 이는 비최대 억제(NMS) 후처리 단계가 필요 없음을 의미합니다. 이로 인해 지연 시간 변동성이 감소하고 배포 파이프라인이 간소화되며, 이는 최초로 YOLOv10에서 최초로 제시된 혁신적인 접근법입니다.
  2. MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련의 최근 발전을 바탕으로, YOLO26은 SGD 하이브리드 방식을 활용합니다. 이 최적화기는 훈련 중 더 큰 안정성과 빠른 수렴을 제공하여 최적의 정확도에 도달하는 데 필요한 계산 비용을 줄입니다.
  3. 에지 우선 최적화: 분포 초점 손실(DFL)을 제거함으로써 모델 아키텍처를 단순화하여 ONNX CoreML 같은 형식으로의 내보내기를 용이하게 합니다. 이는 이전 버전 대비 CPU 속도를 무려 43% 향상시켜 라즈베리 파이 또는 휴대폰과 같은 장치에 이상적입니다.
  4. 소형 물체 탐지 성능 향상: ProgLoss와 STAL(Scale-Aware Training Adaptive Loss)의 통합은 소형 물체에 대한 성능을 크게 개선하여 단일 단계 탐지기의 일반적인 약점을 해결합니다.

간소화된 배포

YOLO26은 NMS 제거하므로, 내보낸 모델은 복잡한 후처리 코드가 없는 순수 신경망입니다. 이로 인해 C++ 또는 모바일 환경으로의 통합이 훨씬 쉬워지고 논리 오류 발생 가능성이 줄어듭니다.

코드 예제

YOLO26의 사용자 경험은 간소화된 Ultralytics Python 일관성을 유지합니다.

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

YOLO26에 대해 더 알아보기

YOLO: NAS 기반의 도전자

알리바바의 다모 아카데미(DAMO Academy)가 개발한 YOLO(YOLO 2022년 신경망 구조 탐색(NAS) 을 활용해 백본을 설계함으로써 주목을 받았다. 연구진은 네트워크 구조를 수동으로 설계하는 대신 보조 에지 방법(MAE-NAS)을 사용해 특정 지연 시간 제약 조건 하에서 효율적인 아키텍처를 자동으로 발견했다.

주요 기능

  • MAE-NAS 백본: 네트워크 구조는 정보 흐름을 극대화하면서 계산 비용을 최소화하도록 수학적으로 최적화되었습니다.
  • RepGFPN: 재매개변수를 활용하여 서로 다른 스케일 간 특징 융합을 개선하는 효율적인 피라미드 특징 네트워크.
  • ZeroHead: 네트워크 말단에서 매개변수 수를 줄이기 위한 경량 감지 헤드 설계.
  • AlignedOTA: 훈련 과정에서 모델이 앵커 박스가 실제 객체와 어떻게 대응되는지 더 잘 이해하도록 돕는 레이블 할당 전략.

YOLO 당시로서는 탁월한 성능을YOLO , 대규모 교사 모델이 소규모 학생 모델을 지도하는 복잡한 증류 훈련 파이프라인에 의존하기 때문에 Ultralytics '처음부터 훈련' 기능에 비해 맞춤형 훈련에 더 많은 자원이 소요됩니다.

상세 비교

아키텍처 및 훈련 안정성

가장 뚜렷한 차이는 최적화 접근법에 있다.YOLO NAS를YOLO 최적 구조를 찾는데, 이는 이론상 매우 효율적인 FLOPs를 제공할 수 있지만 종종 수정하거나 디버깅하기 어려운 아키텍처를 생성한다.

반면 YOLO26은 MuSGD 최적화기로 강화된 수작업으로 설계된 직관적 아키텍처 개선(DFL 제거 및 NMS 헤드 등)을 활용합니다. 이 최적화기는 대규모 언어 모델(LLM)에서 흔히 관찰되는 안정성을 컴퓨터 비전 분야에 도입합니다. 개발자에게 이는 YOLO26이 하이퍼파라미터 조정에 덜 민감하며 사용자 정의 데이터셋에서도 안정적으로 수렴함을 의미합니다.

추론 속도와 자원 효율성

YOLO TensorRT 활용해 GPU YOLO 반면, YOLO26은 보다 포괄적인 접근 방식을 취합니다. DFL(Dispersion-Free Localization)과 NMS 를 제거함으로써 YOLO26은 CPU 환경에서 탁월한 성능을 NMS , 기존 모델 대비 최대 43% 빠른 속도를 달성합니다. 이는 전용 GPU가 없는 에지 디바이스가 사용될 수 있는 소매 분석이나 스마트 시티 애플리케이션에 매우 중요합니다.

또한 YOLO26은 훈련 중 메모리 요구량이 일반적으로 더 낮습니다.YOLO 정수화를 위해 최고 성능을 달성하기 위해 무거운 교사 모델을 훈련해야 하는 경우가YOLO 반면, YOLO26은 직접 최첨단 성능을 달성하여 상당한 GPU 전력을 절약합니다.

다목적성 및 에코시스템

Ultralytics 주요 장점은 다용도성입니다.YOLO 주로 객체 탐지기를 목표로YOLO . 반면 YOLO26 아키텍처는 다음과 같은 다양한 컴퓨터 비전 작업을 기본적으로 지원합니다:

이를 통해 단일 개발 팀이 하나의 API와 하나의 프레임워크로 여러 가지 서로 다른 문제를 해결할 수 있어 기술적 부채를 획기적으로 줄일 수 있습니다.

비교표: 기능

기능YOLO26DAMO-YOLO
릴리스 날짜2026년 1월2022년 11월
아키텍처엔드 투 엔드, NMSNAS 기반, 앵커 프리
후처리없음 (모델 출력 = 최종)비최대 억제(NMS)
최적화기MuSGD (SGD 뮤온)SGD AdamW
훈련 파이프라인단일 단계, 처음부터 훈련복합 증류 (교사-학생)
지원되는 작업detect, segment, Pose, obb, classify객체 탐지
에지 최적화높음 (DFL 없음, CPU 최적화)중간 (TensorRT )

결론

두 아키텍처 모두 객체 탐지 역사에서 중요한 이정표를 나타냅니다.YOLO 자동화된 아키텍처 탐색과 재매개변수의 힘을YOLO . 그러나 YOLO26은 실용적인 AI 배포의 미래를 대표합니다.

NMS 현상을 제거하고 MuSGD와 같은 대규모 언어 모델(LLM) 수준의 최적화기를 도입하며, 분할, 자세 추정, 물체 탐지를 위한 통합 솔루션을 제공함으로써 Ultralytics 성능과 사용 편의성의 탁월한 균형을 제공합니다. 산업 자동화부터 모바일 앱에 이르기까지 실제 애플리케이션을 구축하는 개발자에게는 강력한 생태계, 방대한 문서, 그리고 Ultralytics 덕분에 YOLO26이 확실한 추천 솔루션입니다.

다른 비교에 관심이 있는 분들은 YOLO11 YOLO 살펴보거나, 다음과 같은 트랜스포머 기반 대안을 검토해 볼 수 있습니다. RT-DETR와 같은 트랜스포머 기반 대안을 살펴볼 수 있습니다.

저자 및 참고문헌

YOLO26

DAMO-YOLO

  • 저자: 쉬셴저, 장이치, 천웨이화, 황이룬, 장위안, 쑨시위
  • Organization: Alibaba Group
  • 날짜:23
  • 논문:arXiv:2211.15444

댓글