콘텐츠로 건너뛰기

YOLO26 대 YOLOX: 실시간 객체 탐지의 진화

컴퓨터 비전 분야는 지난 5년간 급속히 진화하여 복잡한 앵커 기반 아키텍처에서 간소화된 고성능 모델로 전환되었습니다. 이 비교는 해당 발전 과정에서 핵심적인 두 모델을 살펴봅니다: 2021년 출시된 획기적인 앵커 프리 탐지기 YOLOX와 2026년 Ultralytics 공개한 최첨단 비전 모델 YOLO26입니다. YOLOX가 현대적 아키텍처 설계의 많은 방향을 제시했다면, YOLO26은 이러한 발전의 정점을 이루며 뛰어난 속도, 정확도, 그리고 배포 용이성을 제공합니다.

모델 개요

Ultralytics YOLO26

2026년 1월 출시된 YOLO26은 차세대 엣지 AI를 위해 설계되었습니다. 이 모델은 네이티브 엔드투엔드(NMS 불필요) 아키텍처를 도입하여 배포 과정에서 병목 현상을 일으키는 후처리 단계를 제거했습니다. 대규모 언어 모델 훈련에서 영감을 받은 MuSGD 최적화기를 도입하고 분포 초점 손실(DFL)을 제거함으로써, YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 속도를 달성하여 IoT 애플리케이션 및 로봇 공학 분야의 최상의 선택이 되었습니다.

글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)
Ultralytics
2026년 1월 14일
GitHub | 문서

YOLO26에 대해 더 알아보기

YOLOX

메그비(Megvii)가 2021년 출시한 YOLOX는 분리형 헤드와 SimOTA 레이블 할당으로 전환한 최초의 고성능 "앵커 프리" 탐지기 중 하나였습니다. 당시 학계 연구와 산업적 적용 사이의 간극을 성공적으로 메웠으며, 훈련 안정성을 위한 앵커 박스와 NMS 제거함으로써 YOLOv4 및 YOLOv5 같은 선행 모델들보다 더 깔끔한 설계를 제공했습니다. 다만 NMS 여전히 NMS 필요했습니다.

정거, 류송타오 외.
메그비
2021년 7월 18일
ArXiv | GitHub

기술 성능 비교

다음 표는 두 모델 간의 성능 차이를 보여줍니다. YOLO26은 정확도(mAP)와 효율성 모두에서 상당한 향상을 보이며, 특히 아키텍처가 저지연 실행에 최적화된 CPU .

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

성능 컨텍스트

YOLOXnano는 매개변수와 FLOPs가 낮지만, YOLO26n ( mAP 40.9 mAP )에 비해 훨씬 낮은 해상도(416px)와 정확도(25.8 mAP)로 작동합니다. 유효 정확도로 정규화했을 때, YOLO26은 훨씬 우수한 추론 지연 시간을 제공합니다.

아키텍처 혁신

종단 간 처리 vs. 후처리

가장 중요한 차이점은 배포 파이프라인에 있습니다. YOLOX는 앵커가 없지만 중복 바운딩 박스를 필터링하기 위해 여전히 비최대 억제(NMS) 에 의존합니다. NMS 정렬 및 순차적 연산을 포함하기 때문에 컴퓨팅 NMS FPGA나 NPU 같은 에지 하드웨어에서 최적화하기 어렵습니다.

YOLO26은 엔드투엔드(end-to-end) 설계를 기본적으로 채택하며, 이 개념은 YOLOv10에서 처음 제안된 개념입니다. 이 설계는 NMS 없이 네트워크에서 직접 최종 탐지 결과를 출력합니다. 그 결과 다음과 같은 장점이 있습니다:

  1. 낮은 지연 시간: 후처리 오버헤드 없음.
  2. 결정론적 지연 시간: 추론 시간은 객체 밀도와 무관하게 일정합니다.
  3. 간소화된 배포: ONNX 또는 TensorRT 으로의 내보내기는 사용자 정의 NMS 필요하지 않아 간단합니다.

훈련 안정성: MuSGD 대 SGD

YOLOX는 2021년에 발전된 분리된 헤드를 가진 표준 확률적 경사 하강법(SGD)을 활용합니다. 그러나 YOLO26은 SGD 뮤온 최적화기(Moonshot AI의 Kimi K2에서 영감을 얻음)의 하이브리드인 MuSGD 최적화기를 도입합니다. 이 혁신은 대규모 언어 모델(LLM) 훈련에서 얻은 안정성 특성을 컴퓨터 비전 분야로 가져와, 훈련 과정에서 더 빠른 수렴과 더 강력한 특징 추출을 가능하게 합니다.

손실 함수

YOLOX는 IoU 분리된 헤드 전략을 사용합니다. YOLO26은 ProgLoss + STAL (소프트 타겟 할당 손실)로 이를 발전시켰습니다. 이 조합은 단일 단계 탐지기의 전통적인 약점인 소형 객체 탐지 문제를 특별히 해결합니다. ProgLoss는 훈련 중 손실 가중치를 동적으로 조정하여 훈련이 진행됨에 따라 모델이 더 어려운 사례(주로 작거나 가려진 객체)에 집중할 수 있게 합니다.

에코시스템 및 사용 편의성

두 프레임워크를 구분하는 결정적인 차이점 중 하나는 그들을 둘러싼 생태계이다.

Ultralytics 이점

YOLO26을 사용하면 데이터 관리, 주석 작업 및 모델 훈련을 위한 포괄적인 도구 모음인 Ultralytics 에 접근할 수 있습니다.

  • 통합 API: 객체 탐지, 인스턴스 분할, 자세 추정 또는 방향성 경계 상자(OBB) 탐지를 수행하든 API는 일관성을 유지합니다.
  • 제로 투 히어로: python 5줄 미만으로 설치부터 맞춤형 데이터셋 훈련까지 진행할 수 있습니다.
  • 수출 유연성: 모델을 원활하게 내보내기 CoreML, OpenVINO, TFLite 등 다양한 플랫폼으로 단일 명령어로 원활하게 모델을 내보낼 수 있습니다.
from ultralytics import YOLO

# Load the model
model = YOLO("yolo26n.pt")

# Train on custom data
model.train(data="coco8.yaml", epochs=100)

# Export for deployment
model.export(format="onnx")

YOLOX 복잡성

YOLOX는 주로 연구용 저장소입니다. 강력하지만 데이터셋과 훈련 파이프라인에 대한 수동 구성이 더 많이 필요합니다. 동일한 저장소 내에서 표준 탐지(포즈나 분할 등) 외의 작업에 대한 기본 지원이 부족하며, 에지 형식으로 내보내려면 종종 외부 스크립트나 타사 도구(예: onnx-simplifier)입니다.

실제 응용 분야

스마트 리테일 및 재고 관리

재고 관리가 필요한 소매 환경에서는 YOLO26이 탁월한 선택입니다. DFL(분포 초점 손실) 제거와 엔드투엔드 아키텍처 덕분에 스마트 선반 카메라에 탑재된 저전력 ARM CPU에서도 효율적으로 작동합니다. YOLO26(48.6 mAP)이 YOLOX(40.5 mAP) 대비 향상된 정확도는 오탐률을 줄이면서 재고 정확도를 높여줍니다.

자율 드론 항법

드론은 최소한의 지연 시간으로 고해상도 영상을 처리해야 합니다. YOLO26은 ProgLoss 덕분에 이 부분에서 탁월한 성능을 발휘하는데, 이는 항공 촬영에서 멀리 있는 차량이나 전선 같은 작은 물체의 탐지 능력을 향상시킵니다. NMS 출력은 드론 제어 루프가 일정한 속도로 데이터를 수신하도록 보장하며, 이는 충돌 회피 시스템에 매우 중요합니다. 반면 YOLOX의 NMS 의존성은 복잡한 환경(예: 숲이나 군중 위 비행)에서 지연 시간 급증을 유발할 NMS 비행 안정성을 위협할 수 있습니다.

산업용 로봇공학

제조업에서 로봇 팔은 픽 앤 플레이스 작업에 종종 비전 기술을 활용합니다. YOLO26 생태계는 OBB(Oriented Bounding Boxes)를 지원하며, 이는 물체의 각도를 제공하여 축 정렬되지 않은 물체를 잡는 데 필수적입니다. YOLOX는 OBB 지원을 위해 상당한 수정이 필요한 반면, YOLO26은 기본적으로 이를 지원합니다.

결론

YOLOX가 앵커 프리 탐지를 대중화한 중요한 이정표였다면, YOLO26은 효율적인 컴퓨터 비전의 미래를 상징합니다. 엔드투엔드 설계, 우수한 정확도 대 지연 시간 비율, 그리고 Ultralytics 강력한 지원을 바탕으로, YOLO26은 2026년 학술 연구와 상업적 배포 모두에 권장되는 선택지입니다.

다양한 아키텍처 상의 절충점을 필요로 하는 개발자들을 위해, YOLO11 검증된 대안을 제공하며, RT-DETR 는 GPU 풍부한 환경에서 높은 정확도를 제공합니다.


댓글