콘텐츠로 건너뛰기

YOLOX 대 YOLO26: 앵커 프리에서 엔드 투 엔드 객체 탐지로의 진화

컴퓨터 비전 분야는 지난 10년간 놀라운 변화를 겪어왔습니다. 이 여정에서 두 가지 중요한 이정표는 앵커 프리 아키텍처를 대중화한 YOLOX의 출시와, 최근 Ultralytics 도입입니다. 후자는 네이티브 엔드투엔드 방식과 NMS 프리 설계로 실시간 성능을 완전히 재정의했습니다. 본 포괄적 비교 분석은 두 기술의 아키텍처, 성능 지표, 이상적인 배포 시나리오를 탐구하여 개발자들이 차기 AI 프로젝트를 위한 정보에 기반한 결정을 내리는 데 도움을 줍니다.

모델 개요

각 모델의 기원과 주요 설계 목표를 이해하는 것은 해당 모델의 기술적 성과를 이해하는 데 필수적인 맥락을 제공한다.

YOLOX

저자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
소속: 메그비
날짜: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
문서: YOLOX ReadTheDocs

2021년 중반에 소개된 YOLOX는 앵커 없는 설계와 분리된 헤드, 그리고 SimOTA로 알려진 진보된 레이블 할당 전략을 채택함으로써 중대한 전환을 이루었습니다. 기존 아키텍처를 지배하던 전통적인 앵커 박스 메커니즘에서 벗어나면서, YOLOX는 학술 연구와 산업적 적용 사이의 간극을 성공적으로 메웠으며, 우아하면서도 매우 효과적인 객체 탐지 프레임워크를 제공했습니다.

YOLOX에 대해 자세히 알아보세요

YOLO26

저자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2026-01-14
GitHub: ultralytics/ultralytics
플랫폼: Ultralytics 플랫폼

2026년 초 출시된 YOLO26은 수년간의 반복적 개선을 통해 완성된 모델로, 특히 에지 배포와 간소화된 훈련 파이프라인에 중점을 두었습니다. 이 모델은 종단간 NMS(Non-Maximum Suppression) NMS 필요 없는 설계를 도입하여 기존의 NMS 후처리 단계를 완전히 제거했습니다. 이 혁신은 다양한 하드웨어에 걸친 모델 배포를 획기적으로 단순화합니다. 또한 분포 초점 손실(DFL) 모듈을 제거함으로써 YOLO26은 지연 시간을 현저히 낮추었으며, 이는 현대 컴퓨터 비전 애플리케이션을 위한 최상의 선택이라는 입지를 공고히 합니다.

YOLO26에 대해 더 알아보기

아키텍처 혁신

이 두 모델의 아키텍처는 특히 손실 함수와 후처리 측면에서 딥 러닝 방법론의 급속한 발전을 보여준다.

YOLOX 접근법

YOLOX는 예측 헤드에서 분류와 회귀 작업을 분리하여 훈련 중 수렴 속도를 크게 가속화했습니다. 앵커 프리 특성으로 설계 매개변수 수가 감소하여 훈련 전 복잡한 앵커 튜닝의 필요성을 완화했습니다. SimOTA 레이블 할당 알고리즘과 결합된 YOLOX는 당시 최첨단 성능을 달성했으며, 특히 COCO 같은 표준 벤치마크에서 두드러진 성과를 보였습니다.

YOLO26의 장점

YOLO26은 아키텍처 효율성을 한 단계 끌어올립니다. NMS 제거는 추론 지연 시간을 단축할 NMS 아니라 일관되고 결정론적인 실행 시간을 보장합니다. 이는 자율주행 차량과 로봇 공학에 있어 핵심 요소입니다.

YOLO26의 주요 혁신 사항은 다음과 같습니다:

  • MuSGD Optimizer: 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받은 SGD와 Muon의 이 하이브리드는 탁월하게 안정적인 훈련 실행과 더 빠른 수렴을 보장합니다.
  • 최대 43% 더 빠른 CPU 추론: DFL을 제거하고 네트워크 아키텍처를 간소화함으로써, YOLO26은 단순한 IoT 센서부터 Raspberry Pi 보드에 이르기까지 리소스 제약이 있는 엣지 장치에 고도로 최적화되었습니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수들은 작은 객체 인식에서 상당한 개선을 제공하며, 이는 항공 이미지 분석 및 제조 자동화에서 정밀 품질 관리를 수행하는 데 중요합니다.

엣지 우선 최적화

프로젝트가 전용 GPU가 없는 임베디드 시스템이나 모바일 애플리케이션을 대상으로 하는 경우, YOLO26의 최적화된 CPU 이전 세대 모델보다 훨씬 적은 계산 오버헤드를 요구하여 막대한 이점을 제공합니다.

성능 및 벤치마크

생산 환경용 모델을 평가할 때 정확도, 속도, 계산 복잡성 간의 균형을 분석하는 것이 가장 중요합니다. 아래는 640픽셀(나노/소형 변형은 416픽셀) 이미지 크기로 평가된 표준 모델들의 상세 비교입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

표에서 알 수 있듯이, YOLO26 시리즈는 우수한 성능 균형을 제공합니다. 예를 들어, YOLO26x ~의 파라미터 중 거의 절반만 활용하면서 인상적인 57.5 mAP를 달성합니다 YOLOXx 모델은 GPU 시간을 직접적으로 단축시켜(11.8ms 대 16.1ms) 훨씬 뛰어난 배포 유연성을 제공합니다.

교육 및 생태계 경험

이러한 아키텍처 간의 가장 근본적인 차이점 중 하나는 사용성과 생태계 지원에 있습니다.

YOLOX는 여전히 기울기 흐름과 앵커 프리 메커니즘을 연구하는 연구자들에게 기초적인 저장소 역할을 하지만, 설정 과정이 복잡할 수 있으며 종종 종속성과 연산자를 수동으로 구성해야 합니다. 반면, Ultralytics 은 사용 편의성 측면에서 업계 표준을 제시합니다.

통합 Python API를 활용함으로써 개발자는 비교할 수 없는 단순성으로 YOLO26 모델을 초기화, 훈련 및 배포할 수 있습니다. 시스템은 데이터셋 다운로드, 하이퍼파라미터 튜닝 및 ONNX, TensorRT 및 OpenVINO와 같은 형식으로의 원활한 내보내기를 본질적으로 처리합니다.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

또한 Ultralytics YOLO 무거운 트랜스포머 기반 대안들에 비해 훈련 중 메모리 요구량이 현저히 낮아, 엔지니어들이 소비자용 하드웨어에서도 더 큰 배치 크기로 훈련할 수 있게 합니다.

실제 응용 분야

YOLOX와 YOLO26 사이의 선택은 궁극적으로 배포 제약 조건과 다중 작업 요구 사항에 따라 달라집니다.

YOLOX가 뛰어난 점

YOLOX는 특정 학술 벤치마크와 MegEngine 프레임워크와 깊이 통합된 레거시 시스템에 여전히 유효한 후보로 남아 있습니다. 역사적 중요성으로 인해 앵커 프리 탐지기 및 맞춤형 할당 전략 연구를 위한 인기 있는 기준선 역할을 합니다.

YOLO26이 뛰어난 점

YOLO26은 근본적으로 현대 산업용 애플리케이션을 위해 설계되었습니다. 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB)를 기본적으로 지원하기 때문에 표준 탐지 엔진보다 훨씬 더 다용도로 활용할 수 있습니다.

  • 스마트 리테일 및 재고: NMS-free 설계를 활용하면 자동화된 결제 시스템이 초저지연 시간으로 비디오 피드를 처리하여 후처리 루프의 병목 현상 없이 제품을 인식할 수 있습니다.
  • 드론 및 항공 분석: OBB를 위한 특수 각도 손실과 ProgLoss + STAL 통합은 YOLO26을 광대한 위성 이미지에서 회전된 객체와 작은 인공물을 detect하는 데 타의 추종을 불허하게 만듭니다.
  • 엣지 보안 시스템: 최대 43% 더 빠른 CPU 추론을 통해 YOLO26은 기업이 값비싼 클라우드 컴퓨팅 없이도 강력한 보안 분석을 저렴한 로컬 하드웨어에 직접 배포할 수 있도록 합니다.

사용 사례 및 권장 사항

YOLOX와 YOLO26 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

욜록스를 선택해야 할 때

YOLOX는 다음과 같은 경우에 탁월한 선택입니다:

  • 앵커 프리 검출 연구: YOLOX의 깔끔한 앵커 프리 아키텍처를 기반으로 새로운 검출 헤드 또는 손실 함수를 실험하기 위한 학술 연구.
  • 초경량 엣지 장치: YOLOX-Nano 변형의 극도로 작은 설치 공간(0.91M 파라미터)이 중요한 마이크로컨트롤러 또는 레거시 모바일 하드웨어에 배포합니다.
  • SimOTA 레이블 할당 연구: 최적 운송 기반 레이블 할당 전략과 훈련 수렴에 미치는 영향을 조사하는 연구 프로젝트.

YOLO26을 선택해야 할 때

YOLO26은 다음에 권장됩니다:

  • NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
  • 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.

다른 Ultralytics 탐색

컴퓨터 비전의 진화를 탐구 중이라면, Ultralytics 내 다른 고성능 모델들도 살펴볼 가치가 있습니다:

  • YOLO11: YOLO26의 직계 전신으로, 안정적인 생산 환경을 위한 강력한 성능과 폭넓은 커뮤니티 지원을 제공합니다.
  • YOLOv8: 수많은 실제 배포에서 사용 편의성과 유연성의 표준을 정립한, 철저히 검증된 아키텍처입니다.

결론적으로, YOLOX가 객체 탐지 분야에 중요한 개념을 도입한 반면, 새로운 YOLO26은 속도, 정확도 및 배포 편의성 측면에서 세대적 도약을 이루며, 선구적인 개발자와 기업을 위한 확실한 선택지가 되었습니다.


댓글