콘텐츠로 건너뛰기

YOLOX 대 YOLO26: 앵커 프리에서 엔드 투 엔드 객체 탐지로의 진화

컴퓨터 비전 분야는 지난 10년간 놀라운 변화를 겪어왔습니다. 이 여정에서 두 가지 중요한 이정표는 앵커 프리 아키텍처를 대중화한 YOLOX의 출시와, 최근 Ultralytics 도입입니다. 후자는 네이티브 엔드투엔드 방식과 NMS 프리 설계로 실시간 성능을 완전히 재정의했습니다. 본 포괄적 비교 분석은 두 기술의 아키텍처, 성능 지표, 이상적인 배포 시나리오를 탐구하여 개발자들이 차기 AI 프로젝트를 위한 정보에 기반한 결정을 내리는 데 도움을 줍니다.

모델 개요

각 모델의 기원과 주요 설계 목표를 이해하는 것은 해당 모델의 기술적 성과를 이해하는 데 필수적인 맥락을 제공한다.

YOLOX

저자: 정거(Zheng Ge), 류송타오(Songtao Liu), 왕펑(Feng Wang), 리즈밍(Zeming Li), 쑨젠(Jian Sun)
소속: 메그비(Megvii)
날짜: 2021-07-18
아카이브: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
문서: YOLOX ReadTheDocs

2021년 중반에 소개된 YOLOX는 앵커 없는 설계와 분리된 헤드, 그리고 SimOTA로 알려진 진보된 레이블 할당 전략을 채택함으로써 중대한 전환을 이루었습니다. 기존 아키텍처를 지배하던 전통적인 앵커 박스 메커니즘에서 벗어나면서, YOLOX는 학술 연구와 산업적 적용 사이의 간극을 성공적으로 메웠으며, 우아하면서도 매우 효과적인 객체 탐지 프레임워크를 제공했습니다.

YOLOX에 대해 자세히 알아보세요

YOLO26

저자: Glenn Jocher 및 Jing Qiu
소속 기관: Ultralytics
날짜: 2026-01-14
GitHub: ultralytics
플랫폼: Ultralytics

2026년 초 출시된 YOLO26은 수년간의 반복적 개선을 통해 완성된 모델로, 특히 에지 배포와 간소화된 훈련 파이프라인에 중점을 두었습니다. 이 모델은 종단간 NMS(Non-Maximum Suppression) NMS 필요 없는 설계를 도입하여 기존의 NMS 후처리 단계를 완전히 제거했습니다. 이 혁신은 다양한 하드웨어에 걸친 모델 배포를 획기적으로 단순화합니다. 또한 분포 초점 손실(DFL) 모듈을 제거함으로써 YOLO26은 지연 시간을 현저히 낮추었으며, 이는 현대 컴퓨터 비전 애플리케이션을 위한 최상의 선택이라는 입지를 공고히 합니다.

YOLO26에 대해 더 알아보기

아키텍처 혁신

이 두 모델의 아키텍처는 특히 손실 함수와 후처리 측면에서 딥 러닝 방법론의 급속한 발전을 보여준다.

YOLOX 접근법

YOLOX는 예측 헤드에서 분류와 회귀 작업을 분리하여 훈련 중 수렴 속도를 크게 가속화했습니다. 앵커 프리 특성으로 설계 매개변수 수가 감소하여 훈련 전 복잡한 앵커 튜닝의 필요성을 완화했습니다. SimOTA 레이블 할당 알고리즘과 결합된 YOLOX는 당시 최첨단 성능을 달성했으며, 특히 COCO 같은 표준 벤치마크에서 두드러진 성과를 보였습니다.

YOLO26의 장점

YOLO26은 아키텍처 효율성을 한 단계 끌어올립니다. NMS 제거는 추론 지연 시간을 단축할 NMS 아니라 일관되고 결정론적인 실행 시간을 보장합니다. 이는 자율주행 차량과 로봇 공학에 있어 핵심 요소입니다.

YOLO26의 주요 혁신 사항은 다음과 같습니다:

  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받아 개발된 이 SGD 뮤온의 하이브리드 방식은 매우 안정적인 훈련 실행과 더 빠른 수렴을 보장합니다.
  • 최대 43% 빠른 CPU : DFL 제거 및 네트워크 아키텍처 간소화를 통해 YOLO26은 단순한 IoT 센서부터 라즈베리 파이 보드에 이르기까지 자원이 제한된 에지 디바이스에 최적화되었습니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 소형 물체 인식에서 현저한 개선을 제공하며, 이는 항공 이미지 분석 및 제조 자동화에서의 정밀한 품질 관리 수행에 매우 중요합니다.

에지 우선 최적화

프로젝트가 전용 GPU가 없는 임베디드 시스템이나 모바일 애플리케이션을 대상으로 하는 경우, YOLO26의 최적화된 CPU 이전 세대 모델보다 훨씬 적은 계산 오버헤드를 요구하여 막대한 이점을 제공합니다.

성능 및 벤치마크

생산 환경용 모델을 평가할 때 정확도, 속도, 계산 복잡성 간의 균형을 분석하는 것이 가장 중요합니다. 아래는 640픽셀(나노/소형 변형은 416픽셀) 이미지 크기로 평가된 표준 모델들의 상세 비교입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

표에서 알 수 있듯이, YOLO26 시리즈는 우수한 성능 균형을 제공합니다. 예를 들어, YOLO26x 기존 모델의 거의 절반에 해당하는 매개변수를 mAP 인상적인 57.5 mAP 달성합니다. YOLOXx 모델은 GPU 시간을 직접적으로 단축시켜(11.8ms 대 16.1ms) 훨씬 뛰어난 배포 유연성을 제공합니다.

교육 및 생태계 경험

이러한 아키텍처 간의 가장 근본적인 차이점 중 하나는 사용성과 생태계 지원에 있습니다.

YOLOX는 여전히 기울기 흐름과 앵커 프리 메커니즘을 연구하는 연구자들에게 기초적인 저장소 역할을 하지만, 설정 과정이 복잡할 수 있으며 종종 종속성과 연산자를 수동으로 구성해야 합니다. 반면, Ultralytics 은 사용 편의성 측면에서 업계 표준을 제시합니다.

통합된 Python 활용함으로써 개발자는 유례없는 간편함으로 YOLO26 모델을 초기화, 훈련 및 배포할 수 있습니다. 시스템은 데이터셋 다운로드, 하이퍼파라미터 튜닝, ONNX와 같은 형식으로의 원활한 내보내기를 본질적으로 처리합니다. ONNX, TensorRT, OpenVINO 등의 형식으로의 원활한 내보내기를 기본적으로 처리합니다.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

또한 Ultralytics YOLO 무거운 트랜스포머 기반 대안들에 비해 훈련 중 메모리 요구량이 현저히 낮아, 엔지니어들이 소비자용 하드웨어에서도 더 큰 배치 크기로 훈련할 수 있게 합니다.

실제 응용 분야

YOLOX와 YOLO26 사이의 선택은 궁극적으로 배포 제약 조건과 다중 작업 요구 사항에 따라 달라집니다.

YOLOX가 뛰어난 점

YOLOX는 특정 학술 벤치마크와 MegEngine 프레임워크와 깊이 통합된 레거시 시스템에 여전히 유효한 후보로 남아 있습니다. 역사적 중요성으로 인해 앵커 프리 탐지기 및 맞춤형 할당 전략 연구를 위한 인기 있는 기준선 역할을 합니다.

YOLO26이 뛰어난 점

YOLO26은 근본적으로 현대 산업용 애플리케이션을 위해 설계되었습니다. 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB)를 기본적으로 지원하기 때문에 표준 탐지 엔진보다 훨씬 더 다용도로 활용할 수 있습니다.

  • 스마트 리테일 및 재고 관리: NMS 설계를 활용함으로써 자동 결제 시스템이 초저지연으로 영상 피드를 처리하여 후처리 루프의 병목 현상 없이 제품을 인식할 수 있습니다.
  • 드론 및 항공 분석: OBB 전용 각도 손실 모델과 ProgLoss + STAL의 통합으로 YOLO26은 방대한 위성 이미지 내 회전된 물체와 미세 인공물 탐지에서 타의 추종을 불허합니다.
  • Edge Security Systems: YOLO26은 CPU 속도를 43% 향상시켜 기업들이 고가의 클라우드 컴퓨팅 없이도 저렴한 로컬 하드웨어에 직접 강력한 보안 분석을 배포할 수 있게 합니다.

사용 사례 및 권장 사항

YOLOX와 YOLO26 중 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

욜록스를 선택해야 할 때

YOLOX는 다음과 같은 경우에 탁월한 선택입니다:

  • 앵커 프리 탐지 연구: 새로운 탐지 헤드나 손실 함수를 실험하기 위한 기준으로 YOLOX의 깔끔한 앵커 프리 아키텍처를 활용한 학술 연구.
  • 초경량 에지 디바이스: 마이크로컨트롤러 또는 레거시 모바일 하드웨어에 배포할 때 YOLOX-Nano 변형의 극히 작은 메모리 사용량(0.91M 매개변수)이 핵심적인 요소입니다.
  • SimOTA 라벨 할당 연구: 최적 수송 기반 라벨 할당 전략과 훈련 수렴에 미치는 영향을 조사하는 연구 프로젝트들.

YOLO26을 선택해야 할 때

YOLO26은 다음에 권장됩니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

다른 Ultralytics 탐색

컴퓨터 비전의 진화를 탐구 중이라면, Ultralytics 내 다른 고성능 모델들도 살펴볼 가치가 있습니다:

  • YOLO11: YOLO26의 직전 버전으로, 안정적인 생산 환경을 위한 견고한 성능과 광범위한 커뮤니티 지원을 제공합니다.
  • YOLOv8: 수천 건의 실제 배포 사례를 통해 검증된 아키텍처로, 사용 편의성과 유연성의 기준을 제시했습니다.

결론적으로, YOLOX가 객체 탐지 분야에 중요한 개념을 도입한 반면, 새로운 YOLO26은 속도, 정확도 및 배포 편의성 측면에서 세대적 도약을 이루며, 선구적인 개발자와 기업을 위한 확실한 선택지가 되었습니다.


댓글