콘텐츠로 건너뛰기

YOLOX 대 YOLO26: 객체 탐지 아키텍처 비교 분석

물체 탐지 분야의 급속한 발전 속에서 특정 애플리케이션에 적합한 모델을 선택하는 것은 매우 중요합니다. 본 종합 가이드에서는 메그비(Megvii)의 고성능 앵커 프리 탐지기인 YOLOX와, 에지 효율성과 엔드투엔드 배포를 위해 설계된 최신 최첨단 모델인 Ultralytics )의 Ultralytics 비교합니다.

아키텍처, 성능 지표 및 훈련 방법론을 분석함으로써, 우리는 개발자와 연구자들이 실제 컴퓨터 비전 프로젝트에 대한 정보에 기반한 결정을 내릴 수 있도록 돕고자 합니다.

경영진 요약

두 모델 모두 YOLO 중요한 이정표를 나타냅니다. YOLOX (2021)는 앵커 프리 탐지 및 분리된 헤드의 대중화에 기여하며 학술 연구와 산업적 적용 간의 격차를 해소했습니다. 반면 YOLO26 (2026)은 비최대 억제(NMS)를 제거한 내재적 엔드투엔드 설계로 한계를 더욱 확장하여, CPU 속도를 높이고 소형 물체에 대한 정확도를 향상시켰습니다.

대부분의 현대 애플리케이션, 특히 에지 디바이스에 배포되거나 간소화된 통합이 필요한 경우 YOLO26은 보다 강력한 생태계, 낮은 지연 시간, 그리고 더 간단한 배포 워크플로를 제공합니다.


욜록스: 닻을 내리지 않는 선구자

YOLOX는 YOLO 앵커 프리 메커니즘으로 전환하고 분리형 헤드 및 SimOTA 레이블 할당과 같은 다른 고급 탐지 기술을 통합했습니다.

YOLOX에 대해 자세히 알아보세요

기술 사양

주요 아키텍처 기능

  1. 앵커 프리 메커니즘: YOLOv4나 YOLOv5 과 달리, YOLOX는 미리 정의된 앵커 박스를 사용하지 않고 바운딩 박스를 직접 예측합니다. 이는 다양한 데이터셋에 필요한 설계 매개변수와 경험적 조정의 수를 줄여줍니다.
  2. 분리된 헤드: YOLOX는 분류와 위치 추정 작업을 서로 다른 "헤드"로 분리합니다. 이러한 분리는 분류 신뢰도와 회귀 정확도 간의 상충 관계를 해결하여 더 빠른 수렴과 향상된 성능을 이끌어냅니다.
  3. SimOTA: 긍정 샘플을 지상 진실에 동적으로 할당하는 단순화된 최적 수송 할당 전략으로, 훈련 안정성과 정확도를 향상시킵니다.
  4. 다중 양성: 앵커 프리 탐지기의 양성/음성 샘플 간 극심한 불균형을 완화하기 위해, YOLOX는 중심 3x3 영역을 양성으로 할당합니다.

레거시 강점

YOLOX는 학술 연구 및 레거시 앵커 프리 구현이 선호되는 시나리오에서 여전히 강력한 기준선으로 남아 있습니다. 그 분리된 헤드 설계는 후속 아키텍처에 큰 영향을 미쳤습니다.


Ultralytics : 엔드투엔드 엣지 전문가

YOLO26은 효율성을 위해 처음부터 설계되어 추론 파이프라인의 병목 현상을 제거함으로써 CPU와 GPU 모두에서 최대 속도를 제공합니다.

YOLO26에 대해 더 알아보기

기술 사양

주요 아키텍처 혁신

  1. 엔드투엔드 NMS 설계: YOLO26은 본질적으로 엔드투엔드 구조입니다. 비최대 억제(NMS) 후처리 없이도 예측을 생성함으로써, 배포 시 지연 시간과 복잡성을 크게 줄입니다. 이 혁신은 YOLOv10 에서 영감을 얻었으며, 생산 환경 안정성을 위해 개선되었습니다.
  2. DFL 제거: 모델 내보내기를 단순화하기 위해 분포 초점 손실(DFL) 모듈이 제거되었습니다. 이로 인해 모델은 에지/저전력 장치 및 TensorRT와 같은 가속기 툴체인과의 호환성이 향상되었습니다. TensorRT , CoreML과 같은 가속기 툴체인과 호환성을 높였습니다.
  3. MuSGD 최적화기: SGD 뮤온을 결합한 새로운 하이브리드 최적화기입니다. 대규모 언어 모델(LLM) 훈련(특히 Moonshot AI의 Kimi K2)에서 영감을 받아, 이 최적화기는 비전 작업에 대한 훈련을 안정화하고 수렴 속도를 가속화합니다.
  4. ProgLoss + STAL: 점진적 손실 균형(Progressive Loss Balancing)과 소형 대상 인식 라벨 할당(Small-Target-Aware Label Assignment, STAL)의 결합은 드론 영상 및 IoT 센서에 중요한 소형 물체 탐지 성능을 획기적으로 향상시킵니다.
  5. 작업 다용도성: 주로 탐지기로 사용되는 YOLOX와 달리, YOLO26은 인스턴스 세그멘테이션, 자세 추정, 분류, 방향성 바운딩 박스(OBB) 작업을 기본적으로 지원합니다.

에지 최적화

YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 자랑하며, 전용 GPU 없이 라즈베리 파이, 모바일 기기 및 표준 Intel 배포하기에 탁월한 선택입니다.


성능 비교

다음 표는 모델 간 성능 차이를 보여줍니다. YOLOX가 2021년 경쟁력을 보였지만, YOLO26은 특히 추론 속도와 매개변수 효율성 측면에서 5년간의 아키텍처 진화를 통해 이루어진 발전을 입증합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

분석:

  • 정확성: YOLO26은 모든 규모에서 YOLOX보다 지속적으로 우수한 성능을 보입니다. 예를 들어, YOLO26s 달성하다 48.6% mAP, 상당히 높은 수준으로 YOLOX-s 40.5%로, 훨씬 더 큰 규모의 YOLOX-l (49.7%) 컴퓨팅 자원의 일부만을 사용하면서.
  • 속도: YOLO26은 엔드투엔드 아키텍처를 활용하여 극히 낮은 지연 시간을 달성합니다. YOLO26의 TensorRT 동등한 YOLOX 모델보다 종종 2배 빠르며, 이는 부분적으로 NMS 제거 덕분입니다.
  • 효율성: FLOPs 대비 정확도 비율은 YOLO26에서 훨씬 우수합니다. YOLO26n 비슷한 정확도를 달성한다 YOLOX-s (40.9% 대 40.5%) 그러나 FLOPs는 약 5배 적음(54억 대 268억).

학습 및 생태계

개발자 경험은 이 두 프레임워크 간의 주요 차별화 요소입니다.

사용 편의성 및 에코시스템

Ultralytics 간소화된 사용자 경험을 최우선Ultralytics . YOLO26을 통해 데이터 검증, 훈련, 배포를 원활하게 처리하는 통합 Python 이용할 수 있습니다.

반면 YOLOX는 보다 전통적인 연구 코드베이스 구조를 기반으로 하여 데이터셋 경로, 증강 처리, 배포 스크립트 등에 대해 수동 설정이 더 많이 필요할 수 있습니다.

학습 방법론

  • YOLO26: 안정성을 위해 MuSGD 최적화기를 활용하며, 자동 배치자동 앵커링을 사용합니다(앵커 프리 방식에는 덜 관련되나 내부 스케일링은 여전히 적용됨). 또한 빠른 수렴을 위해 최적화된 모자이크믹스업 증강을 지원합니다.
  • YOLOX: 모자이크(Mosaic)와 믹스업(Mixup)을 포함한 강력한 증강 파이프라인을 도입했으며, 이는 높은 성능의 핵심 요소였습니다. 일반적으로 최고 정확도에 도달하려면 더 긴 훈련 일정(300 에포크)이 필요합니다.

메모리 요구 사항

YOLO26은 메모리 효율성을 위해 최적화되었습니다. 단순화된 손실 함수(DFL 제거)와 최적화된 아키텍처 덕분에 기존 앵커 프리 아키텍처 대비 훈련 중 VRAM 사용량이 감소합니다. 이로 인해 소비자용 GPU에서 더 큰 배치 크기를 사용할 수 있어 실험 속도가 향상됩니다.


사용 사례 및 응용 분야

YOLO26이 뛰어난 점

  • 에지 컴퓨팅: 최대 43% 빠른 CPU 및 DFL 제거 기능을 갖춘 YOLO26은 라즈베리 파이 및 모바일 배포에 이상적인 선택입니다.
  • 실시간 영상 분석: NMS 설계로 결정론적 지연 시간을 보장하여 자율 주행이나 보안 경보 시스템과 같은 안전이 중요한 애플리케이션에 필수적입니다.
  • 복잡한 작업: 프로젝트에 세분화나 자세 추정 기능이 필요한 경우, YOLO26은 동일한 프레임워크 내에서 이러한 기능을 제공하는 반면, YOLOX는 주로 객체 탐지기에 초점을 맞춥니다.

YOLOX가 사용되는 곳

  • 연구 기준선: YOLOX는 깔끔한 앵커 프리 구현 덕분에 학술 논문에서 비교 기준선으로 자주 사용됩니다.
  • 레거시 시스템: 2021-2022년에 시작되어 YOLOX 코드베이스를 대폭 커스터마이징한 프로젝트의 경우 마이그레이션에 많은 자원이 소요될 수 있으나, YOLO26의 성능 향상은 일반적으로 그 노력을 정당화합니다.

코드 예제: YOLO26 시작하기

YOLO26으로의 마이그레이션은 간단합니다. 아래는 사전 훈련된 모델을 로드하고 추론을 실행하는 방법에 대한 완전한 예시입니다.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (automatically downloads weights)
model = YOLO("yolo26n.pt")

# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
for result in results:
    result.show()  # Show image with bounding boxes

# Export to ONNX for deployment
model.export(format="onnx")

이 간단한 코드 조각은 오래된 연구 저장소에서 흔히 요구되는 수백 줄의 상용구 코드를 대체합니다.

결론

YOLOX가 앵커 프리 설계를 검증함으로써 객체 탐지 역사에서 중추적인 역할을 수행한 반면, Ultralytics 효율적이고 배포 가능한 AI의 미래를 대표합니다.

NMS 종단 간 아키텍처, 우수한 정확도 대비 연산 효율성, 그리고 Ultralytics 강력한 지원을 바탕으로 YOLO26은 신규 개발과 기존 비전 파이프라인 업그레이드 모두에 권장되는 선택입니다.

추가 자료


댓글