Link to this sectionYOLOX 대 YOLO11#
컴퓨터 비전의 발전은 높은 정확도와 추론 속도 사이의 균형을 유지하는 실시간 객체 탐지 프레임워크를 추구하며 큰 성장을 이루었습니다. 이 여정에서 가장 주목할 만한 이정표로 YOLOX와 Ultralytics YOLO11을 꼽을 수 있습니다. 두 모델 모두 해당 분야에 중요한 기여를 했지만, 기본 아키텍처, 설계 철학 및 개발자 생태계는 크게 다릅니다.
이 포괄적인 기술 비교에서는 두 모델의 아키텍처, 성능 지표, 학습 방법론 및 이상적인 배포 시나리오를 살펴봄으로써 다음 인공지능 프로젝트를 위한 현명한 결정을 내릴 수 있도록 돕습니다.
Link to this sectionYOLOX 개요#
2021년 7월 18일 Megvii의 연구원 Zheng Ge, Songtao Liu, Feng Wang, Zeming Li 및 Jian Sun이 소개한 YOLOX는 YOLO 시리즈의 중요한 전환점을 마련했습니다. 앵커 프리(anchor-free) 설계를 도입하여 학술 연구와 산업적 응용 사이의 간극을 성공적으로 메웠습니다.
더 자세한 기술적 배경은 원본 YOLOX Arxiv 논문을 검토하실 수 있습니다.
Link to this section주요 아키텍처 특징#
YOLOX는 디커플드 헤드(decoupled head)와 앵커 프리 메커니즘을 채택하여 기존의 앵커 기반 탐지 방식에서 벗어났습니다. 이 설계는 설계 매개변수 수를 줄이고 다양한 벤치마크에서 모델의 성능을 향상시켰습니다. 또한 SimOTA와 같은 고급 레이블 할당 전략을 도입하여 학습 과정을 가속화하고 수렴을 개선했습니다.
YOLOX는 당시에 뛰어난 정확도를 제공했지만, 주로 바운딩 박스 객체 탐지에 중점을 두고 있으며 다른 복잡한 비전 작업에 대한 기본 지원이 부족합니다.
YOLOX는 사전 정의된 앵커 박스를 제거함으로써 다양한 데이터셋에 필요한 휴리스틱 튜닝을 크게 줄였으며, 앵커 프리 방법론 연구를 위한 강력한 베이스라인이 되었습니다.
Link to this sectionUltralytics YOLO11 개요#
2024년 9월 27일 Ultralytics의 Glenn Jocher와 Jing Qiu가 발표한 YOLO11은 컴퓨터 비전 분야의 범용성과 사용 편의성을 재정의하는 최첨단 모델입니다. 수년간의 기초 연구를 바탕으로 구축된 이 모델은 다양한 작업에서 뛰어난 성능을 발휘하는, 생산 준비가 완료된 매우 정교한 솔루션을 제공합니다.
Link to this sectionUltralytics의 장점#
YOLO11은 단순한 객체 탐지기가 아닙니다. 인스턴스 세그멘테이션, 이미지 분류, 자세 추정 및 방향성 바운딩 박스(OBB) 탐지를 지원하는 통합 프레임워크입니다. 속도, 매개변수 수 및 정확도 간의 원활한 균형을 우선시하는 고효율 아키텍처를 자랑합니다.
또한, YOLO11은 데이터 주석, 모델 학습 및 배포를 위한 간소화된 생태계를 제공하는 Ultralytics Platform에 완전히 통합되어 있습니다.
Link to this section성능 및 지표 비교#
이 모델들을 비교하면 성능의 균형이 명확해집니다. YOLO11은 대부분의 크기 범주에서 YOLOX 제품군보다 훨씬 적은 매개변수와 FLOPs로 더 높은 평균 정밀도(mAP)를 달성합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
입증된 바와 같이, YOLO11 모델은 더 가벼운 매개변수를 유지하면서도 YOLOX보다 일관되게 우수한 정확도를 제공합니다. 예를 들어, YOLO11m은 20.1M 매개변수로 51.5 mAP를 달성하는 반면, YOLOXx는 51.1 mAP와 유사한 성능을 내지만 무려 99.1M 매개변수가 필요합니다. 학습 및 추론 시의 이러한 메모리 효율성 덕분에 YOLO11은 RT-DETR과 같은 이전 모델이나 트랜스포머 기반 모델의 일반적인 높은 CUDA 메모리 요구 사항을 피하며 엣지 AI 장치에 배포하기에 매우 적합합니다.
Ultralytics 모델은 YOLOX 및 트랜스포머 기반 아키텍처와 비교하여 학습 중 훨씬 적은 GPU 메모리를 사용하므로 연구자가 표준 소비자용 하드웨어에서도 강력한 모델을 학습할 수 있습니다.
Link to this section생태계 및 사용 편의성#
두 프레임워크의 가장 두드러진 차이점 중 하나는 개발자 경험입니다.
YOLOX는 종종 저장소를 복제하고, 복잡한 환경을 설정하며, 모델을 ONNX나 TensorRT와 같은 형식으로 학습하고 내보내기 위해 장황한 명령줄 인수를 실행해야 합니다.
반면, Ultralytics YOLO11은 놀랍도록 간단한 Python API와 CLI를 제공합니다. Ultralytics 라이브러리는 데이터 증강, 하이퍼파라미터 튜닝 및 내보내기를 자동으로 처리합니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")This well-maintained ecosystem is backed by extensive documentation and seamless integration with tools like Weights & Biases for experiment tracking.
Link to this section이상적인 사용 사례#
이 모델들 중 무엇을 선택할지는 종종 배포 환경의 세부 사항에 따라 달라집니다.
Link to this sectionYOLOX 사용 시기#
- 레거시 시스템: MegEngine 프레임워크나 2021년 초의 객체 탐지 패러다임을 중심으로 명확하게 구축된 파이프라인이 있는 경우입니다.
- 학술 베이스라인: 2021년 당시의 기초적인 앵커 프리 아키텍처와 직접적인 벤치마킹이 필요한 연구를 수행할 때 유용합니다.
Link to this sectionYOLO11 사용 시기#
- 프로덕션 배포: 스마트 리테일 또는 보안 경보 시스템과 같은 상업용 애플리케이션에서 견고하고 유지 관리되는 코드와 높은 정확도가 필수적인 경우 사용합니다.
- 멀티태스킹 파이프라인: 단일 통합 프레임워크를 사용하여 객체를 추적하고, 인간의 자세를 추정하며, 인스턴스를 세그멘테이션해야 하는 프로젝트에 적합합니다.
- Resource-Constrained Edge Devices: Because of its low parameter count and high throughput, YOLO11 is ideal for deployment on Raspberry Pi or mobile edge nodes via CoreML and NCNN.
Link to this section앞으로의 전망: YOLO26의 이점#
YOLO11이 YOLOX에 비해 비약적인 발전을 이루었지만, 컴퓨터 비전 분야는 빠르게 발전하고 있습니다. 오늘 새로운 프로젝트를 시작하는 개발자들에게 **Ultralytics YOLO26**을 확실하게 추천합니다.
2026년 1월에 출시된 YOLO26은 YOLO11의 아키텍처적 장점을 계승하면서 몇 가지 혁신적인 기능을 도입했습니다.
- 종단 간(End-to-End) NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 제거하여 더 빠르고 간단한 배포 파이프라인을 위해 추론을 기본적으로 스트리밍합니다(이는 YOLOv10에서 처음 탐구된 개념입니다).
- 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 제거함으로써 YOLO26은 CPU와 저전력 엣지 장치에서 훨씬 더 효율적입니다.
- MuSGD 옵티마이저: Moonshot AI의 LLM 학습 혁신에서 영감을 받은 MuSGD 옵티마이저는 매우 안정적인 학습 실행과 빠른 수렴을 보장합니다.
- 고급 손실 함수: ProgLoss + STAL을 활용하여 YOLO26은 드론 이미지 및 자율 로봇 공학에 필수적인 소형 객체 인식에서 눈에 띄는 향상을 달성합니다.
대다수의 현대 컴퓨터 비전 작업에서 파이프라인을 YOLO26으로 업그레이드하면 속도, 정확도 및 배포 용이성 사이에서 절대적인 최상의 균형을 얻을 수 있습니다.