콘텐츠로 건너뛰기

YOLO11 YOLOX: 아키텍처 진화와 성능 분석

컴퓨터 비전 분야의 급속한 발전 속에서 올바른 객체 탐지 모델 선택은 프로젝트 성공에 매우 중요합니다. 이 과정에서 두 가지 중요한 이정표는 YOLO11YOLOX입니다. YOLOX가 2021년 획기적인 앵커 프리(anchor-free) 개념을 도입했다면, YOLO11 2024년 말 출시)은 현대적인 아키텍처 개선, 우수한 효율성, 그리고 Ultralytics 강력한 지원을 통해 이러한 아이디어를 정교화합니다.

이 가이드는 실시간 에지 배포부터 고정밀 서버 측 분석에 이르기까지 개발자, 연구원 및 엔지니어가 특정 요구 사항에 최적의 모델을 선택할 수 있도록 심층적인 기술 비교를 제공합니다.

경영진 요약

YOLO11Ultralytics 수년간 반복적으로 개선해온 결과물입니다. 다용도성에서 탁월하며, 탐지, 분할, 자세 추정, 방향성 바운딩 박스(OBB)에 대한 네이티브 지원을 제공합니다. 아키텍처는 최신 하드웨어에 최적화되어 기존 모델 대비 FLOP당 더 높은 정확도를 제공합니다.

메그비(Megvii)가 2021년 개발한 YOLOX는 앵커 박스 없는 탐지 패러다임을 대중화한 중대한 출시작이었다. 앵커 박스를 제거해 훈련 과정을 단순화했으며, MixUp 모자이크(Mosaic) 같은 고급 데이터 증강 기법을 도입했다. 여전히 유능한 탐지 모델이지만, 최신 Ultralytics 특징인 다중 작업 처리 능력과 원활한 배포 파이프라인은 부족하다.

오늘날 새로운 프로젝트를 시작하는 개발자들을 위해, YOLO11 또는 최첨단 YOLO26이 일반적으로 권장됩니다. 이는 우수한 성능 대비 효율성과 사용 편의성 때문입니다.

기술적 비교 지표

다음 표는 다양한 모델 규모에 걸쳐 두 아키텍처 간의 성능 차이를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

성능 분석

YOLO11m은 가장 큰 YOLOXx (51.1%)보다 높은 mAP 51.5%)를 달성하면서 약 5배 적은 매개변수 (20.1M vs 99.1M) 사용하고 T4 GPU에서 거의 3배 더 빠르게 실행됩니다. 이러한 극적인 효율성 향상으로 YOLO11 대규모 배포 시 YOLO11 저렴한 비용으로 구현할 수 있습니다.

심층적인 아키텍처 분석

YOLO11: 정교한 효율성과 다용도성

저자: Glenn Jocher, Jing Qiu (Ultralytics)
날짜: 2024년 9월

YOLO11 이전 버전에서 소개된 C2f(2개의 컨볼루션으로 구성된 CSP 병목) 모듈을 YOLO11 하지만, 더 나은 기울기 흐름과 특징 추출을 위해 이를 개선합니다.

  • 백본: 깊이와 너비를 균형 있게 조정하여 계산 부하를 최소화하면서도 수용 야영을 극대화하는 최적화된 CSP 기반 백본.
  • 헤드: 객체 탐지, 인스턴스 분할, 자세 추정등 다양한 작업을 아키텍처 변경 없이 지원하는 통합 탐지 헤드.
  • 앵커 프리: YOLOX와 마찬가지로 YOLO11 앵커 프리 접근법을 YOLO11 설계 매개변수(앵커 크기 및 비율 등)의 수를 줄이고 모델의 복잡성을 단순화합니다.
  • 훈련 역학: Ultralytics 파이프라인 내에 고급 데이터 증강 전략을 통합하여 다양한 조명 및 가림 현상에 대한 견고성을 보장합니다.

YOLO11에 대해 자세히 알아보세요

욜록스: 닻을 내리지 않는 선구자

저자: 정거 외 (메그비)
날짜: 2021년 7월

YOLOX는 연구 커뮤니티와 산업적 응용 간의 격차를 해소하기 위해 설계되었습니다.

  • 분리형 헤드: YOLOX는 분류와 회귀 작업을 별도의 분기로 처리하는 분리형 헤드 구조를 도입했습니다. 이는 수렴 속도와 정확도를 향상시키는 것으로 확인되었습니다.
  • SimOTA: 라벨 할당을 위한 핵심 혁신은 "간소화된 최적 수송 할당"(SimOTA)이었다. 이 동적 전략은 고정된 IoU 지상 진실 객체를 예측값에 더 효과적으로 할당한다.
  • 앵커 프리 메커니즘: 앵커 박스를 제거함으로써 YOLOX는 기존 YOLO (v2-v5)에서 흔히 발생하던 수동 앵커 조정 작업의 필요성을 없앴습니다.
  • 강력한 증강: 모자이크(Mosaic) 및 MixUp 집중적 활용으로 YOLOX가 처음부터 효과적으로 학습할 수 있었다.

YOLOX에 대해 자세히 알아보세요

에코시스템 및 사용 편의성

개발자에게 가장 중요한 요소 중 하나는 모델을 둘러싼 소프트웨어 생태계입니다. 이는 모델의 훈련, 검증 및 배포가 얼마나 용이한지를 결정합니다.

Ultralytics 이점

YOLO11 성숙하고 활발히 유지 관리되는 Ultralytics 혜택을 YOLO11 . 이 통합은 다음과 같은 여러 가지 뚜렷한 장점을 제공합니다:

  1. 통합 API: 작업 전환은 매우 간단합니다. Python CLI 단일 매개변수만 변경하면 차량 감지에서 종양 분할 작업으로 즉시 전환할 수 있습니다.
  2. 배포 유연성: 프레임워크에는 다음과 같은 형식으로 내장된 내보내기 기능이 포함됩니다. ONNX, TensorRT, CoreML, OpenVINO 등의 형식으로 내장된 내보내기 기능을 제공합니다. 이를 통해 개발자는 단 한 줄의 코드로 모델을 프로덕션 환경에 배포할 수 있습니다.
  3. 플랫폼 지원: Ultralytics 은 데이터셋 주석 작업부터 클라우드 훈련 및 모델 관리에 이르기까지 전체 라이프사이클을 간소화합니다.
from ultralytics import YOLO

# Load a model (YOLO11n)
model = YOLO("yolo11n.pt")

# Train on a custom dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for deployment
path = model.export(format="onnx")

YOLOX 생태계

YOLOX는 주로 연구 저장소로 호스팅됩니다. 코드는 오픈소스이며 고품질이지만, 종종 더 많은 수동 구성이 필요합니다. 사용자는 일반적으로 자체 데이터 로더를 관리하고, 특정 하드웨어용 맞춤형 내보내기 스크립트를 작성하며, Ultralytics 비해 업데이트 빈도가 낮은 코드베이스를 탐색해야 합니다.

실제 응용 분야

이러한 모델 간의 선택은 종종 애플리케이션 환경의 특정 제약 조건에 따라 달라집니다.

YOLO11의 이상적인 사용 사례

  • 실시간 영상 분석: T4 추론 속도가 1.5ms까지 낮아진 YOLO11n은 교통 관리나 스포츠 분석을 위한 고프레임률(FPS) 영상 스트림 처리에 최적입니다.
  • 다중 작업 시스템: 애플리케이션이 동시 객체 추적 및 자세 추정(예: 체육관 운동 분석)을 요구하는 경우, YOLO11 다목적 헤드 아키텍처는 여러 무거운 모델의 필요성을 줄여줍니다.
  • 상용 에지 배포: NVIDIA 또는 Raspberry Pi로의 원활한 수출로 YOLO11 상용 IoT 제품의 YOLO11 되었습니다.

YOLOX의 이상적인 사용 사례

  • 학술적 벤치마킹: YOLOX는 2021-2022년 시대의 앵커 프리 탐지 방법을 비교하는 연구자들에게 여전히 견고한 기준점이 되고 있다.
  • 레거시 시스템: YOLOX 코드베이스와 맞춤형 통합 파이프라인에 이미 상당한 투자를 한 프로젝트의 경우, 마이그레이션보다 유지 관리가 비용 효율적일 수 있습니다.
  • 특정 모바일 제약사항: YOLOX-Nano 모델은 매우 경량화되어(매개변수 0.91M) 극도로 제한된 모바일 하드웨어에 유용합니다. 다만 YOLO26n과 같은 최신 모델들은 훨씬 우수한 정확도를 유지하면서도 경쟁력 있는 크기를 제공합니다.

미래: YOLO26의 등장

최첨단을 추구하는 개발자들을 위해 Ultralytics YOLO26 (2026년 1월)을 출시했습니다. 이 모델은 상당한 도약을 이루었으며, 대부분의 사용 사례에서 YOLO11 효과적으로 대체합니다.

YOLO26은 몇 가지 주요 혁신을 도입합니다:

  • 네이티브 엔드투엔드: 추론 속도의 병목 현상을 자주 유발하는 후처리 단계인 비최대 억제(NMS)를 제거합니다. 이를 통해 더 빠르고 결정론적인 출력을 제공합니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받아 안정적인 수렴을 보장하고 훈련 시간을 단축합니다.
  • 효율성: YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 제공하여GPU 강력한 성능을 발휘합니다.

새로운 프로젝트를 시작하신다면, YOLO11 함께 YOLO26을 평가해 보시기를 강력히 권장합니다.

YOLO26에 대해 더 알아보기

결론

YOLO11 YOLOX 모두 컴퓨터 비전 역사에 그 자리를 차지했습니다. YOLOX는 앵커 프리 탐지의 실현 가능성을 입증한 선구자였습니다. 그러나 YOLO11 는 오늘날 개발자들에게 더 매력적인 패키지를 제공합니다: 더 빠르고, 더 정확하며, 더 다양한 작업을 지원하고, 개발 시간을 획기적으로 단축하는 생태계가 뒷받침됩니다.

살펴볼 다른 모델

  • YOLO26: Ultralytics 최신 최첨단 모델로, 엔드투엔드 NMS 검출 기능을 특징으로 합니다.
  • RT-DETR: 변환기 기반 검출기로 높은 정확도를 제공하며, GPU 풍부한 환경에 이상적입니다.
  • YOLOv9: 프로그래머블 그라디언트 정보(PGI)와 GELAN 아키텍처로 유명합니다.
  • YOLOv8: YOLO 신뢰할 수 있고 널리 채택된 고전적인 모델입니다.

댓글