콘텐츠로 건너뛰기

YOLOX 대 YOLO11: 연구와 실제 적용의 가교 역할

물체 탐지 분야의 급속한 발전 속에서 적합한 모델 선택은 종종 최첨단 연구와 실제 배포 요구사항 사이의 균형을 맞추는 과정입니다. 본 비교 분석은 두 가지 주요 아키텍처를 탐구합니다: 2021년 출시된 고성능 앵커 프리 탐지기 YOLOX와YOLO11를 Ultralytics . 두 모델 모두 YOLO 공유하지만, 아키텍처 철학, 생태계 지원, 사용 편의성 측면에서 크게 다릅니다.

성능 지표 비교

객체 탐지기를 평가할 때 평균 정밀도(mAP)와 추론 속도와 같은 핵심 지표가 가장 중요합니다. 아래 표는 YOLO11 새로운 아키텍처가 특히 속도와 정확도의 균형 측면에서 어떻게 우수한 효율성을 YOLO11 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

YOLOX: 앵커 없는 진화

YOLOX는 2021년 메그비(Megvii)가 YOLO 앵커 프리 버전으로 소개한 모델입니다. 이 모델은 탐지 헤드를 단순화하고 사전 정의된 앵커 박스의 필요성을 제거함으로써 학술 연구와 산업적 적용 간의 격차를 해소하는 것을 목표로 했습니다.

주요 특징:

  • 앵커 프리 설계: 복잡한 앵커 박스 클러스터링 과정을 제거하여 훈련 파이프라인을 단순화합니다.
  • 분리형 헤드: 분류 및 회귀 작업을 서로 다른 분기로 분리하여 수렴 속도와 정확도를 향상시킵니다.
  • SimOTA: 훈련 안정성을 향상시키기 위해 양성 샘플을 동적으로 할당하는 고급 레이블 할당 전략.

YOLOX는 2021년 중요한 진전을 이루었지만, 구현에는 종종 더 복잡한 설정이 필요하며 최신 프레임워크에서 찾아볼 수 있는 통합된 다중 작업 지원 기능이 부족합니다.

YOLOX 세부 정보:

YOLO11: 다용도성과 생태계 역량

Ultralytics에서 출시한 YOLO11 전작들의 성공을 바탕으로 정확할 뿐만 아니라 사용 및 배포가 매우 쉬운 모델을 제공합니다. 다양한 컴퓨터 비전 작업을 위한 포괄적인 솔루션으로 설계되었습니다.

주요 강점:

  • 사용 편의성: Ultralytics 단순함으로 유명합니다. 로딩, 훈련, 예측을 단 몇 줄의 코드로 수행할 수 있어 개발자의 진입 장벽을 크게 낮춥니다.
  • 잘 관리된 생태계: YOLO11 활발한 유지보수, 빈번한 업데이트, 그리고 활발한 커뮤니티의 지원을 받고 YOLO11 . 이는 최신 기술과의 호환성을 보장합니다. PyTorch 버전과의 호환성과 신속한 버그 수정을 보장합니다.
  • 다용도성: 주로 객체 탐지기로 사용되는 YOLOX와 달리, YOLO11 인스턴스 분할, 자세 추정, 분류, 방향성 바운딩 박스(OBB) 탐지를 포함한 여러 작업을 YOLO11 지원합니다.
  • 훈련 효율성: YOLO11 효율적인 자원 사용을 위해 최적화되어 YOLO11 , RT-DETR보다 적은 메모리를 필요로 합니다.

YOLO11에 대해 자세히 알아보세요

YOLO11 :

알고 계셨나요?

최첨단 엣지 성능을 원하신다면 YOLO26을 확인해 보세요. 2026년 1월 출시된 이 모델은 네이티브 엔드투엔드 NMS 프리 설계, MuSGD 최적화기, 최대 43% 빠른 CPU 특징으로 하여 엣지 AI의 최상위 선택지입니다.

아키텍처 비교

YOLOX YOLO11 구조적 차이는 시간에 따른 객체 탐지 전략의 진화를 YOLO11 .

YOLOX 아키텍처

YOLOX는 YOLOv5 유사한 CSPDarknet 백본을 YOLOv5 분리된 헤드 구조를 도입합니다. 기존 YOLO 분류와 위치 추정이 결합된 방식으로 수행되었습니다. YOLOX는 이를 두 개의 별도 분기로 분리하여 분류 신뢰도와 위치 추정 정확도 간의 상충 관계를 해결합니다. 앵커 프리 메커니즘은 객체 탐지를 점 회귀 문제로 처리하여 모델 설계를 단순화하지만, 앵커 기반 접근법에 비해 극도로 밀집된 객체 시나리오에서는 어려움을 겪을 수 있습니다.

YOLO11

YOLO11 정교한 백본 및 넥 아키텍처를 YOLO11 다양한 스케일에서 특징 추출 능력을 향상시킵니다. 향상된 공간적 어텐션과 특징 융합을 위한 고급 모듈을 통합합니다. Ultralytics 핵심 장점은 수출 가능성의 원활한 통합입니다. 이 아키텍처는 처음부터 ONNX, TensorRT, OpenVINO를 통해 훈련 중 관찰된 높은 정확도가 에지 디바이스에서의 효율적인 추론으로 직접 이어지도록 보장합니다.

이상적인 사용 사례

이러한 모델들 사이에서 선택하는 것은 종종 프로젝트의 특정 요구 사항에 따라 달라집니다.

욜록스를 선택해야 할 때

  • 연구 기준점: YOLOX는 앵커 프리 탐지 방법이나 분리된 헤드의 수정에 초점을 맞춘 학술 연구를 위한 탁월한 기준점이 됩니다.
  • 레거시 시스템: 기존 파이프라인이 Megvii 코드베이스를 기반으로 구축되었거나, 특정 틈새 데이터셋에 대해 SimOTA 할당 전략이 반드시 필요한 경우.

YOLO11 선택해야 할 때

  • 신속한 개발: 데이터셋에서 배포된 모델까지 빠르게 진행해야 한다면, 간소화된 Ultralytics Python 덕분에 YOLO11 .
  • 다중 작업 요구사항: 단순 탐지에서 분할 또는 추적으로 확장될 수 있는 프로젝트는 YOLO11 통합 프레임워크를 통해 이점을 얻습니다.
  • 생산 배포: 소매, 스마트 시티 또는 보안 분야의 상업적 애플리케이션에 대해, YOLO11 강력한 수출 지원 및 커뮤니티 검증된 신뢰성은 배포 위험을 YOLO11 .
  • 엣지 컴퓨팅: 최적화된 변형을 통해 YOLO11 라즈베리 파이 또는 NVIDIA 같은 리소스 제약이 있는 장치에서 탁월한 성능을 YOLO11 .

코드 비교: 사용 편의성

훈련 워크플로를 비교할 때 사용성 차이는 극명하다.

Ultralytics YOLO11 활용한 훈련: Ultralytics 복잡성을 추상화하여 데이터에 집중할 수 있도록 합니다.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

YOLOX를 이용한 훈련: YOLOX는 일반적으로 저장소를 복제하고 특정 환경을 설정하며, 수많은 인수를 가진 명령줄 스크립트를 통해 훈련을 실행해야 합니다. 이는 Python 중심 워크플로우에서는 직관적이지 않을 수 있습니다.

결론

YOLOX와 YOLO11 모두 컴퓨터 비전 분야에 크게 기여한 유능한 YOLO11 . YOLOX는 앵커 기반 방법의 우위를 도전하며 분리된 헤드(decoupled heads) 같은 중요한 개념을 도입했습니다. 그러나 오늘날 대부분의 개발자와 기업에게 YOLO11 이 더 매력적인 패키지를 제공합니다. 높은 성능, 다용도성, 그리고 타의 추종을 불허하는 생태계의 조합은 실제 AI 솔루션을 구축하는 데 있어 실용적인 선택이 되게 합니다.

한계를 더욱 넓히고자 하는 분들, 특히 엣지 배포 환경을 고려하는 분들께는 YOLO26를 적극 권장합니다. 엔드투엔드 NMS 설계와 분포형 초점 손실(DFL) 제거를 통해 YOLO26은 효율성과 속도 측면에서 차원이 다른 도약을 보여줍니다.

살펴볼 다른 모델

  • YOLO26: Ultralytics 최신 최첨단 모델 Ultralytics 2026년 1월), NMS(네트워크 모드 스코어)가 필요 없는 추론과 특수화된 손실 함수를 특징으로 합니다.
  • YOLOv8: 속도와 정확도의 균형으로 유명한 YOLO 널리 채택된 고전 모델.
  • RT-DETR: 변압기 기반 검출기로 높은 정확도를 제공하며, 실시간 속도보다 정밀도가 더 중요한 시나리오에 이상적입니다.
  • SAM : 메타의 세그먼트 애니띵 모델(Segment Anything Model), 제로샷 세그멘테이션 작업에 완벽합니다.

댓글