YOLO11 YOLOX: 고성능 객체 탐지의 진화
컴퓨터 비전 분야는 지난 몇 년간 급속한 발전을 거듭해 왔으며, 실시간 객체 탐지 모델은 점점 더 정교해지고 있습니다. 개발자들은 생산 환경이나 학술 연구를 위한 아키텍처를 선택할 때 종종 기존 기술의 성과와 최첨단 혁신 사이의 장단점을 저울질합니다. 이 포괄적인 비교는 Ultralytics YOLO11 와 Megvii의 YOLOX 간의 차이점을 살펴보고, 이들 아키텍처, 성능 지표 및 이상적인 배포 시나리오에 대한 심층적인 통찰력을 제공합니다.
아키텍처 개요
두 모델 모두 객체 탐지 분야에서 상당한 도약을 이루었지만, 서로 다른 설계 철학에서 비롯되었으며 개발자 경험을 대상으로 삼는 방식도 다릅니다.
YOLO11: 다재다능한 멀티태스킹 엔진
2024년 9월 글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)가 Ultralytics에서 출시된 YOLO11 는 높은 정확도와 극도의 효율성을 균형 있게 조화시킨 통합 프레임워크로 설계되었습니다.
- 저자: 글렌 조커와 징 치우
- Organization: Ultralytics
- 날짜:27
- GitHub:https://github.com/ultralytics/ultralytics
- Docs:https://docs.ultralytics.com/models/yolo11/
YOLO11 표준 바운딩 박스를 YOLO11 인스턴스 세그멘테이션, 이미지 분류, 자세 추정, 방향성 바운딩 박스(OBB) 탐지를 기본적으로 지원합니다. 정교한 아키텍처는 복잡한 공간적 계층 구조 전반에 걸쳐 더 나은 특징 보존을 보장하기 위해 특징 추출을 최적화합니다.
욜록스: 닻을 내리지 않는 선구자
메그비(Megvii) 연구진이 개발한 YOLOX는 순수한 앵커 프리(anchor-free) 접근법으로 연구와 산업적 응용 간의 격차를 해소하며 2021년 큰 주목을 받았다.
- 작성자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
- Organization: Megvii
- 날짜:18
- Arxiv:2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
- Docs:https://yolox.readthedocs.io/en/latest/
YOLOX는 분리형 헤드와 앵커 프리 패러다임을 도입하여 설계 매개변수 수를 크게 줄였으며, 출시 당시 학술 벤치마크에서 성능을 향상시켰다.
알고 계셨나요?
YOLOX가 대중화시킨 앵커 프리 설계는 이후 수많은 아키텍처에 영감을 주었습니다. Ultralytics 이러한 앵커 프리 개념을 후속 버전인 YOLOv8 와 YOLO11 이러한 앵커 프리 개념을 통합하고 크게 개선하여 우수한 정확도와 배포 유연성을 제공했습니다.
성과 및 지표
탐지 모델을 평가할 때, 실제 환경에서의 모델 배포를 위해서는 매개변수의 균형, 계산 비용(FLOPs), 평균 정밀도(mAP)를 검토하는 것이 매우 중요하다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
표에서 볼 수 있듯이, YOLO11x는 절대 정확도(54.7 mAP 대 51.1 mAP) 측면에서 YOLOXx를 현저히 능가하는 동시에 약 절반 수준의 매개변수(56.9M 대 99.1M)만을 요구합니다. 이러한 효율성은 훈련 및 추론 과정 모두에서 더 낮은 메모리 요구 사항으로 이어지며, 이는 생산 환경에서 매우 큰 장점입니다.
에코시스템 및 개발자 경험
Ultralytics 이점
YOLO11 가장 근본적인 차이점 중 하나는 사용 편의성에 있습니다. YOLOX는 주로 연구용 코드베이스로 운영되며, 복잡한 환경 설정, C++ 연산자의 수동 컴파일, 그리고 사용자 정의 데이터셋 훈련을 시작하기 위한 장황한 명령줄 인수가 필요합니다.
대조적으로, YOLO11 Python 완전히 YOLO11 간소화된 "초보자부터 전문가까지"의 워크플로를 제공합니다. Ultralytics 데이터 주석 작업, 실험 추적, 클라우드 기반 훈련을 위한 포괄적인 도구를 제공하며, 반복적인 작업을 추상화하여 엔지니어가 모델 성능에 집중할 수 있도록 합니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
또한 Ultralytics 다음과 같은 형식으로 내보낼 수 있습니다. TensorRT, CoreML 또는 OpenVINO 로 내보내는 데는 단일 명령어만 필요하지만, 기존 저장소들은 종종 복잡한 타사 도구나 수동적인 그래프 수정을 요구합니다.
실제 사용 사례
욜록스를 고려해야 할 때
YOLOX는 개발자들이 이미 특정 분리된 헤드 tensor 중심으로 고도로 맞춤화된 C++ 추론 파이프라인을 구축한 특수한 레거시 배포 환경에서 여전히 유효한 옵션으로 남아 있습니다. 또한 2021년 최신 아키텍처와의 비교 연구를 수행하는 연구자들은 여전히 YOLOX를 벤치마크 데이터셋 기준선으로 활용할 것입니다.
YOLO11 장점
거의 모든 현대적 생산 시나리오에서 YOLO11 훨씬 우수한 경험을 YOLO11 :
- 스마트 시티와 소매업: 탁월한 속도-정확도 비율 덕분에 YOLO11 혼잡한 장면도 손쉽게 YOLO11 , 대규모 GPU 없이도 자동화된 소매 분석 및 교통 관리 시스템을 구동합니다.
- 엣지 컴퓨팅: 높은 메모리 효율성과 강력한 내보내기 옵션 덕분에 YOLO11 라즈베리 파이(Raspberry Pi)나 NVIDIA ) 플랫폼과 같은 장치에서의 엣지 AI 배포에 YOLO11
- 복합 파이프라인: 객체 탐지와 자세 키포인트 (예: 스포츠 분석) 또는 정밀 인스턴스 분할(예: 의료 영상)을 결합해야 하는 프로젝트의 경우, YOLO11 하나의 통합 API를 통해 모든 작업을 기본적으로 YOLO11 .
사용 사례 및 권장 사항
YOLO11 YOLOX 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
YOLO11 선택해야 할 때
YOLO11 다음에 대한 강력한 YOLO11 :
- 생산 환경 배포: 라즈베리 파이(Raspberry Pi )나 NVIDIA (NVIDIA NVIDIA )과 같은 장치에서 신뢰성과 능동적 유지보수가 최우선인 상용 애플리케이션.
- 다중 작업 비전 애플리케이션: 단일 통합 프레임워크 내에서 탐지, 분할, 자세 추정 및 OBB(외부 경계 박스)가 필요한 프로젝트.
- 신속한 프로토타이핑 및 배포: 데이터 수집에서 생산 단계까지 신속하게 진행해야 하는 팀을 위한 간소화된 Ultralytics Python .
욜록스를 선택해야 할 때
YOLOX는 다음에 권장됩니다:
- 앵커 프리 탐지 연구: 새로운 탐지 헤드나 손실 함수를 실험하기 위한 기준으로 YOLOX의 깔끔한 앵커 프리 아키텍처를 활용한 학술 연구.
- 초경량 에지 디바이스: 마이크로컨트롤러 또는 레거시 모바일 하드웨어에 배포할 때 YOLOX-Nano 변형의 극히 작은 메모리 사용량(0.91M 매개변수)이 핵심적인 요소입니다.
- SimOTA 라벨 할당 연구: 최적 수송 기반 라벨 할당 전략과 훈련 수렴에 미치는 영향을 조사하는 연구 프로젝트들.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
- 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.
앞으로 바라보기: YOLO26의 힘
YOLO11 탁월한 YOLO11 불구하고, AI 환경은 끊임없이 진화하고 있습니다. 효율성과 안정성의 절대적 정점을 추구하는 팀을 위해, YOLO26 (2026년 1월 출시)가 새로운 컴퓨터 비전 프로젝트를 위한 최상의 추천 모델입니다.
YOLO26은 엔드투엔드 NMS 설계를 구현함으로써 획기적인 발전을 이루었습니다. 비최대 억제(NMS) 후처리 단계를 제거함으로써 지연 변동성을 완전히 없애고, 배포 로직을 극적으로 단순화했습니다. 이 개념은 최초로 YOLOv10에서 처음 제시된 개념입니다.
또한 YOLO26은 DFL 제거 (Distribution Focal Loss) 기능을 탑재하여 아키텍처를 최적화함으로써 CPU 속도를 최대 43%까지 향상시켰으며, 이는 저전력 및 에지 디바이스 분야에서 확실한 챔피언으로 자리매김하게 합니다. MuSGD 최적화기( MuSGD Optimizer)를 통해 훈련 안정성도 극대화됩니다. 이 LLM에서 영감을 받은 SGD )의 하이브리드 방식은 수렴 속도를 가속화합니다. ProgLoss + STAL과 같은 고급 손실 함수와 결합된 YOLO26은 드론 영상이나 IoT 에지 센서와 같은 까다로운 환경에서 작은 물체를 탐지하는 데 탁월합니다.
결론적으로, YOLOX가 2021년에 중요한 아키텍처 개념을 도입했지만, YOLO11포괄적인 도구 세트, 메모리 효율성, 최첨단 성능—특히 YOLO26의 혁신적인 아키텍처—은 오늘날 연구자와 기업 개발자에게 Ultralytics 확실한 선택지로 만듭니다.