YOLOX 대 YOLO11: 기술 비교
정확도, 속도 및 계산 리소스의 요구 사항의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 Megvii의 고성능 앵커 프리 모델인 YOLOX와 Ultralytics의 최신 최첨단 모델인 Ultralytics YOLO11 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보겠습니다.
YOLOX: 앵커 프리 고성능 검출기
YOLOX는 강력한 성능을 달성하면서 감지 파이프라인을 단순화하도록 설계된 앵커 프리 버전의 YOLO로 Megvii에서 소개되었습니다. 이는 미리 정의된 anchor boxes의 복잡성을 제거하여 학술 연구와 산업 응용 간의 간극을 좁히는 것을 목표로 했습니다.
기술 세부 사항:
- 작성자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
- Organization: Megvii
- 날짜: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- 문서: https://yolox.readthedocs.io/en/latest/
아키텍처 및 주요 기능
YOLOX는 YOLO 제품군에 몇 가지 주요 혁신을 도입했습니다.
- Anchor-Free Design: 앵커 박스를 제거함으로써 YOLOX는 설계 파라미터 수를 줄이고 학습 프로세스를 단순화하여 더 나은 일반화 성능을 얻을 수 있습니다.
- 분리된 헤드: 분류 및 회귀 작업에 대해 별도의 예측 헤드를 사용합니다. 이러한 분리는 이전 YOLO 버전에서 사용된 결합 헤드에 비해 수렴 속도를 향상시키고 모델 정확도를 높일 수 있습니다.
- 고급 훈련 전략: YOLOX는 훈련 중 동적 레이블 할당을 위해 SimOTA(간소화된 최적 전송 할당 전략)와 같은 고급 기술과 강력한 데이터 증강 방법을 함께 통합합니다.
강점과 약점
강점:
- 높은 정확도: YOLOX 모델, 특히 더 큰 변형은 COCO 데이터 세트와 같은 표준 벤치마크에서 경쟁력 있는 mAP 점수를 달성합니다.
- Anchor-Free 단순성: 다른 검출기에서 흔히 발생하는 문제점인 앵커 박스 구성의 필요성을 없애 탐지 파이프라인을 간소화합니다.
- 확립된 모델: 2021년에 출시된 모델로서 다양한 배포 예제를 통해 커뮤니티 팔로워를 보유하고 있습니다.
약점:
- 구식 성능: 당시에는 강력했지만 속도와 정확도 측면에서 YOLO11과 같은 최신 모델에 의해 성능이 능가되었습니다.
- 제한적인 활용성: YOLOX는 주로 객체 탐지에 중점을 둡니다. Ultralytics와 같은 최신 프레임워크에서 표준으로 제공되는 인스턴스 세분화, 포즈 추정 또는 분류와 같은 다른 비전 작업에 대한 기본 지원이 부족합니다.
- External Ecosystem: 통합된 Ultralytics 생태계의 일부가 아니므로 사용자는 간소화된 도구, 지속적인 업데이트, 학습, 유효성 검사 및 배포에 대한 포괄적인 지원을 활용할 수 없습니다.
이상적인 사용 사례
YOLOX는 다음과 같은 경우에 적합합니다:
- 연구 기준: 앵커 프리(anchor-free) 감지 방법을 탐색하는 연구자들에게 훌륭한 기준 역할을 합니다.
- 산업 애플리케이션: 견고하고 잘 이해된 감지기가 충분한 제조업의 품질 관리와 같은 작업에 적합합니다.
Ultralytics YOLO11: 최첨단 다재다능함 및 성능
Ultralytics YOLO11은 Ultralytics의 최신 주력 모델로, YOLO 시리즈의 정점을 나타냅니다. YOLOv8과 같은 이전 모델의 성공을 기반으로 최첨단 성능, 탁월한 다재다능성 및 뛰어난 사용자 경험을 제공합니다.
기술 세부 사항:
- 저자: Glenn Jocher, Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: https://docs.ultralytics.com/models/yolo11/
아키텍처 및 주요 기능
YOLO11은 최대 효율성과 정확성을 위해 설계된 고도로 최적화된 단일 단계 앵커 프리(Anchor-Free) 아키텍처를 특징으로 합니다.
- 성능 균형: YOLO11은 속도와 정확도 간의 뛰어난 균형을 달성하여 엣지 장치에서의 실시간 처리부터 클라우드 서버에서의 고처리량 분석에 이르기까지 광범위한 애플리케이션에 적합합니다.
- 다재다능함: YOLO11의 주요 장점은 멀티태스킹 기능입니다. 단일 통합 프레임워크 내에서 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(oriented bounding box) 감지를 지원합니다.
- 사용 편의성: YOLO11은 간단한 Python API, 강력한 CLI 및 광범위한 설명서를 갖춘 잘 관리된 생태계에 통합되어 있습니다. 따라서 초보자와 전문가 모두에게 매우 접근성이 좋습니다.
- 학습 효율성: 이 모델은 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치, 더 낮은 메모리 요구 사항의 이점을 활용하여 더 빠른 개발 주기를 가능하게 합니다.
- 잘 관리되는 에코시스템: Ultralytics는 활발한 개발, 강력한 커뮤니티 지원, 데이터 세트 관리에서 프로덕션 배포에 이르기까지 엔드 투 엔드 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 제공합니다.
강점과 약점
강점:
- 최첨단 성능: 높은 추론 속도를 유지하면서 최고 수준의 mAP 점수를 제공합니다.
- 탁월한 효율성: 최적화된 아키텍처는 YOLOX에 비해 주어진 정확도 수준에 대해 더 적은 파라미터와 FLOPs를 생성합니다.
- 다중 작업 지원: 단일 YOLO11 모델을 다양한 비전 작업에 대해 훈련할 수 있어 타의 추종을 불허하는 유연성을 제공합니다.
- 사용자 친화적인 프레임워크: Ultralytics 생태계는 전체 개발 주기를 단순화합니다.
- 활발한 개발 및 지원: Ultralytics의 지속적인 업데이트, 대규모 커뮤니티 및 전문적인 지원을 통해 이점을 얻을 수 있습니다.
약점:
- 원-스테이지 검출기이므로 조밀한 장면에서 매우 작거나 심하게 가려진 객체를 탐지하는 데 어려움을 겪을 수 있으며, 이는 이 클래스 모델의 일반적인 제한 사항입니다.
- YOLO11x와 같은 가장 큰 모델은 최대 정확도를 달성하기 위해 상당한 컴퓨팅 리소스가 필요하지만, 성능 수준에 비해 매우 효율적입니다.
이상적인 사용 사례
YOLO11은 광범위한 최신 애플리케이션에 이상적인 선택입니다.
- 자율 시스템: 실시간 인지 기능으로 로보틱스 및 자율 주행 자동차를 지원합니다.
- 스마트 보안: 고급 감시 시스템 및 도난 방지 기능 활성화.
- 산업 자동화: 품질 관리 자동화 및 재활용 효율성 개선.
- 리테일 분석: 재고 관리 최적화 및 고객 행동 분석.
성능 비교: YOLOX vs. YOLO11
COCO 데이터 세트에서 성능을 비교할 때 YOLO11의 발전이 분명해집니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOX-Nano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOX-Tiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOX-s | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOX-m | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOX-l | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOX-x | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLO11은 전반적으로 뛰어난 성능을 보여줍니다. 예를 들어 YOLO11s는 YOLOX-m(46.9)보다 파라미터가 절반 미만이고 FLOP가 훨씬 적으면서 더 높은 mAP(47.0)를 달성합니다. 더욱 인상적인 것은 YOLO11m이 가장 큰 YOLOX-x 모델보다 정확도(51.5 mAP 대 51.1 mAP)가 높으면서 훨씬 더 효율적(20.1M 파라미터 대 99.1M)이라는 것입니다.
속도 측면에서 YOLO11 모델은 특히 TensorRT 최적화를 통해 GPU에서 매우 빠릅니다. YOLO11n은 단 1.5ms의 추론 시간으로 경량 모델에 대한 새로운 표준을 설정합니다. 또한 Ultralytics는 YOLOX 벤치마크에는 없는 많은 실제 배포에 중요한 요소인 명확한 CPU 성능 벤치마크를 제공합니다.
결론: 어떤 모델을 선택해야 할까요?
YOLOX는 앵커 프리 객체 검출기 개발에 중요한 기여를 했지만, Ultralytics YOLO11은 거의 모든 최신 사용 사례에서 확실한 승자입니다. 정확도, 속도 및 계산 효율성의 뛰어난 조합을 제공합니다.
YOLO11의 장점은 단순 지표를 훨씬 뛰어넘습니다. 포괄적인 Ultralytics 생태계에 통합되어 생산성이 크게 향상됩니다. 다중 작업 다용성, 사용 편의성, 활발한 유지 관리 및 광범위한 지원을 통해 YOLO11은 개발자와 연구원이 고급 컴퓨터 비전 솔루션을 더 빠르고 효과적으로 구축하고 배포할 수 있도록 지원합니다. 최첨단 성능과 원활한 개발 경험이 필요한 모든 새로운 프로젝트에 YOLO11을 권장합니다.
기타 모델 비교
YOLOX 및 YOLO11이 다른 주요 모델과 어떻게 비교되는지 궁금하다면 다음 비교 페이지를 확인해 보세요.
- YOLOv10 vs YOLOX
- YOLOv8 vs YOLOX
- RT-DETR vs YOLOX
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv8
- YOLO11 vs EfficientDet
- YOLO11 대 RT-DETR