YOLOv5 YOLOX: 객체 탐지 아키텍처의 기술적 비교
컴퓨터 비전 분야의 급속한 발전 속에서 앵커 기반 탐지기와 앵커 프리 탐지기의 논쟁은 핵심 주제였다. 본 비교 연구는 두 접근법의 기술적 차이점을 탐구한다. YOLOv5와 고성능 앵커 프리 탐지기인 YOLOX 간의 기술적 차이점을 살펴봅니다.
모델 기원 및 개요
YOLOv5
저자: Glenn Jocher
소속: Ultralytics
날짜: 2020-06-26
GitHub: yolov5
YOLOX
저자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
소속: Megvii
날짜: 2021-07-18
GitHub: Megvii-BaseDetection/YOLOX
YOLOv5 YOLOv5는 아키텍처 변경뿐만 아니라 원활한 사용자 경험을 창출함으로써 분야에 혁신을 가져왔습니다. 훈련 용이성, 수출 가능성, 배포 속도를 최우선으로 하여 기업과 개발자들의 필수 선택지가 되었습니다. 1년 후 출시된 YOLOX는 YOLO 앵커 프리 탐지라는 학술적 트렌드 사이의 격차를 해소하기 위해 분리형 헤드와 새로운 레이블 할당 전략을 도입했습니다.
성능 지표
다음 표는 두 모델의 성능을 비교합니다. YOLOX가 약간 더 높은 mAP 을 YOLOv5 특히 CPU 환경에서 훨씬 빠른 추론 속도와 현저히 낮은 배포 복잡성을 YOLOv5 .
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
아키텍처의 차이점
핵심 기술적 차이는 각 모델이 바운딩 박스 예측을 처리하는 방식에 있다.
YOLOv5: 앵커 기반 표준
YOLOv5 앵커 기반 메커니즘을 YOLOv5 . 이는 미리 정의된 앵커 박스에서 오프셋을 예측하여 알려진 크기의 객체에 대한 훈련을 안정화하는 데 도움을 줍니다.
- 백본: 수정된 CSPDarknet53을 활용하여 기울기 흐름을 향상시키고 계산 병목 현상을 줄입니다.
- 데이터 증강: 훈련 파이프라인 MixUp 모자이크 증강과 MixUp ( MixUp 의 광범위한 활용을 선도하여, 모델의 가림 현상에 대한 강건성을 크게 향상시켰습니다.
- 초점: 이 아키텍처는 실제 환경 배포를 위해 극도로 최적화되어 있으며, 각 계층이 TPU 같은 하드웨어 가속기에 효율적으로 매핑되도록 보장합니다.
YOLOX: 앵커 없는 도전자
YOLOX는 앵커 없는 접근 방식으로 전환하여 물체의 중심을 직접 예측합니다.
- 분리된 헤드: 이전 YOLO 달리, YOLOX는 분류와 위치 추정 작업을 서로 다른 "헤드"로 분리합니다. 연구진은 이 방식이 수렴 과정에서 두 목표 간의 충돌을 해결한다고 주장합니다.
- SimOTA: 훈련 과정을 최적 수송 문제로 보는 진보된 동적 레이블 할당 전략.
- 참고: 심층적인 기술적 세부 사항은 YOLOX arXiv 논문을 참조하십시오.
분리된 머리의 상충 관계
YOLOX의 분리된 헤드는 수렴 속도와 정확도를 향상시키지만, 종종 추가적인 계산 오버헤드를 발생시켜 YOLOv5 YOLOv8에서 발견되는 결합된 헤드 설계에 비해 추론 속도가 다소 느려집니다. YOLOv8보다 약간 느려지게 합니다.
에코시스템 및 사용 편의성
생산 환경에서 모델을 평가할 때, 주변 생태계는 아키텍처 자체만큼 중요합니다. 바로 여기서 Ultralytics 모델이 뚜렷한 우위를 제공합니다.
YOLOv5 성숙하고 잘 관리되는 생태계에 통합되어 있습니다. 사용자는 데이터셋 주석 작업, 훈련 및 배포를 간소화하는 Ultralytics (구 HUB)의 혜택을 누릴 수 있습니다. 이 플랫폼은 인프라의 복잡성을 처리하여 개발자가 데이터와 결과에 집중할 수 있도록 합니다.
반면 YOLOX는 강력한 학술적 성능을 제공하지만 배포 시 수동 설정이 더 많이 필요한 경우가 많습니다. Ultralytics 훈련 효율성을 최우선으로 하여 즉시 사용 가능한 사전 훈련된 가중치를 제공하고 훈련 중 메모리 사용량을 줄입니다. 이러한 메모리 효율성은 특히 최신 트랜스포머 기반 모델인 RT-DETR와 같은 최신 트랜스포머 기반 모델과 비교할 때 특히 두드러집니다.
진화: YOLO26의 등장
YOLOv5 YOLOX가 여전히 탁월한 선택지임에도 불구하고, 이 분야는 진화해 왔습니다. 2026년에 새로운 프로젝트를 시작하는 개발자들에게 YOLO26은 이러한 진화의 정점을 대표합니다. YOLOv5 YOLOX의 앵커 프리 YOLOv5 , 두 모델 모두를 뛰어넘는 성능을 보여줍니다.
YOLO26은 엣지 컴퓨팅 및 실시간 분석을 위한 궁극적인 성능 균형을 제공하도록 설계되었습니다.
왜 YOLO26으로 업그레이드해야 할까요?
- NMS드투엔드 NMS: YOLOX와 마찬가지로 YOLO26도 앵커를 사용하지 않지만, 더 나아가 본질적으로 엔드투엔드 방식으로 구현됩니다. 이는 FPGA나 CoreML.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법(특히 Moonshot AI의 Kimi K2에서 영감을 얻음)을 바탕으로 한 이 하이브리드 최적화기는 안정적인 훈련 역학을 보장하여, 효과적으로 LLM의 안정성을 비전 작업에 적용합니다.
- 속도: YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 제공하며, 이는 분포 초점 손실(DFL) 제거 및 아키텍처 정리를 통해 달성되었습니다.
- ProgLoss + STAL: 이 개선된 손실 함수들은 특히 소형 객체 인식에 초점을 맞추어, 기존 탐지기들의 일반적인 약점을 해결합니다.
작업 전반에 걸친 다양한 활용성
YOLOX가 주로 탐지에 초점을 맞춘 것과 달리, Ultralytics 포즈 추정, 인스턴스 분할, 방향 객체 탐지(OBB)를 포함한 다양한 작업을 기본적으로 지원합니다.
실제 응용 분야
이러한 모델 간의 선택은 종종 배포 시나리오에 따라 달라집니다.
- 산업용 검사 (YOLOv5): 높은 처리량이 요구되는 제조 라인을 위해, 결합형 헤드 설계와 TensorRT 최적화를 Ultralytics 최소한의 지연 시간을 보장합니다.
- 항공 감시(YOLO26): 새로운 ProgLoss + STAL 기능을 통해 YOLO26은 드론 영상에서 차량이나 가축과 같은 소형 물체를 탐지하는 데 탁월한 성능을 발휘합니다. 이는 기존 앵커 기반 모델들이 종종 어려움을 겪었던 작업입니다.
- 학술 연구(YOLOX): 레이블 할당 전략을 연구하는 연구자들은 SimOTA를 명확하게 구현한 YOLOX를 기준 모델로 자주 사용한다.
코드 예제
Ultralytics 내에서 모델 간 전환은 원활합니다. 다음 코드는 YOLOv5, YOLO11 및 권장 모델인 YOLO26에 모두 적용되는 통합 API를 활용하여 모델을 로드하고 추론을 실행하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load a model (YOLOv5 or the recommended YOLO26)
# The API unifies usage, making it easy to swap models for comparison
model = YOLO("yolo26n.pt") # Loading the latest Nano model
# Run inference on a local image
results = model("path/to/image.jpg")
# Process the results
for result in results:
result.show() # Display prediction
result.save(filename="result.jpg") # Save to disk
결론
YOLOv5 모두 컴퓨터 비전 역사에 그 자리를 차지했습니다. YOLOv5 사용 편의성과 배포 측면에서 기준을 YOLOv5 , YOLOX는 앵커 프리 탐지의 한계를 넓혔습니다.
그러나 최고 효율을 요구하는 현대적 애플리케이션에는 Ultralytics 탁월한 선택입니다. NMS 설계, 혁신적인 MuSGD 최적화기, 에지 최적화 아키텍처를 통합하여 광범위한 지원으로 뒷받침되는 견고하고 미래에 대비한 솔루션을 제공합니다. Ultralytics 생태계가 뒷받침하는 견고하고 미래에 대비한 솔루션을 제공합니다.