콘텐츠로 건너뛰기

YOLOX와 YOLOv5: 앵커 없는 혁신과 입증된 효율성 살펴보기

빠르게 진화하는 객체 감지 환경에서 올바른 아키텍처를 선택하는 것은 프로젝트 성공의 핵심입니다. 이 비교에서는 영향력 있는 두 가지 모델을 살펴봅니다: 앵커 없는 설계로 유명한 학계의 강자 YOLOX와YOLOv5와 속도와 배포 용이성의 업계 표준인 YOLOv5를 비교합니다. 두 모델 모두 컴퓨터 비전 분야를 형성했지만, 연구 수준의 정밀도를 우선시하는지 아니면 생산에 바로 적용할 수 있는 효율성을 우선시하는지에 따라 서로 다른 요구 사항을 충족합니다.

성능 분석: 속도, 정확도 및 효율성

YOLOX와 YOLOv5 평가할 때 종종 원시 정확도와 운영 효율성 사이의 절충안으로 구분합니다. YOLOX는 디커플링 헤드와 앵커가 없는 메커니즘과 같은 중요한 아키텍처 변경을 도입하여 출시와 동시에 최첨단 mAP (평균 정밀도) 점수를 달성할 수 있었습니다. 특히 COCO 같은 까다로운 벤치마크에서 정확도 1퍼센트 포인트가 중요한 시나리오에서 탁월한 성능을 발휘합니다.

반대로, Ultralytics YOLOv5 는 "실제" 성능에 중점을 두고 설계되었습니다. 추론 속도와 짧은 지연 시간을 우선시하여 모바일 앱, 임베디드 시스템 및 엣지 AI 디바이스에 매우 적합합니다. 특정 대형 모델의 경우 mAP YOLOX가 약간 우위를 점할 수 있지만, 종합적인 Ultralytics 에코시스템을 활용하는 YOLOv5 처리량(초당 프레임 수)과 배포 유연성에서 지속적으로 더 나은 성능을 발휘합니다.

아래 표는 다양한 크기의 모델을 나란히 자세히 비교한 것입니다. 특히 다음과 같이 최적화했을 때 YOLOv5 훨씬 빠른 추론 시간을 제공하면서도 경쟁력 있는 정확도를 유지하는 방법에 주목하세요. TensorRT.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

욜록스: 앵커 없는 경쟁자

YOLO 시리즈와 앵커 프리 감지의 학문적 발전 사이의 간극을 메우기 위해 Megvii의 연구원들이 개발한 것이 YOLO . 사전 정의된 앵커 박스의 제약을 제거함으로써 YOLOX는 훈련 프로세스를 간소화하고 휴리스틱 튜닝의 필요성을 줄여줍니다.

아키텍처 및 혁신

YOLOX에는 분류와 회귀 작업을 서로 다른 분기로 분리하는 디커플링 헤드가 통합되어 있습니다. 이 설계는 이전 YOLO 버전의 결합형 헤드와는 대조적으로 수렴 속도와 정확도를 향상시키는 것으로 알려져 있습니다. 또한, 양성 샘플을 동적으로 할당하는 고급 라벨 할당 전략인 SimOTA를 활용하여 밀집된 장면에서 모델의 견고성을 향상시킵니다.

강점과 약점

YOLOX의 주요 강점은 특히 가장 큰 변형(YOLOX-x)의 높은 정확도와 연구자들에게 어필할 수 있는 깔끔하고 앵커가 없는 디자인에 있습니다. 하지만 이러한 장점에는 단점도 있습니다. 분리된 헤드는 계산 복잡성을 증가시켜 YOLOv5 비해 추론 속도가 느려지는 경우가 많습니다. 또한, 연구 중심 모델이기 때문에 Ultralytics 에코시스템에서 볼 수 있는 응집력 있고 사용자 친화적인 툴링이 부족하여 상용 파이프라인으로의 통합이 복잡해질 수 있습니다.

이상적인 사용 사례

  • 학술 연구: 새로운 탐지 아키텍처와 라벨 할당 전략을 실험합니다.
  • 고정밀 작업: 오프라인 비디오 분석과 같이 mAP 1~2% 이득이 느린 추론의 비용보다 더 큰 시나리오.
  • 조밀한 물체 감지: 심하게 어수선한 물체가 있는 환경에서도 SimOTA가 잘 작동합니다.

YOLOX에 대해 자세히 알아보세요

YOLOv5: 프로덕션 표준

2020년 출시 이후, Ultralytics YOLOv5 는 전 세계 개발자들이 가장 선호하는 모델이 되었습니다. 이 제품은 성능과 실용성 사이에서 탁월한 균형을 이루며, 전체 머신 러닝 작업(MLOps) 수명 주기를 간소화하도록 설계된 플랫폼의 지원을 받습니다.

아키텍처 및 에코시스템

YOLOv5 효율적인 특징 추출을 위해 최적화된 CSPNet 백본과 경로 집계 네트워크(PANet) 넥을 활용합니다. 원래 PyTorch 앵커 기반 접근 방식을 대중화했지만, 가장 큰 자산은 주변 에코시스템입니다. 사용자는 모델 훈련 및 관리를 위해 ONNX, CoreML, TFLite 같은 포맷으로 자동 내보내기는 물론, Ultralytics HUB와의 원활한 통합을 통해 이점을 누릴 수 있습니다.

알고 계셨나요?

YOLOv5 바운딩 박스에만 국한되지 않습니다. 인스턴스 분할이미지 분류를 포함한 여러 작업을 지원하므로 복잡한 비전 파이프라인을 위한 다용도 툴입니다.

강점과 약점

사용 편의성은 YOLOv5 특징입니다. 개발자는 간단한 Python API를 사용해 몇 줄의 코드만으로 사전 학습된 가중치를 로드하고 추론을 실행할 수 있습니다. 이 모델은 속도에 고도로 최적화되어 있어 YOLOX에 비해 CPU와 GPU 모두에서 일관되게 낮은 지연 시간을 제공합니다. 또한 훈련 중 메모리 요구량이 낮아 표준 하드웨어에서 사용할 수 있습니다. 앵커 기반 설계로 인해 사용자 정의 데이터 세트에 대한 앵커 에볼루션이 필요하지만( YOLOv5 자동으로 처리됨), 안정성과 잘 관리된 에코시스템으로 인해 프로덕션용으로도 우수합니다.

이상적인 사용 사례

  • 실시간 애플리케이션: 짧은 지연 시간이 중요한 비디오 감시, 자율 주행, 로보틱스 분야.
  • 엣지 배포: 효율적인 아키텍처로 인해 라즈베리 파이, NVIDIA 젯슨 또는 모바일 기기에서 실행됩니다.
  • 상용 제품: 장기적인 지원과 손쉬운 통합이 필요한 경우 신속한 프로토타이핑 및 배포가 가능합니다.
  • 멀티태스크 비전: 단일 프레임워크 내에서 탐지, 세분화 및 분류가 필요한 프로젝트.

YOLOv5에 대해 자세히 알아보세요

코드 예제: Ultralytics YOLOv5 실행하기

Ultralytics Python 패키지를 사용하면 YOLOv5 모델을 매우 간단하게 활용할 수 있습니다. 다음은 사전 학습된 모델을 사용하여 추론을 실행하는 방법의 예입니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (Nano version for speed)
model = YOLO("yolov5nu.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

결론 결론: 올바른 선택하기

두 모델 모두 컴퓨터 비전 분야에서 중요한 업적을 이루었지만, 각기 다른 대상을 대상으로 합니다. YOLOX는 보다 세분화된 도구 세트를 탐색하는 데 익숙한 앵커 없는 탐지의 경계를 넓히려는 연구자에게 강력한 선택입니다.

그러나 대다수의 개발자, 엔지니어 및 기업에게는 그렇지 않습니다, Ultralytics YOLOv5 가 여전히 우수한 옵션입니다. 독보적인 속도, 다목적성, 강력하고 활발한 에코시스템의 성공적인 조합을 통해 최소한의 마찰로 개념에서 배포로 이동할 수 있습니다. 또한, Ultralytics 프레임워크를 채택하면 다음과 같은 차세대 모델로의 명확한 업그레이드 경로를 제공합니다. YOLO11와 같은 차세대 모델로의 명확한 업그레이드 경로를 제공하며, 이는 앵커가 필요 없는 최고의 설계와 Ultralytics 특유의 효율성을 결합한 것입니다.

기타 모델 비교

이러한 모델을 다른 아키텍처와 비교하여 특정 요구 사항에 가장 적합한 모델을 찾는 방법을 살펴보세요:


댓글