콘텐츠로 건너뛰기

YOLOX 대 YOLOv5: 앵커 프리 연구와 산업용 객체 탐지의 가교 역할

실시간 객체 탐지의 진화는 두 가지 상반된 철학에 의해 주도되어 왔다: 학계의 순수한 아키텍처 추구와 산업계의 실용적 배포 요구이다. YOLOX와 YOLOv5 는 이 두 경로가 수렴하는 지점을 보여줍니다. YOLOX는 탐지의 기본 기하학을 단순화한 고성능 앵커 프리 탐지기를 도입했으며, YOLOv5 생산 환경에서의 사용성, 견고성, 배포 용이성에 대한 글로벌 표준을 YOLOv5 .

이 상세한 비교 분석은 두 영향력 있는 모델이 아키텍처 선택, 추론 속도, 실제 적용 가능성 측면에서 어떻게 비교되는지 살펴보며, 컴퓨터 비전 요구사항에 가장 적합한 프레임워크를 선택하는 데 도움을 줍니다.

주요 기술 사양

다음 표는 두 모델의 성능 지표를 비교합니다. YOLOX는 이론적으로 우수한 결과를 보여주지만, YOLOv5 특히 익스포트 생태계의 성숙도를 고려할 때 실제 배포에 더 균형 잡힌 성능 프로필을 제공하는 YOLOv5 .

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOX: 앵커 없는 혁신가

메그비(Megvii)가 2021년 출시한 YOLOX는 앵커 박스(anchor boxes)를 폐기함으로써 YOLO 중대한 전환점을 마련했습니다. 앵커 박스는 YOLOv2 및 YOLOv3과 같은 이전 버전들의 핵심 요소였습니다. 앵커 없는 메커니즘을 채택함으로써 YOLOX는 훈련 과정을 단순화했으며, 종종 도메인별 전문 지식을 요구했던 수동적인 앵커 하이퍼파라미터 조정의 필요성을 제거했습니다.

건축 하이라이트

  • 앵커 프리 메커니즘: YOLOX는 미리 정의된 박스에서 오프셋을 예측하는 대신 바운딩 박스 좌표를 직접 예측합니다. 이 접근법은 헤드 아키텍처의 복잡성을 줄이고 다양한 물체 형태에 대한 일반화 성능을 향상시킵니다.
  • 분리된 헤드: 분류 및 국소화 작업이 네트워크의 서로 다른 분기로 분리됩니다. 이러한 분리는 분류 신뢰도와 국소화 정확도 간의 상충 관계를 해결하여 훈련 중 더 빠른 수렴을 이끌어냅니다.
  • SimOTA 레이블 할당: YOLOX는 할당 절차를 최적 수송 문제로 보는 고급 레이블 할당 전략인 SimOTA를 도입했습니다. 이 동적 할당 방식은 모델이 훈련 과정에서 더 효과적인 양성 샘플을 학습할 수 있게 합니다.
  • 모자이크 및 MixUp : YOLOv4와 Ultralytics 크게 영감을 받은 YOLOX는 추론 비용을 증가시키지 않으면서도 강건성을 높이기 위해 강력한 데이터 증강 전략을 활용합니다.

연구 배경

YOLOX는 학술 연구와 산업적 적용 사이의 중요한 가교 역할을 수행하며, 앵커 프리 탐지기가 YOLOv5 같은 최적화된 앵커 기반 시스템의 성능에 필적할 수 있음을 입증했습니다.

YOLOX 세부 정보:

YOLOX에 대해 자세히 알아보세요

YOLOv5: 산업 표준

YOLOv5Ultralytics)가 개발한 YOLOv5는 세계에서 가장 널리 채택된 객체 탐지 모델이라고 할 수 있습니다. 이 모델은 사용성, 안정성, 그리고 "그냥 작동한다"는 경험을 최우선으로 했습니다. YOLOX가 아키텍처의 혁신성에 집중한 반면, YOLOv5 엔지니어링의 탁월성에 YOLOv5 수천 개의 실제 사용 사례에 걸쳐 훈련, 배포, 확장이 쉬운 모델을 만들었습니다.

개발자가 YOLOv5 선택하는 이유

  • 탁월한 사용 편의성: Ultralytics 딥러닝 모델 훈련의 복잡성을 추상화합니다. 사용자는 데이터셋에서 훈련된 모델까지 단 몇 줄의 Python 전환할 수 있어, AI 도입의 진입 장벽을 크게 낮춥니다.
  • 포괄적인 생태계: 출판 후 종종 방치되는 연구 저장소와 달리, YOLOv5 방대한 생태계의 지원을 YOLOv5 . 여기에는 다음과 같은 MLOps 도구와의 원활한 통합이 포함됩니다. Weights & Biases, Comet, ClearML를 통해 전문적인 개발 워크플로를 보장합니다.
  • 효율적인 메모리 관리: YOLOv5 효율성을 위해 YOLOv5 . 일반적으로 많은 경쟁 모델에 비해 훈련 중 GPU 사용량이 적어, 사용자가 소비자용 하드웨어나 Google 같은 무료 클라우드 리소스에서도 효과적인 모델을 훈련할 수 있습니다.
  • 탐지를 넘어선 다용도성: YOLOX가 주로 탐지 프레임워크인 반면, YOLOv5 인스턴스 분할과 이미지 분류를 YOLOv5 지원하여 다양한 프로젝트 요구사항을 충족하는 다기능 도구로 자리매김합니다.

YOLOv5 :

5에 대해 자세히 알아보기

성능 및 배포 분석

생산용 모델을 선정할 때 원시 mAP 점수만 mAP 거의 mAP . 배포 제약 조건, 하드웨어 호환성, 유지보수 역시 동등하게 중요합니다.

추론 속도와 효율성

YOLOv5 배포 시나리오에서 탁월한 성능을 YOLOv5 . 이 아키텍처는 ONNX와 같은 형식으로 내보내기 위해 고도로 최적화되어 있습니다. ONNX, TensorRT, CoreML, 그리고 TFLite. 비교표에서 볼 수 있듯이, YOLOv5n(Nano)은 유사한 경량 모델에 비해 훨씬 빠른 추론 속도(T4 TensorRT 기준 1.12ms)를 달성하여, 매 밀리초가 중요한 에지 디바이스에 이상적입니다.

YOLOX는 성능이 우수하지만, 분리된 헤드와 같은 특정 아키텍처 구성 요소로 인해 내보내기 호환성 문제가 발생할 수 있으며, 특정 추론 엔진에 최적화하기 위해 더 많은 맞춤형 엔지니어링이 필요할 수 있습니다.

훈련 경험

Ultralytics 핵심 특징은 훈련 효율성입니다. YOLOv5 자동 앵커 메커니즘은 사용자 지정 데이터셋에 최적화되도록 앵커를 자동 재계산하여 수동 개입 없이 맞춤형 앵커의 이점을 제공합니다. 또한 고품질 사전 훈련된 가중치의 활용은 전이 학습을 가속화하여 소규모 데이터셋으로도 모델이 높은 정확도를 달성할 수 있게 합니다.

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5su.pt")  # YOLOv5s with newer head

# Train on custom data in one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

간소화된 워크플로

위의 코드 스니펫은 통합된 Ultralytics 보여줍니다. 동일한 간단한 인터페이스로 YOLOv5, YOLOv8, 그리고 최첨단 YOLO26까지 모두 지원하므로, 코드베이스를 다시 작성하지 않고도 모델을 즉시 전환할 수 있습니다.

사용 사례 권장 사항

YOLOX에 이상적으로 적합

  • 학술 연구: 깔끔한 앵커 프리 구현 방식 덕분에 레이블 할당 전략이나 탐지 헤드 아키텍처를 연구하는 연구자들에게 탁월한 기준점이 됩니다.
  • 특정 고정밀 시나리오: mAP 극대화가 유일한 mAP 추론 지연 시간이 덜 중요한 작업의 경우, YOLOX의 더 큰 변형 모델(예: YOLOX-x)이 경쟁력 있는 정밀도를 제공합니다.

YOLOv5에 이상적으로 적합

  • 상용 배포: 강력한 수출 경로와 안정성 덕분에 YOLOv5 라즈베리 파이 부터 클라우드 서버까지 수천 대의 기기에 배포하는 기업들의 YOLOv5 .
  • 엣지 AI: 경량 버전(나노/스몰)은 매우 빠른 속도를 자랑하며, 휴대폰이나 드론에서의 실시간 영상 분석에 최적화되어 있습니다.
  • 신속한 시제품 제작: "제로에서 히어로로"의 경험은 개발자가 아이디어를 며칠이 아닌 몇 시간 만에 검증할 수 있음을 의미합니다.

미래: Ultralytics

YOLOv5 YOLOX가 여전히 강력한 도구임에도 불구하고, 해당 분야는 진화해 왔습니다. 최고의 성능을 추구하는 개발자들에게 Ultralytics 차세대 비전 AI를 대표합니다.

YOLO26은 두 가지 장점을 모두 결합합니다:

  • 엔드투엔드 NMS: 최첨단 연구 모델과 마찬가지로 YOLO26은 기본적으로 엔드투엔드 방식으로 설계되어 NMS 필요하지 않습니다. 이로 인해 더 빠르고 결정론적인 추론이 가능해져 배포 파이프라인이 간소화됩니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 혁신에서 영감을 받아, YOLO26은 향상된 안정성과 수렴 속도를 위해 MuSGD 최적화기를 활용합니다.
  • 에지 최적화: 에지 컴퓨팅을 위해 특별히 설계되어 이전 세대 대비 최대 43% 빠른 CPU 제공하며, 모바일 및 IoT 애플리케이션에 탁월한 선택입니다.
  • 다용도성: 단일 통합 프레임워크 내에서 탐지, 분할, 분류, 자세 추정, OBB(오브젝트 바디 바이어스) 등 모든 작업을 지원합니다.

YOLO26에 대해 더 알아보기

결론

YOLOX와 YOLOv5 사이의 선택은 YOLOv5 목표에 달려 있습니다. 앵커 프리 아키텍처를 실험하려는 연구자라면 YOLOX가 강력한 후보입니다. 그러나 안정적이고 실시간 애플리케이션 구축에 주력하는 대다수의 개발자와 기업에게는 YOLOv5—그리고 그 후속 버전인 YOLO26—은속도, 정확도, 사용 편의성 사이에서 탁월한 균형을 제공합니다. Ultralytics 활발한 유지보수, 방대한 문서, 그리고 활발한 커뮤니티를 통해 여러분의 프로젝트를 지원합니다.

추가적인 탐구를 위해 YOLOv8 YOLOv5 비교해 보거나 YOLOv10 실시간 성능에 대해 알아보는 것도 흥미로울 수 있습니다.


댓글