콘텐츠로 건너뛰기

YOLOX 대 YOLOv5: 기술 비교

빠르게 진화하는 컴퓨터 비전 분야에서 YOLO(You Only Look Once) 시리즈는 지속적으로 실시간 객체 감지의 경계를 넓혀왔습니다. 이 페이지에서는 이 시리즈의 두 가지 영향력 있는 모델인 Megvii에서 개발한 YOLOX와 Ultralytics YOLOv5 간의 자세한 기술 비교를 제공합니다. 두 모델 모두 강력한 기능을 제공하지만 서로 다른 설계 철학을 기반으로 구축되었습니다. YOLOX는 anchor-free 방식을 도입하여 감지 헤드를 단순화하고 성능을 향상시키는 반면 YOLOv5는 속도, 정확성 및 사용 편의성의 뛰어난 균형으로 알려진 업계 표준으로 자리 잡았습니다.

이 비교 분석에서는 원시 정확도, 배포 속도 또는 전반적인 개발 효율성 중 무엇을 우선시하는지에 따라 프로젝트에 가장 적합한 모델을 선택할 수 있도록 아키텍처 차이, 성능 지표 및 이상적인 사용 사례를 자세히 살펴봅니다.

YOLOX: 앵커 프리 및 고성능 대안

YOLOX는 2021년 7월 18일에 Megvii의 연구진에 의해 소개되었습니다. 기존 앵커 기반 방식에 비해 단순화된 설계로 높은 성능을 목표로 하는 앵커 프리(anchor-free) 객체 감지 방식을 제시합니다. 미리 정의된 앵커 박스를 제거함으로써 YOLOX는 설계 복잡성을 줄이고 다양한 데이터 세트에 대한 일반화 성능을 향상시키는 것을 목표로 합니다.

기술 세부 사항:

아키텍처 및 주요 기능

YOLOX는 몇 가지 주요 혁신으로 차별화됩니다. 핵심 기능은 사전 정의된 앵커 박스에 의존하지 않고 객체 속성을 직접 예측하는 앵커 프리 감지 메커니즘입니다. 이를 통해 훈련 파이프라인을 간소화하고 앵커 튜닝의 필요성을 없앱니다. 또한 이 아키텍처는 분류 및 지역화 작업을 위한 분리된 헤드를 통합하여 수렴 및 정확도를 향상시키는 것으로 확인되었습니다. 또한 YOLOX는 SimOTA라는 고급 레이블 할당 전략을 활용하여 훈련을 위한 긍정적인 샘플을 동적으로 할당하여 까다로운 객체에 대한 성능을 향상시킵니다.

강점

  • 높은 정확도: YOLOX는 분리된 헤드와 고급 레이블 할당 기술 덕분에 COCO와 같은 벤치마크에서 비슷한 크기의 다른 모델보다 성능이 뛰어나 경쟁력 있는 정확도를 달성합니다.
  • Anchor-Free 감지: 이는 감지 파이프라인을 간소화하고 도메인별 튜닝이 필요한 앵커 박스 구성에 대한 종속성을 제거하여 일반화를 개선할 수 있습니다.

약점

  • 구현 복잡성: 앵커가 없는 것이 한 가지 측면을 단순화하지만, 분리된 헤드와 SimOTA와 같은 고급 전략을 도입하면 모델의 구현 및 이해에 복잡성이 더해질 수 있습니다.
  • External Ecosystem: YOLOX는 Ultralytics 제품군의 일부가 아니므로 Ultralytics HUB와 같은 도구와의 원활한 통합이 부족합니다. 따라서 통합되고 문서화가 잘 된 Ultralytics 환경에 비해 학습 곡선이 더 가파를 수 있습니다.
  • CPU 속도: 성능 벤치마크에서 볼 수 있듯이 CPU에서의 추론 속도는 특히 더 큰 YOLOX 변형의 경우 YOLOv5와 같이 고도로 최적화된 모델에 비해 뒤쳐질 수 있습니다.

사용 사례

YOLOX는 가능한 가장 높은 정확도를 달성하는 것이 주요 목표인 애플리케이션에 적합합니다.

  • 자율 주행: 높은 정밀도는 모든 객체를 정확하게 식별하는 것이 중요한 자율 주행 차량의 인식 작업에 유용합니다.
  • 고급 로봇 공학: 로봇이 탐색 및 상호 작용을 위해 정밀한 객체 감지를 수행해야 하는 복잡한 환경에 이상적이며, 이는 로봇 공학의 AI에서 자세히 다룹니다.
  • 연구: 객체 감지에서 앵커 프리(anchor-free) 방법론 및 고급 훈련 기술에 대한 학술 및 산업 연구를 위한 강력한 기준 역할을 합니다.

YOLOX에 대해 자세히 알아보세요

YOLOv5: 다재다능하고 널리 채택된 모델

2020년 6월 26일에 출시된 Ultralytics YOLOv5는 빠른 속도, 정확성 및 뛰어난 사용 편의성의 균형으로 업계 표준이 되었습니다. Ultralytics의 Glenn Jocher가 개발했으며 PyTorch에서 완전히 구축되어 광범위한 개발자 및 연구원 커뮤니티가 쉽게 접근할 수 있습니다.

기술 세부 사항:

아키텍처 및 주요 기능

YOLOv5는 특징 추출을 위해 CSPDarknet53 백본을 사용하고 특징 집계를 위해 PANet 넥을 사용하며, 이는 효율적이고 효과적인 객체 감지를 위한 입증된 조합입니다. 이 아키텍처는 확장성이 뛰어나 다양한 컴퓨팅 예산과 성능 요구 사항을 충족하기 위해 다양한 크기(n, s, m, l, x)로 제공됩니다. YOLOX와 달리 속도에 최적화된 앵커 기반 감지 헤드를 사용합니다. 이 모델은 간단한 Python API, 광범위한 문서, 학습 및 배포를 위한 노코드 Ultralytics HUB 플랫폼을 포함하는 포괄적인 생태계의 일부입니다.

강점

  • 탁월한 추론 속도: YOLOv5는 빠른 감지에 매우 최적화되어 있어 CPU 및 GPU 하드웨어 모두에서 실시간 시스템을 위한 최고의 선택입니다.
  • 사용 편의성: 간단한 API, 포괄적인 문서, Ultralytics 생태계 내의 원활한 통합으로 유명하며, 이는 개발자의 진입 장벽을 크게 낮춥니다.
  • 성숙한 에코시스템: 대규모 활성 커뮤니티, 빈번한 업데이트 및 즉시 사용 가능한 사전 훈련된 가중치를 포함한 광범위한 리소스의 이점을 누릴 수 있습니다.
  • 학습 효율성: 학습 과정은 매우 효율적이며, 더 복잡한 아키텍처에 비해 수렴 시간이 더 빠르고 일반적으로 메모리 요구 사항이 적습니다.
  • 다양성: YOLOv5는 동일한 프레임워크 내에서 인스턴스 분할이미지 분류를 포함하여 탐지 외에도 여러 비전 작업을 지원합니다.

약점

  • Anchor-Based Detection: 앵커 박스에 의존하며, 앵커 프리 검출기와 비교했을 때 비정상적인 모양 또는 크기로 조정된 객체를 가진 데이터 세트에서 최적의 성능을 위해 튜닝이 필요할 수 있습니다.
  • 정확도 절충: 균형은 매우 훌륭하지만, 더 작은 YOLOv5 모델은 속도를 우선시하므로 최대 정밀도를 위해 설계된 더 큰 모델이나 최신 아키텍처에 비해 정확도가 약간 낮을 수 있습니다.

사용 사례

YOLOv5는 다재다능함과 효율성 덕분에 매우 광범위한 영역에 적합합니다.

  • Edge Computing: 속도와 더 작은 모델 크기 덕분에 Raspberry PiNVIDIA Jetson과 같이 리소스가 제한된 장치에 배포하는 데 적합합니다.
  • 산업 자동화: 제조업에서 품질 관리 및 공정 자동화를 강화하고 재활용 효율성 향상과 같은 효과를 가져옵니다.
  • 보안 및 감시: 도난 방지와 같은 애플리케이션을 위해 보안 시스템에서 실시간 모니터링을 지원합니다.
  • 모바일 애플리케이션: 낮은 지연 시간과 효율성이 중요한 장치 내 객체 감지 작업에 적합합니다.

YOLOv5에 대해 자세히 알아보세요

정면 성능 비교: 속도 vs. 정확도

YOLOX와 YOLOv5를 비교할 때 정확도와 속도 간의 명확한 절충점이 나타납니다. YOLOX 모델은 일반적으로 주어진 모델 크기에 대해 더 높은 mAPval 점수를 달성하여 앵커 프리 설계와 고급 훈련 전략의 효과를 입증합니다. 예를 들어 YOLOX-x는 51.1 mAP에 도달하여 YOLOv5x를 약간 앞지릅니다.

그러나 Ultralytics YOLOv5는 추론 속도에서 상당한 이점을 가지고 있습니다. YOLOv5n과 같은 더 작은 YOLOv5 모델은 CPU와 GPU 모두에서 매우 빠르므로 에지 장치에서 실시간 애플리케이션에 이상적입니다. 성능 표에 따르면 YOLOv5n은 TensorRT 대기 시간이 1.12ms에 불과하여 YOLOX-s보다 두 배 이상 빠릅니다. 이러한 효율성 덕분에 YOLOv5는 속도가 중요한 제약 조건인 많은 생산 환경에서 더 실용적인 선택입니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

결론: 어떤 모델을 선택해야 할까요?

YOLOX와 YOLOv5는 모두 강력한 객체 감지 모델이지만, 서로 다른 우선순위를 충족합니다. YOLOX최대 정확도를 우선시하고 앵커 프리 아키텍처의 이점을 탐색하는 데 관심 있는 연구원 및 개발자에게 탁월한 선택입니다. 벤치마크에서 강력한 성능을 제공하므로 정밀도가 가장 중요한 작업에 적합한 강력한 모델입니다.

하지만 대부분의 실제 애플리케이션에서는 Ultralytics YOLOv5가 더 매력적인 전체 패키지를 제공합니다. 주요 장점은 뛰어난 속도, 사용 편의성 및 강력한 생태계에 있습니다. 개발자는 포괄적인 문서, 간단한 API 및 간소화된 훈련 프로세스 덕분에 빠르게 시작할 수 있습니다. 모델의 효율성은 특히 실시간 및 에지 컴퓨팅 시나리오에서 배포에 매우 실용적입니다.

또한 Ultralytics의 지속적인 개발 및 지원은 사용자가 잘 관리되고 지속적으로 개선되는 프레임워크의 이점을 누릴 수 있음을 의미합니다. 사용 편의성 및 다재다능성과 결합된 최첨단 성능을 추구하는 사람들에게는 YOLOv8YOLO11과 같은 최신 Ultralytics 모델을 탐색하는 것이 좋습니다. YOLOv5의 강력한 기반을 토대로 더욱 뛰어난 기능을 제공하기 때문입니다.

기타 모델 비교

이러한 모델과 다른 모델과의 비교에 관심이 있다면 다음 페이지를 확인해 보세요.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글