콘텐츠로 건너뛰기

YOLO 욜록스: 자세한 기술 비교

객체 감지 모델은 다양한 컴퓨터 비전 애플리케이션에 필수적이며, 올바른 모델을 선택하는 것은 프로젝트의 특정 요구 사항에 따라 달라집니다. 이 페이지에서는 두 가지 최신 객체 감지 모델인 YOLO YOLOX의 아키텍처, 성능 및 애플리케이션을 분석하여 기술적으로 비교합니다.

DAMO-YOLO

YOLO 알리바바 그룹에서 개발한 빠르고 정확한 객체 감지 모델입니다. NAS 백본과 효율적인 RepGFPN을 비롯한 몇 가지 새로운 기술을 도입하여 객체 감지 작업의 고성능을 목표로 합니다.

아키텍처 및 주요 기능

YOLO 아키텍처에는 몇 가지 혁신적인 구성 요소가 통합되어 있습니다:

  • NAS 백본: 최적화된 특징 추출을 위해 신경망 아키텍처 검색(NAS) 백본을 활용합니다.
  • RepGFPN: 효율적인 재파라미터화된 그라데이션 특징 피라미드 네트워크(GFPN)를 사용하여 특징 융합을 향상시킵니다.
  • 제로헤드: 제로헤드라는 이름의 경량 감지 헤드를 사용하여 계산 오버헤드를 줄입니다.
  • AlignedOTA: 교육 중 라벨 할당을 개선하기 위해 정렬된 최적 전송 할당(OTA)을 사용합니다.

성능 지표

YOLO 속도와 정확성 사이의 강력한 균형을 보여주며 다양한 계산 요구 사항에 맞는 다양한 모델 크기를 제공합니다.

  • mAP: COCO와 같은 데이터 세트에서 경쟁력 있는 평균 정밀도(mAP)를 달성합니다.
  • 추론 속도: 빠른 추론을 위해 설계되어 실시간 애플리케이션에 적합합니다.
  • 모델 크기: 다양한 크기(소형, 소형, 중형, 대형)로 제공되며 매개변수 수와 FLOP이 다양합니다.

강점 및 약점

강점:

  • 높은 정확도: 강력한 탐지 정확도를 나타내는 우수한 mAP 점수를 달성합니다.
  • 효율적인 아키텍처: RepGFPN 및 제로헤드와 같은 혁신적인 구성 요소는 효율성에 기여합니다.
  • 실시간 기능: 실시간 시스템에 적합한 빠른 추론 속도를 위해 설계되었습니다.

약점:

  • 복잡성: 고급 아키텍처 구성 요소는 사용자 지정 및 구현에 복잡성을 초래할 수 있습니다.
  • 제한된 커뮤니티: 기존 모델에 비해 커뮤니티와 리소스가 더 작을 수 있습니다.

사용 사례

YOLO 다음과 같이 높은 정확도와 실시간 성능이 요구되는 애플리케이션에 적합합니다:

  • 고급 로봇 공학: 복잡한 로봇 작업을 위한 정밀한 물체 감지 지원.
  • 고해상도 감시: 고화질 비디오 스트림을 처리하여 세부적인 물체 인식을 지원합니다.
  • 산업 품질 관리: 제조 공정의 미세한 결함을 감지합니다.

YOLO 대해 자세히 알아보기

YOLOX

Megvii가 개발한 욜록스는 앵커가 없는 YOLO 버전으로, 단순함과 고성능을 강조합니다. 효율적인 설계로 연구와 산업 애플리케이션 간의 격차를 해소하는 것을 목표로 합니다.

아키텍처 및 주요 기능

YOLOX는 앵커가 없는 접근 방식과 간소화된 아키텍처가 돋보입니다:

  • 앵커 프리 감지: 앵커 박스의 필요성을 없애고 복잡성과 하이퍼파라미터 튜닝을 줄여 탐지 파이프라인을 간소화합니다.
  • 분리된 헤드: 성능과 훈련 효율을 개선하기 위해 분류 헤드와 회귀 헤드를 분리합니다.
  • SimOTA 라벨 할당: 보다 효과적인 교육을 위해 SimOTA(단순화된 최적 전송 할당) 라벨 할당 전략을 활용합니다.
  • 강력한 증강: 고급 데이터 증강 기술을 사용하여 모델 견고성과 일반화를 강화합니다.

성능 지표

YOLOX는 다양한 모델 사이즈로 정확성과 속도 사이의 강력한 균형을 제공합니다.

  • mAP: COCO와 같은 벤치마크 데이터 세트에서 경쟁력 있는 mAP 점수를 달성하며, 종종 이전 YOLO 버전을 능가하는 성능을 발휘합니다.
  • 추론 속도: 실시간 배포에 적합한 빠른 추론 속도를 제공합니다.
  • 모델 크기: 다양한 리소스 제약 조건을 수용할 수 있도록 다양한 모델 크기(Nano, Tiny, s, m, l, x)를 제공합니다.

강점 및 약점

강점:

  • 단순성: 앵커가 없는 디자인으로 모델을 단순화하고 복잡한 튜닝의 필요성을 줄입니다.
  • 고성능: 뛰어난 정확도와 속도를 달성하며, 종종 앵커 기반 YOLO 모델을 능가합니다.
  • 구현의 용이성: 문서화가 잘 되어 있고 구현 및 배포가 비교적 쉽습니다.

약점:

  • 계산 비용: 규모가 큰 YOLOX 모델은 계산 집약적일 수 있으므로 더 많은 리소스가 필요할 수 있습니다.
  • 특정 하드웨어에 대한 최적화: 초경량 모델에 비해 리소스가 매우 제한적인 엣지 디바이스에 배포하려면 최적화가 필요할 수 있습니다.

사용 사례

YOLOX는 다용도로 사용할 수 있으며 다음과 같은 다양한 물체 감지 작업에 적합합니다:

  • 실시간 비디오 감시: 보안 및 모니터링을 위한 비디오 피드를 효율적으로 처리합니다.
  • 자율 주행: 자율주행 차량에 강력하고 빠른 물체 감지 기능을 제공합니다.
  • 엣지 배포: 리소스가 제한된 애플리케이션을 위해 엣지 디바이스에 더 작은 YOLOX 모델을 배포합니다.

욜록스에 대해 자세히 알아보기

모델 비교 표

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4TensorRT10
(ms)
매개변수
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
다모욜로 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
욜록스나노 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
욜록스 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

YOLO 욜록스는 모두 강력한 물체 감지 모델입니다. YOLO 아키텍처 혁신을 통해 정확성과 효율성을 강조하는 반면, YOLOX는 앵커가 없는 설계로 단순성과 고성능에 중점을 둡니다. 정확도 요구 사항, 속도 요구 사항 및 배포 환경과 같은 요소를 고려하여 애플리케이션의 특정 요구 사항에 따라 두 모델 중 하나를 선택해야 합니다.

다른 고성능 객체 탐지 모델에 관심이 있는 사용자는 다음을 고려할 수도 있습니다. Ultralytics YOLOv8, YOLOv10YOLO11. 이러한 모델 및 다른 모델과의 비교는 Ultralytics 모델 비교 문서를 참조하세요.

📅1 년 전 생성됨 ✏️ 1개월 전 업데이트됨

댓글