YOLO 욜록스: 자세한 기술 비교
객체 감지 모델은 다양한 컴퓨터 비전 애플리케이션에 필수적이며, 올바른 모델을 선택하는 것은 프로젝트의 특정 요구 사항에 따라 달라집니다. 이 페이지에서는 두 가지 최신 객체 감지 모델인 YOLO YOLOX의 아키텍처, 성능 및 애플리케이션을 분석하여 기술적으로 비교합니다.
DAMO-YOLO
YOLO 알리바바 그룹에서 개발한 빠르고 정확한 객체 감지 모델입니다. NAS 백본과 효율적인 RepGFPN을 비롯한 몇 가지 새로운 기술을 도입하여 객체 감지 작업의 고성능을 목표로 합니다.
아키텍처 및 주요 기능
YOLO 아키텍처에는 몇 가지 혁신적인 구성 요소가 통합되어 있습니다:
- NAS 백본: 최적화된 특징 추출을 위해 신경망 아키텍처 검색(NAS) 백본을 활용합니다.
- RepGFPN: 효율적인 재파라미터화된 그라데이션 특징 피라미드 네트워크(GFPN)를 사용하여 특징 융합을 향상시킵니다.
- 제로헤드: 제로헤드라는 이름의 경량 감지 헤드를 사용하여 계산 오버헤드를 줄입니다.
- AlignedOTA: 교육 중 라벨 할당을 개선하기 위해 정렬된 최적 전송 할당(OTA)을 사용합니다.
성능 지표
YOLO 속도와 정확성 사이의 강력한 균형을 보여주며 다양한 계산 요구 사항에 맞는 다양한 모델 크기를 제공합니다.
- mAP: COCO와 같은 데이터 세트에서 경쟁력 있는 평균 정밀도(mAP)를 달성합니다.
- 추론 속도: 빠른 추론을 위해 설계되어 실시간 애플리케이션에 적합합니다.
- 모델 크기: 다양한 크기(소형, 소형, 중형, 대형)로 제공되며 매개변수 수와 FLOP이 다양합니다.
강점 및 약점
강점:
- 높은 정확도: 강력한 탐지 정확도를 나타내는 우수한 mAP 점수를 달성합니다.
- 효율적인 아키텍처: RepGFPN 및 제로헤드와 같은 혁신적인 구성 요소는 효율성에 기여합니다.
- 실시간 기능: 실시간 시스템에 적합한 빠른 추론 속도를 위해 설계되었습니다.
약점:
- 복잡성: 고급 아키텍처 구성 요소는 사용자 지정 및 구현에 복잡성을 초래할 수 있습니다.
- 제한된 커뮤니티: 기존 모델에 비해 커뮤니티와 리소스가 더 작을 수 있습니다.
사용 사례
YOLO 다음과 같이 높은 정확도와 실시간 성능이 요구되는 애플리케이션에 적합합니다:
- 고급 로봇 공학: 복잡한 로봇 작업을 위한 정밀한 물체 감지 지원.
- 고해상도 감시: 고화질 비디오 스트림을 처리하여 세부적인 물체 인식을 지원합니다.
- 산업 품질 관리: 제조 공정의 미세한 결함을 감지합니다.
YOLOX
Megvii가 개발한 욜록스는 앵커가 없는 YOLO 버전으로, 단순함과 고성능을 강조합니다. 효율적인 설계로 연구와 산업 애플리케이션 간의 격차를 해소하는 것을 목표로 합니다.
아키텍처 및 주요 기능
YOLOX는 앵커가 없는 접근 방식과 간소화된 아키텍처가 돋보입니다:
- 앵커 프리 감지: 앵커 박스의 필요성을 없애고 복잡성과 하이퍼파라미터 튜닝을 줄여 탐지 파이프라인을 간소화합니다.
- 분리된 헤드: 성능과 훈련 효율을 개선하기 위해 분류 헤드와 회귀 헤드를 분리합니다.
- SimOTA 라벨 할당: 보다 효과적인 교육을 위해 SimOTA(단순화된 최적 전송 할당) 라벨 할당 전략을 활용합니다.
- 강력한 증강: 고급 데이터 증강 기술을 사용하여 모델 견고성과 일반화를 강화합니다.
성능 지표
YOLOX는 다양한 모델 사이즈로 정확성과 속도 사이의 강력한 균형을 제공합니다.
- mAP: COCO와 같은 벤치마크 데이터 세트에서 경쟁력 있는 mAP 점수를 달성하며, 종종 이전 YOLO 버전을 능가하는 성능을 발휘합니다.
- 추론 속도: 실시간 배포에 적합한 빠른 추론 속도를 제공합니다.
- 모델 크기: 다양한 리소스 제약 조건을 수용할 수 있도록 다양한 모델 크기(Nano, Tiny, s, m, l, x)를 제공합니다.
강점 및 약점
강점:
- 단순성: 앵커가 없는 디자인으로 모델을 단순화하고 복잡한 튜닝의 필요성을 줄입니다.
- 고성능: 뛰어난 정확도와 속도를 달성하며, 종종 앵커 기반 YOLO 모델을 능가합니다.
- 구현의 용이성: 문서화가 잘 되어 있고 구현 및 배포가 비교적 쉽습니다.
약점:
- 계산 비용: 규모가 큰 YOLOX 모델은 계산 집약적일 수 있으므로 더 많은 리소스가 필요할 수 있습니다.
- 특정 하드웨어에 대한 최적화: 초경량 모델에 비해 리소스가 매우 제한적인 엣지 디바이스에 배포하려면 최적화가 필요할 수 있습니다.
사용 사례
YOLOX는 다용도로 사용할 수 있으며 다음과 같은 다양한 물체 감지 작업에 적합합니다:
- 실시간 비디오 감시: 보안 및 모니터링을 위한 비디오 피드를 효율적으로 처리합니다.
- 자율 주행: 자율주행 차량에 강력하고 빠른 물체 감지 기능을 제공합니다.
- 엣지 배포: 리소스가 제한된 애플리케이션을 위해 엣지 디바이스에 더 작은 YOLOX 모델을 배포합니다.
모델 비교 표
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4TensorRT10 (ms) |
매개변수 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
다모욜로 | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
욜록스나노 | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
욜록스 | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLO 욜록스는 모두 강력한 물체 감지 모델입니다. YOLO 아키텍처 혁신을 통해 정확성과 효율성을 강조하는 반면, YOLOX는 앵커가 없는 설계로 단순성과 고성능에 중점을 둡니다. 정확도 요구 사항, 속도 요구 사항 및 배포 환경과 같은 요소를 고려하여 애플리케이션의 특정 요구 사항에 따라 두 모델 중 하나를 선택해야 합니다.
다른 고성능 객체 탐지 모델에 관심이 있는 사용자는 다음을 고려할 수도 있습니다. Ultralytics YOLOv8, YOLOv10 및 YOLO11. 이러한 모델 및 다른 모델과의 비교는 Ultralytics 모델 비교 문서를 참조하세요.