기술 비교: 물체 감지를 위한 YOLOX와 YOLOv6-3.0 비교
컴퓨터 비전 프로젝트에서 올바른 객체 감지 모델을 선택하는 것은 매우 중요합니다. 이 페이지에서는 인기 있고 효율적인 두 가지 모델 간의 기술 비교를 제공합니다: YOLOX와 YOLOv6-3.0입니다. 두 모델의 아키텍처 차이점, 성능 벤치마크, 적합한 애플리케이션을 살펴보고 정보에 입각한 결정을 내릴 수 있도록 도와드립니다.
자세한 내용을 살펴보기 전에 두 모델의 성능 개요를 다른 모델과 함께 시각화해 보겠습니다:
욜록스: 앵커 없는 우수성
Megvii(Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun - 2021-07-18)가 출시한 YOLO 앵커가 없는 디자인으로 기존 YOLO 모델과 관련된 복잡성을 단순화한 것이 특징입니다. 효율적이고 정확한 물체 감지 기능으로 연구와 산업 애플리케이션 간의 격차를 해소하는 것을 목표로 합니다.
아키텍처 및 주요 기능
YOLOX는 앵커 박스를 제거하여 교육 과정을 간소화하고 하이퍼파라미터의 수를 줄이는 간소화된 접근 방식을 채택합니다. 주요 아키텍처 혁신은 다음과 같습니다:
- 앵커 프리 감지: 사전 정의된 앵커가 필요하지 않아 디자인 복잡성을 줄이고 일반화를 개선하여 다양한 물체 크기와 종횡비에 맞게 조정할 수 있습니다.
- 분리된 헤드: 분류 작업과 로컬라이제이션 작업을 별개의 분기로 분리하여 특히 정확도 면에서 성능이 향상됩니다.
- SimOTA 라벨 할당: 예측 결과에 따라 대상을 동적으로 할당하는 고급 SimOTA 라벨 할당 전략을 활용하여 훈련 효율성과 정확도를 높입니다.
- 혼합 정밀도 훈련: 혼합 정밀도를 활용하여 훈련과 추론을 모두 가속화하여 계산 효율성을 최적화합니다.
성능 지표
YOLOX 모델은 실시간 객체 검출기 중 최고 수준의 정확도를 달성하면서도 경쟁력 있는 추론 속도를 유지합니다. 자세한 지표는 아래 비교 표를 참조하세요.
사용 사례
- 높은 정확도가 요구되는 애플리케이션: 의료 이미지 분석이나 위성 이미지 분석처럼 중요한 물체를 놓치면 심각한 결과를 초래할 수 있는 정밀도가 가장 중요한 시나리오에 이상적입니다.
- 연구 및 개발: 명확하고 간결한 구조로 인해 YOLOX는 연구 목적과 물체 감지 방법론의 추가 개발에 적합합니다.
- 다양한 물체 감지 작업: 견고한 설계와 높은 정확도를 바탕으로 학술 연구부터 산업 배포에 이르기까지 광범위한 물체 감지 작업에 적용할 수 있습니다.
강점 및 약점
강점:
- 높은 정확도: 뛰어난 맵 점수를 달성하여 정밀한 물체 감지가 필요한 애플리케이션에 적합합니다.
- 앵커 프리 설계: 아키텍처를 단순화하고, 하이퍼파라미터를 줄이며, 구현을 용이하게 합니다.
- 다목적성: 다양한 물체 감지 작업에 적용할 수 있습니다.
약점:
- 추론 속도: 특히 엣지 디바이스에서는 YOLOv6-3.0과 같이 고도로 최적화된 모델보다 약간 느릴 수 있습니다.
- 모델 크기: 일부 대형 이형 상품의 경우 모델 크기가 상당히 클 수 있으므로 리소스가 제한된 배포에서는 문제가 될 수 있습니다.
YOLOv6-3.0: 속도 및 효율성 최적화
Meituan(추이 리, 룰루 리, 이페이 겅, 홍량 장, 멩 청, 보 장, 자이단 케, 샤오밍 쉬, 샹샹 추 - 2023-01-13)이 개발한 YOLOv6-3.0은 특히 산업 애플리케이션과 엣지 배포를 대상으로 고속 추론과 효율성을 위해 설계된 것입니다. 버전 3.0은 속도와 정확성 향상에 중점을 둔 대대적인 업그레이드입니다.
아키텍처 및 주요 기능
YOLOv6-3.0은 아키텍처 최적화를 통해 정확도를 크게 저하시키지 않으면서도 추론 속도를 우선시합니다. 주요 기능은 다음과 같습니다:
- 효율적인 재매개변수화 백본: 재매개화된 백본을 사용하여 컨볼루션 및 일괄 정규화 레이어를 병합하여 추론 속도를 가속화합니다.
- 하이브리드 블록: 정확성과 효율성의 균형을 맞추는 하이브리드 네트워크 블록 설계를 활용하여 다양한 하드웨어 플랫폼에서 성능을 최적화합니다.
- 하드웨어 인식 신경망 설계: 하드웨어 효율성을 염두에 두고 설계되었기 때문에 특히 라즈베리 파이나 NVIDIA Jetson과 같이 리소스가 제한된 디바이스에 배포하는 데 적합합니다.
- 최적화된 훈련 전략: 융합과 전반적인 성과를 개선하기 위해 정교한 훈련 기법을 통합합니다.
성능 지표
YOLOv6-3.0은 추론 속도가 뛰어나며, 경쟁력 있는 맵 점수를 유지하면서 놀라운 FPS(초당 프레임 수)를 달성합니다. 자세한 성능 지표는 아래 표를 참조하세요.
사용 사례
- 실시간 물체 감지: 보안 경보 시스템, 스마트 리테일, 자율 주행 차량 등 짧은 지연 시간과 빠른 처리가 중요한 애플리케이션에 이상적입니다.
- 엣지 디바이스 배포: 효율적인 설계와 작은 모델 크기로 인해 컴퓨팅 리소스가 제한된 엣지 디바이스에 배포하는 데 최적화되어 있습니다.
- 산업용 애플리케이션: 제조, 감시 및 자동화 분야에서 빠르고 효율적인 물체 감지가 필요한 실제 산업 애플리케이션에 맞게 설계되었습니다.
강점 및 약점
강점:
- 빠른 추론 속도: 속도가 뛰어나 실시간 물체 감지 작업에 이상적입니다.
- 효율적인 설계: 더 작은 모델 크기와 최적화된 아키텍처는 리소스가 제한된 디바이스에 적합합니다.
- 산업용 포커스: 빠르고 효율적인 물체 감지가 필요한 산업 분야의 실용적인 애플리케이션을 위해 특별히 설계되었습니다.
약점:
- 정확도 트레이드오프: 특히 속도보다 정확도가 우선시되는 복잡한 데이터 세트에서는 YOLOX와 같은 모델에 비해 약간 낮은 정확도를 보일 수 있습니다.
- 유연성: 광범위한 연구 애플리케이션을 위해 설계된 보다 유연한 아키텍처에 비해 고도로 전문화된 연구 작업에 대한 적응력이 떨어질 수 있습니다.
모델 비교 표
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4TensorRT10 (ms) |
매개변수 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
욜록스나노 | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
욜록스 | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
결론
YOLOX와 YOLOv6-3.0은 모두 강력한 1단계 물체 감지기로, 각각 다른 우선순위를 충족합니다. YOLOX는 정확도와 아키텍처 단순성이 뛰어나 높은 정밀도가 요구되는 연구 및 애플리케이션에 적합한 선택입니다. YOLOv6-3.0은 속도와 효율성을 우선시하므로 실시간 산업 애플리케이션 및 엣지 배포에 매우 적합합니다.
다른 옵션을 원하는 사용자를 위해 Ultralytics 다양한 최첨단 모델을 제공합니다. 다음을 살펴보세요. Ultralytics YOLOv8 성능과 유연성 간의 균형을 위해, 실시간 탐지의 최신 버전인 YOLOv10 또는 YOLO11 을 사용해 보세요. 또는 실시간 애플리케이션의 경우, RT-DETR 은 매력적인 아키텍처를 제공합니다.