YOLOv10 vs. YOLOX: 기술 비교
최적의 객체 감지 모델을 선택하는 것은 컴퓨터 비전 프로젝트에서 정확도, 속도 및 계산 요구 사항의 균형을 맞추는 데 필수적입니다. 이 페이지에서는 객체 감지 환경에서 두 가지 중요한 모델인 YOLOv10과 YOLOX 간의 자세한 기술 비교를 제공합니다. Ultralytics 생태계 내에서 YOLOv10의 장점을 강조하면서 필요에 가장 적합한 것을 선택하는 데 도움이 되도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석합니다.
YOLOv10: 최첨단 실시간 엔드 투 엔드 감지기
Ultralytics YOLOv10은 칭화대학교 연구진이 개발했으며, 엔드 투 엔드 효율성에 초점을 맞추어 실시간 객체 탐지 분야에서 상당한 발전을 이루었습니다. 2024년 5월에 소개된 이 모델은 후처리 병목 현상을 해결하고 뛰어난 속도와 성능을 위해 아키텍처를 최적화하여 개발자에게 최첨단 선택지를 제공합니다.
기술 세부 사항:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
아키텍처 및 주요 기능
YOLOv10은 향상된 효율성 및 성능을 위해 여러 주요 혁신을 도입했습니다.
- NMS-Free 학습: 핵심 혁신은 추론 중에 Non-Maximum Suppression (NMS)의 필요성을 없애기 위해 일관된 이중 할당을 사용하는 것입니다. 이를 통해 추론 지연 시간이 크게 줄어들고 배포 파이프라인이 간소화되어 진정한 엔드 투 엔드 객체 감지가 가능합니다.
- 전체적인 효율성-정확도 설계: 모델 아키텍처는 계산 중복성을 줄이고 성능을 향상시키기 위해 포괄적으로 최적화되었습니다. 여기에는 경량 분류 헤드와 공간-채널 분리 다운샘플링이 포함되어 계산 비용을 낮추면서 정보를 보다 효과적으로 보존합니다.
- 뛰어난 성능 균형: YOLOv10은 속도와 정확성 사이에서 뛰어난 균형을 달성합니다. 매우 낮은 지연 시간을 유지하면서 높은 mAP 점수를 제공하므로 광범위한 실제 배포 시나리오에 적합합니다.
- Ultralytics 생태계 통합: Ultralytics 생태계의 일부인 YOLOv10은 간소화된 사용자 경험의 이점을 누릴 수 있습니다. 여기에는 간단한 Python API, 광범위한 문서, 즉시 사용 가능한 사전 훈련된 가중치를 사용한 효율적인 학습 프로세스, 그리고 많은 대안에 비해 더 낮은 메모리 요구 사항이 포함됩니다.
강점과 약점
강점:
- 탁월한 속도 및 효율성: 실시간, 낮은 지연 시간 추론에 최적화되어 사용 가능한 가장 빠른 감지기 중 하나입니다.
- NMS-Free 추론: 배포를 간소화하고 사후 처리를 가속화하여 프로덕션 시스템에 중요한 이점을 제공합니다.
- 최첨단 성능: 다양한 모델 스케일(n, s, m, b, l, x)에서 뛰어난 mAP 점수를 달성하며, 종종 더 적은 파라미터로 다른 모델보다 뛰어난 성능을 보입니다.
- 사용 편의성: Ultralytics 프레임워크에 완벽하게 통합되어 훈련에서 배포까지 사용자 친화적인 경험을 제공합니다.
- 학습 효율성: 학습 과정은 매우 효율적이며, 잘 관리된 코드, 사전 학습된 가중치, 활발한 커뮤니티 지원을 통해 지원됩니다.
약점:
- 상대적으로 신규: 더 최신 모델이므로 커뮤니티에서 제공하는 예제 및 타사 통합의 범위는 기존의 더 확립된 모델에 비해 아직 증가하고 있습니다.
사용 사례
YOLOv10은 속도와 정확성이 모두 중요한 까다로운 실시간 애플리케이션에 이상적입니다.
- Edge AI: Raspberry Pi 및 NVIDIA Jetson과 같이 리소스가 제한된 장치에 배포하는 데 적합합니다.
- 실시간 시스템: 자율 주행 차량, 로보틱스, 고속 비디오 분석 및 감시에 매우 적합합니다.
- 고처리량 처리: 산업 검사 및 대규모 데이터 스트림의 빠른 분석을 요구하는 기타 애플리케이션에 이상적입니다.
YOLOX: 고성능 앵커 프리(Anchor-Free) 감지기
YOLOX는 2021년 Megvii에서 개발한 앵커 프리(anchor-free) 객체 감지 모델입니다. YOLO 제품군 내에서 대안적인 접근 방식으로 소개되었으며, 높은 성능을 달성하고 연구와 산업 응용 간의 간극을 해소하는 것을 목표로 합니다.
기술 세부 사항:
- 작성자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
- Organization: Megvii
- 날짜: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- 문서: https://yolox.readthedocs.io/en/latest/
아키텍처 및 주요 기능
YOLOX는 이전 YOLO 모델에 비해 몇 가지 중요한 아키텍처 변경 사항을 구현합니다.
- Anchor-Free Design: 미리 정의된 앵커 박스를 제거함으로써 YOLOX는 검출 파이프라인을 단순화하고 하이퍼파라미터 수를 줄여 일반화 성능을 향상시킬 수 있습니다.
- 분리된 헤드: 분류 및 위치 파악 작업에 대해 별도의 헤드를 사용합니다. 이러한 분리는 일부 이전 모델에서 사용된 결합 헤드에 비해 수렴 속도와 정확도를 향상시킬 수 있습니다.
- 고급 훈련 전략: YOLOX는 동적 레이블 할당을 위한 SimOTA(Simplified Optimal Transport Assignment)와 MixUp과 같은 강력한 데이터 증강 방법과 같은 고급 기술을 통합합니다.
강점과 약점
강점:
- 높은 정확도: 강력한 mAP 점수를 달성하며, 특히 YOLOX-x와 같은 더 큰 모델에서 두드러집니다.
- Anchor-Free 단순성: 앵커 박스 구성 및 튜닝과 관련된 복잡성을 줄입니다.
- 검증된 모델: 2021년부터 사용 가능했기 때문에 견고한 커뮤니티 리소스 및 배포 사례 기반을 보유하고 있습니다.
약점:
- 더 느린 추론 속도: 당시에는 효율적이었지만, 특히 유사한 정확도의 모델을 비교할 때 YOLOv10과 같이 고도로 최적화된 최신 모델보다 느리고 계산 집약적일 수 있습니다.
- External Ecosystem: Ultralytics 생태계에 기본적으로 통합되어 있지 않아 Ultralytics HUB와 같은 도구를 사용한 배포, 학습 및 통합에 더 많은 노력이 필요할 수 있습니다.
- 작업 다양성: YOLOX는 주로 객체 탐지에 중점을 두며, Ultralytics의 최신 모델에서 제공하는 분할 또는 포즈 추정과 같은 다른 비전 작업에 대한 기본 지원이 부족합니다.
사용 사례
YOLOX는 다음과 같은 경우에 적합합니다.
- 일반 객체 감지: 보안 시스템과 같이 정확도와 속도 간의 균형이 잘 맞는 애플리케이션.
- 연구: 새로운 앵커 프리(anchor-free) 감지 방법을 탐색하고 개발하기 위한 강력한 기준 역할을 합니다.
- 산업 애플리케이션: 높은 정확도가 주요 요구 사항인 품질 관리와 같은 작업.
성능 분석: YOLOv10 vs. YOLOX
다음 표는 COCO 데이터 세트에서 벤치마킹된 YOLOv10 및 YOLOX의 다양한 모델 크기에 대한 자세한 성능 지표 비교를 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
데이터에서 YOLOv10이 거의 모든 지표에서 YOLOX를 일관되게 능가한다는 것을 알 수 있습니다.
- 정확도 및 효율성: YOLOv10 모델은 훨씬 적은 파라미터와 FLOP으로 더 높은 mAP 점수를 달성합니다. 예를 들어, YOLOv10-m은 15.4M 파라미터만으로 51.3 mAP에 도달하여 YOLOX-l (54.2M 파라미터로 49.7 mAP)를 능가하고 훨씬 더 효율적이면서도 YOLOX-x (99.1M 파라미터로 51.1 mAP)와 거의 일치합니다.
- 추론 속도: YOLOv10은 뛰어난 속도를 보여줍니다. YOLOv10-x는 NVIDIA T4 GPU에서 YOLOX-x보다 32% 더 빠르면서도 정확도가 더 높습니다. 이러한 효율성 이점은 실시간 애플리케이션에 매우 중요합니다.
- 모델 크기: YOLOv10의 파라미터 효율성은 놀랍습니다. 가장 큰 YOLOv10x 모델은 YOLOX-x 파라미터의 거의 절반을 가지고 있어 메모리 제약이 있는 시스템에 더 쉽게 배포할 수 있습니다.
결론 및 권장 사항
YOLOX는 유능하고 역사적으로 중요한 앵커 프리 검출기이지만, YOLOv10은 새로운 프로젝트, 특히 높은 성능과 효율성이 필요한 프로젝트에 있어 확실한 승자입니다. 혁신적인 NMS-free 설계와 전체적인 아키텍처 최적화는 YOLOX가 따라올 수 없는 최첨단 속도와 정확도의 균형을 제공합니다.
개발자 및 연구자에게 YOLOv10은 다음과 같은 강력한 이점을 제공합니다.
- 뛰어난 성능: 더 빠른 속도와 더 낮은 계산 비용으로 더 나은 정확도를 제공합니다.
- 간소화된 배포: NMS-free 방식은 일반적인 후처리 병목 현상을 제거합니다.
- 견고한 생태계: Ultralytics 생태계와의 통합은 광범위한 문서, 활발한 유지 관리 및 교육에서 생산에 이르기까지 간소화된 워크플로에 대한 액세스를 제공합니다.
다른 최첨단 모델 탐색에 관심 있는 사용자를 위해 Ultralytics는 매우 다재다능한 YOLOv8, 효율적인 YOLOv9 및 최신 YOLO11을 포함한 다양한 옵션을 제공합니다. 특정 요구 사항에 가장 적합한 모델을 선택하는 데 도움이 되도록 YOLOv10 vs. YOLOv8과 같은 추가 비교를 확인할 수 있습니다.