모델 비교: 객체 탐지를 위한 YOLOv5 vs YOLOv6-3.0
최적의 객체 감지 모델을 선택하는 것은 성공적인 컴퓨터 비전 애플리케이션에 매우 중요합니다. Ultralytics YOLOv5와 Meituan YOLOv6-3.0은 모두 효율성과 정확성으로 잘 알려진 널리 사용되는 선택입니다. 이 페이지에서는 프로젝트 요구 사항에 가장 적합한 모델을 결정하는 데 도움이 되는 기술 비교를 제공합니다. Ultralytics 생태계의 강점을 강조하면서 아키텍처의 뉘앙스, 성능 벤치마크, 교육 접근 방식 및 적합한 애플리케이션을 자세히 살펴보겠습니다.
Ultralytics YOLOv5: 확고한 산업 표준
저자: Glenn Jocher
소속: Ultralytics
날짜: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
문서: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5 는 속도, 사용 편의성, 적응성으로 잘 알려진 단일 단계 객체 감지 모델입니다. Ultralytics 개발한 이 모델은 고성능 객체 감지에 대한 접근성을 높이는 중요한 단계입니다. 완전히 내장된 PyTorch로 구축된 YOLOv5 효율적인 특징 추출과 융합을 위해 CSPDarknet53 백본과 PANet 넥을 갖추고 있습니다. 이 아키텍처는 고도로 모듈화되어 있어 다양한 성능 요구 사항을 충족하기 위해 다양한 모델 크기(n, s, m, l, x)로 쉽게 확장할 수 있습니다.
YOLOv5의 강점
- 속도 및 효율성: YOLOv5는 추론 속도가 뛰어나 실시간 애플리케이션 및 리소스가 제한된 에지 장치에 배포하는 데 이상적입니다. 성능 표에서 볼 수 있듯이 YOLOv5n 모델은 더 작은 모델 중에서 가장 빠른 CPU 및 GPU 추론 시간을 제공합니다.
- 사용 편의성: 단순성으로 알려진 YOLOv5는 간단한 API, 광범위한 설명서 및 수많은 튜토리얼을 통해 간소화된 사용자 경험을 제공합니다.
- 잘 관리되는 에코시스템: 활발한 개발, Discord를 통한 강력한 커뮤니티 지원, 잦은 업데이트, MLOps를 위한 Ultralytics HUB와의 원활한 통합을 포함한 통합된 Ultralytics 에코시스템의 이점을 누릴 수 있습니다.
- 다양성: 객체 탐지, 인스턴스 분할 및 이미지 분류를 포함한 여러 작업을 지원하여 단일 작업 모델보다 포괄적인 솔루션을 제공합니다.
- 학습 효율성: 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치, 그리고 특히 트랜스포머 기반 모델을 포함한 다른 많은 아키텍처에 비해 더 낮은 메모리 요구 사항을 제공합니다.
YOLOv5의 약점
- 정확도: 매우 정확하고 효율적이지만 YOLOv6-3.0 또는 Ultralytics YOLOv8과 같은 최신 모델은 특정 벤치마크, 특히 더 큰 모델 변형에서 약간 더 높은 mAP를 제공할 수 있습니다.
- Anchor-Based Detection: 앵커 박스에 의존하며, 최신 앵커 프리 검출기와 비교했을 때 다양한 데이터 세트에서 최적의 성능을 위해 튜닝이 필요할 수 있습니다.
Meituan YOLOv6-3.0: 산업 경쟁자
저자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
소속: Meituan
날짜: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
문서: https://docs.ultralytics.com/models/yolov6/
Meituan에서 개발한 YOLOv6-3.0은 주로 산업 응용 분야를 위해 설계된 객체 감지 프레임워크입니다. 2023년 초에 출시되었으며 실제 배포 시나리오에 적합한 속도와 정확성 간의 균형을 제공하는 것을 목표로 했습니다. YOLOv6은 효율적인 백본 및 넥 설계와 같은 아키텍처 수정 사항을 도입했습니다. 버전 3.0은 이러한 요소를 더욱 개선하고 훈련 중 자체 증류와 같은 기술을 통합하여 성능을 향상시켰습니다. 또한 모바일 배포에 최적화된 특정 모델(YOLOv6Lite)도 제공합니다.
YOLOv6-3.0의 강점
- 뛰어난 속도-정확도 균형: 특히 GPU에서 mAP 최대화가 목표인 산업 객체 감지 작업에 대해 경쟁력 있는 성능을 제공합니다.
- 양자화 지원: 리소스가 제한된 하드웨어에 배포하는 데 유용한 모델 양자화를 위한 도구 및 튜토리얼을 제공합니다.
- 모바일 최적화: 모바일 또는 CPU 기반 추론을 위해 특별히 설계된 YOLOv6Lite 변형을 포함합니다.
YOLOv6-3.0의 단점
- 제한적인 작업 다양성: 주로 객체 감지에 중점을 두어 YOLOv5 및 YOLOv8과 같은 Ultralytics 모델에서 볼 수 있는 분할, 분류 또는 포즈 추정에 대한 기본 지원이 부족합니다.
- 생태계 및 유지 관리: 오픈 소스이긴 하지만, 해당 생태계는 Ultralytics 플랫폼만큼 포괄적이거나 활발하게 유지 관리되지 않으므로 업데이트가 느려지고 커뮤니티 지원이 줄어들 수 있습니다.
- 높은 리소스 사용량: 더 큰 YOLOv6 모델은 유사한 mAP에 대해 YOLOv5 모델보다 훨씬 더 많은 파라미터와 FLOPs를 가질 수 있으므로 더 많은 계산 리소스가 필요할 수 있습니다.
정면 성능 비교
아래 표는 COCO 데이터 세트에서 YOLOv5와 YOLOv6-3.0 모델 간의 성능 지표를 직접 비교하여 제공합니다. Ultralytics YOLOv5는 더 작은 모델에서 CPU와 GPU 모두에서 뛰어난 속도를 보여주어 실시간 에지 애플리케이션에 탁월한 선택입니다. 더 큰 YOLOv6-3.0 모델은 더 높은 피크 mAP를 달성할 수 있지만 YOLOv5는 특히 더 낮은 파라미터 및 FLOP 수를 고려할 때 전반적으로 더 균형 잡히고 효율적인 성능을 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
학습 방법론
두 모델 모두 COCO와 같은 대규모 데이터 세트에서 학습하기 위해 표준 딥러닝 기술을 활용합니다. 그러나 Ultralytics YOLOv5는 간소화된 학습 워크플로, 광범위한 가이드, AutoAnchor 최적화, Weights & Biases 및 ClearML과 같은 도구와의 통합을 제공하는 Ultralytics 생태계의 큰 이점을 누릴 수 있습니다. 이러한 통합 접근 방식은 개발 주기를 단순화하고 배포 시간을 단축합니다. YOLOv6-3.0 학습은 공식 리포지토리에 설명된 절차를 따릅니다.
이상적인 사용 사례
- Ultralytics YOLOv5: 특히 CPU 또는 엣지 장치에서 실시간 성능과 쉬운 배포를 요구하는 애플리케이션에 적극 권장됩니다. 다재다능함, 광범위한 지원, 그리고 효율적인 리소스 사용은 빠른 프로토타입 제작, 모바일 애플리케이션, 비디오 감시(도난 방지를 위한 컴퓨터 비전), 그리고 성숙하고 잘 문서화된 생태계의 이점을 누리는 프로젝트에 이상적입니다.
- Meituan YOLOv6-3.0: 빠른 추론이 여전히 필요한 상황에서 GPU에서 정확도를 최대화하는 것이 주요 목표일 때 강력한 경쟁자입니다. YOLOv5에 비해 약간의 mAP 개선이 잠재적으로 증가된 복잡성 또는 더 적은 생태계 지원을 정당화하는 산업 애플리케이션에 적합합니다.
결론
Ultralytics YOLOv5는 특히 빠른 속도, 사용 편의성 및 강력한 생태계로 인해 여전히 뛰어난 선택입니다. 광범위한 문서와 커뮤니티 지원을 통해 성능과 효율성의 균형을 제공하므로 개발자와 연구원이 쉽게 접근할 수 있습니다.
YOLOv6-3.0은 특히 GPU에서 더 큰 모델의 피크 mAP 측면에서 경쟁력 있는 성능을 제공합니다. 특수 산업 작업용 YOLO 프레임워크 내에서 가능한 가장 높은 정확도를 우선시하는 사용자에게 실행 가능한 대안으로 사용됩니다.
최신 기술 발전을 원하는 사용자는 성능, 다재다능성 및 효율성이 더욱 향상된 YOLOv8, YOLOv9, YOLOv10 및 YOLO11과 같은 최신 Ultralytics 모델을 살펴보십시오. RT-DETR과 같은 특수 모델도 특정 사용 사례에 대한 고유한 이점을 제공합니다.
Ultralytics 모델 문서에서 전체 옵션 범위를 살펴보세요.