YOLOv5 vs YOLOv10: 상세 기술 비교
적합한 객체 감지 모델을 선택하는 것은 애플리케이션 성능, 속도 및 리소스 요구 사항에 직접적인 영향을 미치므로 모든 컴퓨터 비전 프로젝트에서 중요한 결정입니다. 이 페이지에서는 확립되고 널리 채택된 업계 표준인 Ultralytics YOLOv5와 실시간 효율성의 경계를 넓히는 최첨단 모델인 YOLOv10이라는 두 가지 랜드마크 모델 간의 심층적인 기술 비교를 제공합니다. 이 분석에서는 정보에 입각한 선택을 할 수 있도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 살펴보겠습니다.
Ultralytics YOLOv5: 확립되고 다재다능한 표준
Ultralytics YOLOv5는 뛰어난 속도, 정확성 및 탁월한 사용 편의성으로 찬사를 받으며 업계 벤치마크가 되었습니다. 출시 이후 다양한 분야에서 수많은 애플리케이션에 적용되었습니다.
기술 세부 사항:
- 작성자: Glenn Jocher
- 조직: Ultralytics
- 날짜: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- 문서: https://docs.ultralytics.com/models/yolov5/
아키텍처 및 주요 기능
PyTorch에서 개발된 YOLOv5는 CSPDarknet53 백본과 강력한 특징 통합을 위한 PANet 넥을 갖춘 유연한 아키텍처를 특징으로 합니다. 앵커 기반 감지 헤드는 매우 효율적입니다. 주요 특징 중 하나는 다양한 컴퓨팅 예산 및 성능 요구 사항을 충족하기 위해 다양한 모델 크기(n, s, m, l, x)를 제공하는 확장성입니다.
강점
- 탁월한 속도와 효율성: YOLOv5는 빠른 추론에 최적화되어 있어 CPU와 GPU 하드웨어 모두에서 실시간 시스템에 널리 사용됩니다.
- 사용 편의성: 간소화된 사용자 경험, 간단한 Python API 및 광범위한 문서로 유명한 YOLOv5는 고급 컴퓨터 비전 솔루션 개발에 대한 진입 장벽을 크게 낮춥니다.
- 잘 관리되는 에코시스템: Ultralytics 모델로서, 크고 활발한 커뮤니티, 잦은 업데이트, 그리고 노코드 학습 및 배포를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻을 수 있습니다.
- 다양성: YOLOv5는 객체 탐지뿐만 아니라 인스턴스 분할 및 이미지 분류도 지원하므로 다양한 비전 작업을 위한 다용도 도구입니다.
- 학습 효율성: 이 모델은 효율적인 학습 프로세스를 제공하며, 즉시 사용 가능한 사전 학습된 가중치를 통해 일반적으로 더 복잡한 아키텍처에 비해 학습에 더 적은 메모리가 필요합니다.
약점
- Anchor-Based Detection: 사전 정의된 앵커 박스에 대한 의존성으로 인해 기존에 없던 객체 모양이나 크기를 가진 데이터 세트에서 최적의 성능을 얻기 위해 추가 튜닝이 필요한 경우가 있으며, 이는 최신 앵커 프리 검출기와 비교됩니다.
- 정확도 vs. 최신 모델: 정확도는 매우 높지만, YOLOv10과 같은 최신 아키텍처는 COCO와 같은 표준 벤치마크에서 mAP를 능가했습니다.
사용 사례
YOLOv5는 다재다능함과 효율성 덕분에 다양한 애플리케이션에서 믿고 사용할 수 있는 핵심 도구입니다.
- Edge Computing: 더 작은 변형은 Raspberry Pi 및 NVIDIA Jetson과 같이 리소스가 제한된 장치에 배포하는 데 적합합니다.
- 산업 자동화: 제조 분야에서 품질 관리 및 공정 자동화에 널리 사용됩니다.
- 보안 및 감시: 보안 시스템 및 공공 안전 애플리케이션에서 실시간 모니터링을 지원합니다.
- 신속한 프로토타이핑: 사용 편의성으로 인해 새로운 아이디어를 신속하게 개발하고 테스트하는 데 이상적입니다.
YOLOv10: 최첨단 실시간 감지기
YOLOv10은 NMS(Non-Maximum Suppression)의 필요성을 제거하여 진정한 엔드 투 엔드 효율적인 파이프라인을 만드는 데 중점을 둔 실시간 객체 감지의 주요 도약입니다.
기술 세부 사항:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- Organization: Tsinghua University
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
아키텍처 및 주요 기능
YOLOv10의 핵심 혁신은 NMS(Non-Maximum Suppression)가 필요 없는 학습 전략으로, 학습 중에 일관된 이중 할당을 사용하여 충돌하는 예측을 해결합니다. arXiv 논문에 자세히 설명된 바와 같이, 이는 기존에 추론 지연 시간을 증가시키는 병목 현상이었던 NMS 후처리 단계를 제거합니다. 또한 YOLOv10은 백본 및 넥과 같은 구성 요소를 최적화하여 계산 중복성을 줄이면서 감지 기능을 향상시키는 전체적인 효율성-정확도 중심 모델 설계를 채택합니다.
성능 분석 및 비교
YOLOv10은 속도와 정확도 간의 균형에 대한 새로운 최첨단 벤치마크를 설정합니다. 아래 표는 YOLOv10 모델이 YOLOv5에 비해 더 적은 파라미터와 FLOPs로 일관되게 더 높은 정확도를 달성함을 보여줍니다. 예를 들어 YOLOv10-M은 YOLOv5-x보다 mAP가 높으면서도 파라미터 수가 거의 6배 적고 FLOPs가 4배 적습니다. 이러한 놀라운 효율성 덕분에 최신 애플리케이션을 위한 강력한 경쟁자가 되었습니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
강점
- 뛰어난 속도 및 효율성: NMS-free 설계는 추론 중에 상당한 속도 향상을 제공하며, 이는 매우 낮은 지연 시간 요구 사항이 있는 애플리케이션에 매우 중요합니다.
- 높은 정확도와 더 적은 파라미터: 더 작은 모델 크기로 최첨단 정확도를 달성하여 리소스가 제한된 환경에 배포하는 데 매우 적합합니다.
- End-to-End 배포: NMS를 제거함으로써 YOLOv10은 배포 파이프라인을 단순화하여 진정한 end-to-end를 실현합니다.
- Ultralytics 생태계 통합: YOLOv10은 Ultralytics 생태계에 완전히 통합되어 다른 Ultralytics 모델과 동일한 사용 편의성, 광범위한 문서 및 지원을 제공합니다.
약점
- 더 새로운 모델: 최근에 릴리스된 모델이므로, 커뮤니티 및 타사 도구 지원은 YOLOv5를 둘러싼 광범위한 생태계에 비해 아직 증가하고 있습니다.
- Task Specialization: YOLOv10은 주로 객체 탐지에 중점을 둡니다. 세분화 및 포즈 추정과 같은 여러 작업에 단일 모델이 필요한 프로젝트의 경우 YOLOv8과 같은 모델이 더 적합할 수 있습니다.
사용 사례
YOLOv10은 모든 밀리초와 모든 파라미터가 중요한 애플리케이션에서 뛰어납니다.
- 고속 로봇 공학: 역동적이고 복잡한 환경에서 작동하는 로봇을 위한 실시간 시각적 처리를 가능하게 합니다.
- 첨단 운전자 보조 시스템(ADAS): 향상된 도로 안전을 위해 빠른 객체 감지를 제공하며, 자율 주행차용 AI의 핵심 구성 요소입니다.
- 실시간 비디오 분석: 즉각적인 통찰력을 위해 높은 프레임 속도의 비디오를 처리하며, 교통 관리와 같은 애플리케이션에 유용합니다.
결론
YOLOv5와 YOLOv10은 모두 뛰어난 모델이지만, 서로 다른 요구 사항을 충족합니다.
Ultralytics YOLOv5는 성숙하고 신뢰할 수 있으며 다재다능한 모델을 필요로 하는 개발자에게 여전히 최고의 선택입니다. 사용 편의성, 광범위한 문서, 그리고 강력한 커뮤니티 지원은 광범위한 애플리케이션에서 신속한 개발 및 배포에 적합합니다. 속도와 정확성의 균형은 수많은 실제 시나리오에서 입증되었습니다.
YOLOv10은 실시간 객체 감지의 미래입니다. 혁신적인 NMS-free 아키텍처는 탁월한 효율성을 제공하여 대기 시간에 민감한 애플리케이션과 에지 장치 배포에 이상적인 솔루션입니다. 최신 모델이지만 Ultralytics 생태계에 통합되어 원활한 사용자 경험을 보장합니다.
다른 최첨단 옵션을 탐색하는 사람들은 YOLO 아키텍처의 강력한 기반을 계속 구축하는 YOLOv8, YOLOv9 및 최신 YOLO11과 같은 다른 모델을 확인하는 것이 좋습니다.