YOLOv9와 YOLOv5: 상세 비교
이 페이지에서는 물체 감지 기능에 초점을 맞춰 YOLO 시리즈의 인기 모델인 YOLOv9와 YOLOv5 기술적 비교를 제공합니다. 두 모델의 아키텍처 차이점, 성능 메트릭, 트레이닝 방법론, 적합한 사용 사례 등을 자세히 살펴보고 컴퓨터 비전 작업에 적합한 모델을 선택하는 데 도움을 드립니다.
YOLOv9: 프로그래밍 가능한 그라데이션 정보
대만 학술원 정보과학연구소의 왕치엔야오와 홍위안 마크 리아오가 2024년 2월에 발표한 YOLOv9는 실시간 객체 감지에 있어 상당한 진전을 이뤘습니다. 이 모델은"YOLOv9: 프로그래밍 가능한 그라데이션 정보를 사용하여 학습하고자 하는 것 학습하기" 논문에 자세히 설명되어 있으며, 코드는 GitHub에서 확인할 수 있습니다.
아키텍처와 혁신: YOLOv9에는 두 가지 주요 혁신이 도입되었습니다: 프로그래밍 가능한 그라데이션 정보(PGI)와 일반화된 효율적인 레이어 집계 네트워크(GELAN)입니다. PGI는 딥 네트워크의 정보 손실을 해결하여 모델이 보다 효과적으로 학습할 수 있도록 하며, GELAN은 네트워크 아키텍처를 최적화하여 매개변수 활용도와 계산 효율성을 개선합니다. 이러한 조합을 통해 계산 비용은 비례적으로 증가하지 않으면서 정확도는 향상됩니다.
성능: YOLOv9은 MS COCO 데이터 세트에서 최첨단 성능을 달성하여 이전 YOLO 버전 및 기타 실시간 물체 감지기에 비해 뛰어난 정확도와 효율성을 보여줍니다. 예를 들어, YOLOv9c는 25.3M 파라미터로 53.0 mAPval50-95를 달성합니다.
사용 사례: YOLOv9은 다음과 같이 높은 정확도와 효율성이 요구되는 애플리케이션에 이상적입니다:
- 고정밀 물체 감지: 자율 주행, 고급 감시, 로봇 비전과 같이 정확성이 가장 중요한 시나리오에 적합합니다.
- 리소스가 제한된 환경: 교육에는 YOLOv5 더 많은 리소스가 필요하지만, 효율적인 아키텍처를 통해 추론 속도가 최적화된 엣지 디바이스에 배포할 수 있습니다.
강점:
- 높은 정확도: 특히 YOLOv9e와 같은 모델에서 우수한 맵 점수를 달성합니다.
- 효율적인 설계: GELAN과 PGI는 비슷한 정확도를 가진 이전 모델에 비해 파라미터 및 계산 효율성이 향상되었습니다.
약점:
- 더 높은 훈련 리소스 수요: YOLOv9 모델을 훈련하려면 YOLOv5 비해 더 많은 계산 리소스와 시간이 필요합니다.
- 비교적 새로운 모델: 새로운 모델이기 때문에 커뮤니티와 문서가 더 확립된 YOLOv5 비해 아직 발전 중입니다.
YOLOv5: 다양성과 속도
Glenn Jocher가 작성하고 2020년 6월에 출시된 Ultralytics YOLOv5 속도, 사용 편의성 및 다용도로 유명합니다. 구체적인 arXiv 논문은 없지만, 자세한 정보는 Ultralytics YOLOv5 설명서 및 GitHub 리포지토리에서 확인할 수 있습니다.
아키텍처 및 기능: YOLOv5 속도와 접근성에 중점을 두고 구축되었으며, CSP Bottleneck 및 PANet과 같은 아키텍처를 활용합니다. 다양한 컴퓨팅 예산과 성능 요구 사항을 충족할 수 있도록 다양한 모델 크기(YOLOv5n, s, m, l, x)를 제공합니다. YOLOv5 PyTorch 구현되어 사용자 친화적이고 적응성이 뛰어납니다.
성능: YOLOv5 속도와 정확도 사이의 균형을 제공하여 다양한 실제 애플리케이션에 적합합니다. 소형 버전인 YOLOv5s는 빠른 추론 속도와 함께 37.4mAPval50-95를 달성합니다.
사용 사례: YOLOv5 매우 다재다능하며 속도와 배포의 용이성이 중요한 시나리오에 적합합니다:
- 실시간 애플리케이션: 실시간 비디오 처리, 로봇 공학, 드론 비전 등 빠른 추론이 필요한 애플리케이션에 이상적입니다.
- 엣지 배포: 더 작은 모델(YOLOv5n, YOLOv5s)은 컴퓨팅 요구 사항이 낮기 때문에 엣지 디바이스 및 모바일 플랫폼에 배포하는 데 적합합니다.
- 신속한 프로토타이핑 및 개발: 사용 편의성과 방대한 문서로 인해 YOLOv5 빠른 개발 주기와 교육 목적에 탁월합니다.
강점:
- 빠른 속도: 빠른 추론 속도: 특히 작은 모델 변형에서 빠른 추론 속도를 제공합니다.
- 사용 편의성: 대규모의 활발한 커뮤니티와 함께 잘 문서화되어 있어 사용과 구현이 쉽습니다.
- 다용도성: 다양한 크기로 제공되며 탐지, 세분화, 분류 등 다양한 작업에 적용할 수 있습니다.
약점:
- YOLOv9에 비해 낮은 정확도: 일반적으로 YOLOv5 모델은 특히 까다로운 시나리오에서 최신 YOLOv9와 같은 수준의 정확도를 달성하지 못합니다.
- YOLOv9보다 덜 혁신적인 아키텍처: 효과적이기는 하지만, YOLOv9에서 볼 수 있는 새로운 PGI 및 GELAN 혁신이 아키텍처에 통합되어 있지는 않습니다.
모델 | 크기(픽셀) | mAPval50-95 | 속도CPU ONNX(ms) | SpeedT4텐서RT10(ms) | params(M) | FLOPs(B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
결론
프로젝트의 우선순위에 따라 YOLOv9과 YOLOv5 중 어떤 것을 선택할지 결정하세요. 정확성이 가장 중요하고 교육을 위한 리소스를 사용할 수 있는 경우 YOLOv9이 더 나은 선택입니다. 속도, 사용 편의성, 배포 유연성을 우선시하는 애플리케이션, 특히 엣지 디바이스의 경우 YOLOv5 여전히 우수하고 널리 채택되는 옵션입니다.
다른 모델을 살펴보고 싶은 사용자를 위해 Ultralytics 각각 고유한 강점과 최적화를 갖춘 YOLOv8, YOLOv7, YOLOv6 및 새로 출시된 YOLO11 제공합니다. 전체 옵션에 대해 알아보려면 Ultralytics 모델 설명서를 참조하세요.