YOLOv9 vs YOLOv5: 상세 비교
이 페이지에서는 두 가지 중요한 객체 감지 모델인 YOLOv9와 Ultralytics YOLOv5 간의 기술 비교를 제공합니다. 두 모델 모두 실시간 객체 감지에서 속도와 정확도의 균형을 맞추는 것으로 알려진 영향력 있는 YOLO(You Only Look Once) 시리즈의 일부입니다. 이 비교에서는 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 살펴보고 귀사의 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움을 드립니다.
YOLOv9: 새로운 아키텍처를 통한 정확도 향상
YOLOv9는 2024년 2월에 소개되었으며, 객체 감지의 최전선에 중요한 아키텍처 혁신을 가져왔습니다. 이는 고도로 효과적인 모델 훈련에 중요한 문제인 심층 신경망의 정보 손실 문제를 해결하는 것을 목표로 합니다.
작성자: Chien-Yao Wang, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Documentation: https://docs.ultralytics.com/models/yolov9/
아키텍처 및 혁신
YOLOv9은 논문 "YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information"에서 자세히 설명된 두 가지 획기적인 개념을 도입했습니다.
- 프로그래밍 가능한 기울기 정보 (PGI): 이 새로운 접근 방식은 데이터가 심층 네트워크 레이어를 통과할 때 발생하는 정보 병목 현상 문제를 해결하도록 설계되었습니다. PGI는 손실 함수 계산에 완전한 입력 정보를 사용할 수 있도록 하여 보다 정확한 기울기 업데이트와 보다 효과적인 모델 학습을 위해 중요한 데이터를 보존합니다.
- GELAN(Generalized Efficient Layer Aggregation Network): YOLOv9는 또한 우수한 파라미터 활용률과 계산 효율성을 위해 최적화된 새로운 네트워크 아키텍처인 GELAN을 특징으로 합니다. CSPNet 및 ELAN의 원칙을 기반으로 더 적은 파라미터와 계산 비용(FLOP)으로 더 높은 정확도를 달성하는 구조를 만듭니다.
강점
- 향상된 정확도: YOLOv9는 COCO 데이터 세트에서 새로운 최첨단 기술을 확립하여 평균 정밀도(mAP)에서 이전의 많은 실시간 객체 검출기를 능가합니다.
- 향상된 효율성: PGI와 GELAN의 조합은 모델을 매우 정확할 뿐만 아니라 계산적으로도 효율적으로 만들어 성능이 중요한 작업에 강력합니다.
- 정보 보존: PGI는 정보 병목 현상을 직접 해결함으로써 성능 저하 없이 더 깊고 복잡한 네트워크를 훈련할 수 있도록 하여 더욱 강력한 모델을 만듭니다.
약점
- 학습 리소스: YOLOv9 문서에 명시된 바와 같이 YOLOv9 모델을 학습하는 것은 YOLOv5와 같이 이미 잘 알려진 모델에 비해 더 많은 리소스와 시간이 소요될 수 있습니다.
- 더 새로운 생태계: 다른 연구 그룹에서 개발한 더 최신 모델이므로, Ultralytics YOLOv5만큼 생태계, 커뮤니티 지원 및 타사 통합이 성숙하지 않았을 수 있습니다.
- 작업 다양성: 원본 YOLOv9는 주로 객체 탐지에 중점을 둡니다. Ultralytics 모델에서 기본적으로 지원하는 인스턴스 분할, 이미지 분류 및 포즈 추정과 같은 다른 비전 작업에 대한 기본 지원이 부족합니다.
사용 사례
- 고급 비디오 분석 및 고정밀 산업 검사와 같이 가능한 가장 높은 객체 감지 정확도를 요구하는 애플리케이션.
- 교통 관리 AI와 같이 최고 수준의 성능과 균형을 이루어야 하는 시나리오.
- 새로운 아키텍처 탐색이 우선 순위인 고급 컴퓨터 비전의 연구 개발.
Ultralytics YOLOv5: 확립되고 다재다능한 표준
2020년에 출시된 Ultralytics YOLOv5는 속도, 정확성 및 사용 편의성의 뛰어난 균형으로 인해 빠르게 업계 표준이 되었습니다. PyTorch에서 완전히 개발되었으며 지속적으로 개선되었고 강력한 에코시스템에 의해 지원됩니다.
작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentation: https://docs.ultralytics.com/models/yolov5/
아키텍처 및 기능
YOLOv5는 효과적인 특징 통합을 위해 CSPDarknet53 백본과 PANet 넥을 특징으로 하는 입증된 아키텍처를 활용합니다. 앵커 기반 감지 헤드는 매우 효율적입니다. 이 모델은 다양한 크기(n, s, m, l, x)로 제공되므로 개발자는 성능과 리소스 제약 조건 간의 완벽한 균형을 선택할 수 있습니다.
강점
- 탁월한 속도 및 효율성: YOLOv5는 빠른 추론에 매우 최적화되어 있어 강력한 GPU에서 리소스가 제한된 에지 장치에 이르기까지 광범위한 하드웨어에서 실시간 애플리케이션에 이상적입니다.
- 사용 편의성: 간소화된 사용자 경험으로 유명한 YOLOv5는 간단한 Python 및 CLI 인터페이스와 광범위하고 명확한 문서를 제공합니다.
- 잘 관리되는 에코시스템: YOLOv5는 활발한 개발, Discord의 대규모 지원 커뮤니티, 잦은 업데이트, 그리고 노코드 학습 및 배포를 위한 Ultralytics HUB와 같은 강력한 도구를 포함하는 포괄적인 Ultralytics 에코시스템으로부터 이점을 얻습니다.
- 성능 균형: 추론 속도와 감지 정확도 사이에서 강력한 균형을 달성하여 광범위한 실제 배포 시나리오에 적합합니다.
- 다재다능함: 많은 특수 모델과 달리 YOLOv5는 객체 감지, 인스턴스 분할 및 이미지 분류를 포함하여 여러 작업을 즉시 지원합니다.
- 학습 효율성: YOLOv5는 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치를 제공하며, 특히 트랜스포머 기반 모델과 같은 다른 많은 아키텍처에 비해 일반적으로 더 낮은 메모리 요구 사항을 갖습니다.
약점
- 최고 정확도: 당시에는 매우 정확했지만 YOLOv9와 같은 최신 모델은 COCO와 같은 벤치마크에서 더 높은 mAP 점수를 달성할 수 있습니다.
- Anchor-Based 디자인: 이는 사전 정의된 앵커 박스에 의존하며, 최신 앵커 프리 방식에 비해 비정상적인 모양의 객체를 가진 데이터 세트에 대해 더 많은 튜닝이 필요할 수 있습니다.
사용 사례
- 실시간 비디오 감시 및 보안 시스템.
- Raspberry Pi 및 NVIDIA Jetson과 같은 리소스가 제한된 에지 장치에 배포합니다.
- 컴퓨터 비전으로 제조 개선과 같은 산업 자동화 및 품질 관리.
- 사용 편의성과 광범위한 지원 덕분에 신속한 프로토타입 제작 및 개발이 가능합니다.
성능 및 벤치마크: YOLOv9 vs. YOLOv5
YOLOv9와 YOLOv5 간의 성능 비교는 수년간의 모델 아키텍처 발전을 강조합니다. YOLOv9 모델은 YOLOv5 모델보다 일관되게 더 높은 mAP 점수를 달성하며, 종종 더 높은 수준에서 매개변수와 FLOP를 더 효율적으로 사용합니다. 예를 들어 YOLOv9-C는 25.3M 매개변수로 53.0% mAP를 달성하여 86.7M 매개변수로 50.7% mAP를 달성하는 YOLOv5x를 능가합니다.
그러나 YOLOv5는 속도, 특히 CPU와 GPU 모두에서 매우 빠른 추론 시간을 제공하는 YOLOv5n 및 YOLOv5s와 같은 더 작은 변형에서 탁월하여 많은 실시간 에지 애플리케이션에서 타의 추종을 불허합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
결론: 어떤 모델을 선택해야 할까요?
YOLOv9과 YOLOv5 중 선택은 프로젝트의 특정 요구 사항에 크게 좌우됩니다.
-
YOLOv9는 최대 정확도가 주요 목표이고 학습을 위한 충분한 컴퓨팅 리소스가 있는 애플리케이션에 탁월한 선택입니다. 혁신적인 아키텍처는 특수 분야에서 객체 detection 성능의 경계를 넓히는 데 이상적입니다.
-
Ultralytics YOLOv5는 더 넓은 범위의 애플리케이션에 대해 더 실용적이고 다재다능한 옵션으로 남아 있습니다. 주요 장점인 사용 편의성, 속도, 멀티태스크 지원, 그리고 성숙하고 잘 지원되는 생태계는 강력하고 실제적인 솔루션을 빠르고 효율적으로 구축해야 하는 개발자에게 적합한 모델입니다. 엣지 장치에 배포하거나 속도와 정확성 사이의 균형이 필요한 프로젝트의 경우 YOLOv5가 종종 최적의 선택입니다.
중간 수준이거나 더욱 향상된 기능을 원하는 사용자를 위해 Ultralytics는 모든 모델을 제공합니다. YOLOv5의 많은 사용 편의성 이점과 앵커 프리 아키텍처 및 훨씬 더 뛰어난 다재다능함을 결합한 YOLOv8 또는 Ultralytics 생태계 내에서 최첨단 성능을 제공하는 최신 YOLO11을 살펴보십시오. 자세한 비교는 모델 비교 페이지에서 확인할 수 있습니다.