YOLOv5 YOLOv9: 종합적인 기술 비교
실시간 객체 감지의 진화는 정확성과 효율성의 급속한 발전으로 특징지어집니다. 이 여정에서 중요한 두 가지 이정표는 다음과 같습니다. Ultralytics YOLOv5사용성 및 배포에 대한 업계 표준을 설정한 모델과 YOLOv9과 딥 러닝 이론의 경계를 넓히는 연구 중심 아키텍처입니다.
이 기술 비교에서는 아키텍처, 성능 지표, 이상적인 사용 사례를 분석하여 개발자와 연구자가 컴퓨터 비전 프로젝트에 적합한 도구를 선택하는 데 도움을 줍니다.
Ultralytics YOLOv5: 다목적성을 위한 업계 표준
출시 이후 YOLOv5 는 출시 이후 전 세계적으로 가장 인기 있는 비전 AI 모델 중 하나가 되었습니다. Ultralytics 개발한 이 제품은 엔지니어링 우수성, 사용 편의성, 실제 성능을 우선시합니다. 강력한 에코시스템을 통해 원활한 사용자 경험을 제공하면서 속도와 정확성의 균형을 맞추고 있습니다.
기술 세부 사항:
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Docs:https://docs.ultralytics.com/models/yolov5/
아키텍처 및 설계
YOLOv5 효율적인 특징 추출 및 집계를 위해 PANet 넥과 결합된 CSPDarknet 백본을 활용합니다. 앵커 기반 탐지 헤드는 속도에 매우 최적화되어 있어 다양한 하드웨어에 적합합니다. 순수 학술용 모델과 달리, YOLOv5 배포를 염두에 두고 설계되어 다음과 같은 기본 지원을 제공합니다. iOS, Android및 엣지 디바이스에 대한 기본 지원을 제공합니다.
주요 강점
- 잘 관리된 에코시스템: YOLOv5 수년간의 활발한 개발을 통해 광범위한 문서화, 커뮤니티 지원, Ultralytics HUB와 같은 도구와의 통합을 제공합니다.
- 트레이닝 효율성: 트랜스포머 기반 아키텍처에 비해 트레이닝 시간이 빠르고 메모리 요구 사항이 낮아 표준 소비자용 GPU에서 사용할 수 있는 것으로 유명합니다.
- 다목적성: YOLOv5 감지 외에도 인스턴스 분할과 이미지 분류를 기본적으로 지원하므로 개발자는 단일 프레임워크로 여러 비전 작업을 처리할 수 있습니다.
- 배포 준비 완료: 다음 위치로 내보내기 기능이 내장되어 있습니다. ONNX, TensorRT, CoreML 및 TFLite 내보내기 기능이 내장되어 있어 연구부터 프로덕션까지 간소화할 수 있습니다.
YOLOv9: 정확도 극대화를 위한 아키텍처 혁신
2024년 출시, YOLOv9 은 딥 네트워크의 정보 손실 문제를 해결하는 데 중점을 둡니다. 모델을 통해 데이터가 전파되는 방식을 개선하기 위해 새로운 개념을 도입하여 다음과 같은 벤치마크에서 최첨단 결과를 달성합니다. COCO.
기술 세부 사항:
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직:기관: 대만 학술원 정보 과학 연구소
- 날짜: 2024-02-21
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
- Docs:https://docs.ultralytics.com/models/yolov9/
아키텍처 및 혁신
YOLOv9 두 가지 주요 아키텍처 개선 사항이 도입되었습니다:
- 프로그래머블 그라데이션 정보(PGI): 정보 병목 문제를 완화하기 위해 설계된 기술로, 손실 함수 계산에 완전한 입력 정보를 사용할 수 있도록 보장합니다.
- 일반화된 효율적인 계층 집계 네트워크(GELAN): 매개변수 효율성을 최적화하는 경량 네트워크 아키텍처로, 이전 모델보다 적은 수의 매개변수로 더 높은 정확도를 달성할 수 있습니다.
주요 강점
- 높은 정확도: YOLOv9 특히 더 큰 구성YOLOv9에서 물체 감지 정확도에 대한 인상적인 벤치마크를 설정합니다.
- 매개변수 효율성: GELAN 아키텍처는 모델이 매개변수를 효과적으로 사용하도록 보장하여 강력한 정확도 대비 가중치 비율을 제공합니다.
- 이론적 발전: 심층 계층의 정보 보존과 관련된 딥 러닝의 근본적인 문제를 해결합니다.
성능 비교
이 두 모델을 비교할 때, 일반적으로 속도와 절대 정확도 사이의 절충점이 존재합니다. YOLOv9 COCO 데이터 세트에서 더 높은 mAPval 점수를 달성하여 PGI와 GELAN의 효율성을 입증합니다. 하지만 Ultralytics YOLOv5 는 추론 속도, 특히 최적화된 아키텍처가 빛을 발하는 CPU 및 엣지 디바이스에서 여전히 강력한 경쟁자입니다.
성능 균형
정확도 차트에서 YOLOv9 1위를 차지했습니다, YOLOv5 는 강력한 탐지 기능을 유지하면서 표준 하드웨어에서 훨씬 빠른 추론 속도(ms)를 제공하여 실시간 애플리케이션에 더 실용적인 균형을 제공하는 경우가 많습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
교육 및 리소스
개발자에게 훈련 효율성은 추론 속도만큼이나 중요한 요소입니다. Ultralytics YOLOv5 '훈련 후 실행'이라는 단순성으로 유명합니다. 일반적으로 더 복잡한 최신 아키텍처, 특히 트랜스포머 기반 모델( RT-DETR). 이처럼 진입 장벽이 낮기 때문에 사용자는 적당한 하드웨어 설정에서 맞춤형 모델을 훈련할 수 있습니다.
YOLOv9 매개변수에서는 효율적이지만 추론 중에는 제거되지만 훈련 중에는 오버헤드를 추가하는 PGI에 사용되는 보조 분기의 복잡성으로 인해 훈련에 더 많은 리소스를 사용할 수 있습니다.
코드 예제: 통합 인터페이스
Ultralytics 에코시스템의 가장 큰 장점 중 하나는 통합된 Python API입니다. 코드 한 줄로 YOLOv5 YOLOv9 사이를 전환할 수 있으므로 특정 데이터 세트에서 두 가지를 매우 쉽게 벤치마킹할 수 있습니다.
from ultralytics import YOLO
# Load an Ultralytics YOLOv5 model (pre-trained on COCO)
model_v5 = YOLO("yolov5su.pt")
# Train the model on your custom data
results_v5 = model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a YOLOv9 model for comparison
model_v9 = YOLO("yolov9c.pt")
# Train YOLOv9 using the exact same API
results_v9 = model_v9.train(data="coco8.yaml", epochs=100, imgsz=640)
이상적인 사용 사례
프로젝트의 우선순위에 따라 이 모델 중 어떤 모델을 선택할지 결정합니다:
Ultralytics YOLOv5 선택해야 하는 경우
- 엣지 배포: 지연 시간이 밀리초 단위로 중요한 라즈베리 파이, 모바일 앱, 임베디드 시스템에 이상적입니다.
- 신속한 프로토타이핑: 사용 편의성, 광범위한 튜토리얼, 커뮤니티 지원 덕분에 개발 주기를 놀라울 정도로 단축할 수 있습니다.
- 멀티태스크 요구 사항: 프로젝트에 감지와 함께 세분화 또는 분류가 필요한 경우, YOLOv5 통합 솔루션을 제공합니다.
- 리소스 제약: 트레이닝을 위한 GPU 메모리가 제한된 프로젝트는 YOLOv5 효율성을 활용할 수 있습니다.
YOLOv9 선택해야 할 때
- 최대 정확도: 의료 영상이나 고정밀 산업 검사와 같이 감지 누락으로 인해 비용이 많이 드는 애플리케이션에 매우 중요합니다.
- 학술 연구: 최신 그라데이션 정보 흐름 및 네트워크 아키텍처 설계를 탐구하는 연구자에게 적합합니다.
- 강력한 하드웨어: 교육 및 추론에 충분한 컴퓨팅 리소스를 사용할 수 있을 때 가장 잘 활용되어 잠재력을 최대한 활용할 수 있습니다.
결론
두 모델 모두 컴퓨터 비전 분야의 우수성을 대표합니다. Ultralytics YOLOv5 는 속도, 안정성 및 에코시스템 지원의 탁월한 조합을 제공하여 대부분의 개발자에게 실용적인 선택으로 남아 있습니다. 실제 배포를 위해 수많은 테스트를 거친 제품입니다. YOLOv9은 아키텍처 효율성의 미래를 엿볼 수 있는 솔루션으로, 필요한 사람들에게 최고의 정확도를 제공합니다.
최고의 성능과 다양한 기능을 원하는 분들께는 YOLO11는 모든 메트릭에서 최첨단 결과를 제공하기 위해 YOLOv5 YOLOv8 강점을 기반으로 합니다.
다른 모델 살펴보기
더 자세히 알아보고 싶다면, Ultralytics 에코시스템의 관련 모델을 확인해 보세요:
- YOLO11: 뛰어난 성능과 다재다능함을 제공하는 최신 SOTA 모델입니다.
- YOLOv8: 감지, 세분화, 포즈, OBB를 지원하는 강력한 앵커 프리 모델입니다.
- RT-DETR: 높은 정확도를 요구하는 애플리케이션을 위한 실시간 Transformer 기반 detector입니다.