YOLOv5 YOLOv9: 실시간 객체 탐지의 진화
실시간 객체 탐지 기술은 지난 몇 년간 극적으로 발전해 왔습니다. YOLOv5 가 2020년 사용성과 산업적 채택의 기준을 세웠다면, YOLOv9 는 2024년 정확도와 효율성의 한계를 뛰어넘기 위해 새로운 아키텍처 개념을 도입했습니다. 본 가이드는 개발자가 컴퓨터 비전 프로젝트에 적합한 도구를 선택할 수 있도록 상세한 기술적 비교를 제공합니다.
모델의 기원 및 기술 사양
이러한 모델의 기원을 이해하는 것은 그들의 설계 철학과 의도된 사용 사례를 맥락화하는 데 도움이 됩니다.
YOLOv5: 산업 표준
글렌 조커와 Ultralytics에 의해 출시YOLO YOLOv5 사용 편의성, 내보내기 용이성 및 속도를 YOLOv5 . 이는 PyTorch에 네이티브로 구현된 최초의 YOLO 모델이 되어 방대한 Python 커뮤니티가 접근할 수 있게 되었습니다.
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜:26
- 리포지토리:GitHub
- 주요 초점: 사용성, 강력한 출력 경로(ONNX, CoreML, TFLite), 그리고 빠른 훈련.
YOLOv9: 아키텍처 혁신
2024년 2월 국립중앙연구원(Academia Sinica)의 왕첸야오(Chien-Yao Wang)와 리아오홍위안(Hong-Yuan Mark Liao)이 발표한 YOLOv9 딥러닝 네트워크의 '정보 병목 현상' 해결에 YOLOv9
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직: 정보 과학 연구소, 아카데미아 시니카
- 날짜:21
- 리포지토리:GitHub
- 논문:arXiv:2402.13616
- 초점: 프로그래머블 그라디언트 정보(PGI)를 활용한 매개변수 효율성과 심층 감독 학습.
아키텍처의 차이점
핵심적인 차이는 이러한 모델들이 특징 추출과 기울기 흐름을 처리하는 방식에 있다.
YOLOv5 CSPNet(Cross Stage Partial Network) 백본을 활용합니다. 이 설계는 정확도를 유지하면서 계산을 줄이기 위해 기울기 흐름을 분할하는데, 이는 임베디드 시스템에 적합한 컴팩트한 모델을 만드는 데 혁명적이었습니다. 앵커 기반 탐지 헤드는 범용 작업에 매우 최적화되어 있어 많은 기존 애플리케이션에서 경쟁력을 유지하는 균형을 제공합니다.
YOLOv9 두 가지 핵심 혁신을 도입합니다: GELAN (일반화된 효율적 레이어 집계 네트워크)과 PGI (프로그래머블 기울기 정보). GELAN은 매개변수 활용도를 최적화하여 모델을 더 가볍게 하면서도 더 복잡한 특징을 학습할 수 있게 합니다. PGI는 보조 감독 분기를 제공함으로써 데이터가 깊은 레이어를 통과할 때 발생하는 정보 손실을 해결하여, 매우 깊은 아키텍처에서도 신뢰할 수 있는 기울기 생성을 보장합니다.
알고 계셨나요?
YOLOv9 아키텍처 측면에서 참신함을 YOLOv9 , Ultralytics YOLOv5 의 생태계는 배포 측면에서 여전히 따라올 자가 없습니다. TensorRT Edge TPU 같은 형식으로의 내장된 내보내기 기능을 지원하여 훈련에서 생산 환경으로의 전환 과정을 단순화합니다.
성능 분석
메트릭을 비교할 때, YOLOv9 주어진 매개변수 수에서 더 높은mAPval을 달성하며, 특히 더 큰 모델 변종에서 두드러집니다. 그러나 YOLOv5 더 단순한 아키텍처 덕분에 CPU 및 구형 하드웨어에서의 추론 속도 측면에서 YOLOv5 매우 경쟁력 YOLOv5 .
벤치마크 지표
아래 표는 장단점을 보여줍니다. YOLOv9c는 53.0 mAP 달성하여 YOLOv5x (50.7%)를 능가하는 동시에 훨씬 적은 매개변수(25.3M vs 97.2M)를 사용합니다. 이는 GELAN 아키텍처의 효율성을 입증합니다. 반면, 소형 YOLOv5 (Nano 및 Small)은 극히 낮은 지연 시간을 제공하여 초저전력 장치에 적합합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 1.9 | 4.5 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 7.2 | 16.5 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 21.2 | 49.0 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 46.5 | 109.1 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 86.7 | 205.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
참고: 표는 표준 COCO 지표를 반영합니다. 굵은 글씨 값은 해당 특정 범주에서 최고의 성능을 나타냅니다.
사용 편의성 및 에코시스템
개발자에게 이 구분이 가장 실질적으로 적용되는 지점이 바로 여기입니다.
Ultralytics (YOLOv5)
YOLOv5 개발자 경험을 위해 YOLOv5 . Ultralytics 원활한 워크플로를 제공합니다:
- 간편한 API: 몇 줄의 Python 코드로 모델을 로드하고 훈련하세요.
- 통합 도구: Comet ClearML 같은 실험 추적 도구와의 자동 통합.
- 배포: 원클릭으로 ONNX, CoreML, TFLite 및 OpenVINO 원클릭 내보내기.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model
model = YOLO("yolov5su.pt")
# Train on custom data
model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
model.export(format="onnx")
YOLOv9
원본 YOLOv9 매우 정확하지만 연구 중심입니다. 그러나 이제 Ultralytics YOLOv9 완전히YOLOv9 이 최신 아키텍처에도 동일한 사용 편의성을 제공합니다. 즉, 최신 아키텍처 개선 사항을 활용하기 위해 사용성을 희생할 필요가 없으며, 모델 이름 문자열만 변경하면 됩니다.
교육 효율성 및 메모리
Ultralytics ( YOLOv5 통합된 YOLOv9 포함)의 핵심 장점은 메모리 효율성이다.
- GPU : Ultralytics 루프는 CUDA 사용량을 최소화하도록 최적화되어 있습니다. 이를 통해 사용자는 메모리 소모가 많은 트랜스포머 기반 모델에 비해 일반 소비자용 하드웨어(예: NVIDIA 3060/4090)에서도 더 큰 배치 크기로 훈련할 수 있습니다.
- 수렴성: YOLOv5 최소한의 하이퍼파라미터 튜닝만으로도 즉시 학습이 가능한 '박스에서 꺼내자마자 학습' 기능으로 YOLOv5 . PGI 보조 분기를 갖춘 YOLOv9 역시 아키텍처가 더 복잡함에도 불구하고 안정적인 수렴성을 보여줍니다.
실제 응용 분야
적합한 모델 선택은 배포 제약 조건에 따라 달라집니다.
YOLOv5 이상적인 사용 사례
- 레거시 하드웨어에서의 엣지 AI: 구형 라즈베리 파이 모델이나 모바일 기기에 배포할 때, 추론 지연 시간이 1밀리초 단위로 중요한 상황에서는 YOLOv5n(나노)가 타의 추종을 불허합니다.
- 신속한 프로토타이핑: 해커톤이나 스타트업이 몇 시간 내에 개념 증명(PoC)이 필요한 경우, YOLOv5 방대한 문서와 커뮤니티 튜토리얼이 개발 속도를 YOLOv5 .
- 모바일 앱: 네이티브 지원 기능 iOS CoreML 과 Android TFLite 대한 네이티브 지원으로 모바일 개발자에게 필수적인TFLite .
YOLOv9의 이상적인 사용 사례
- 고정밀 검사: 미세한 결함 탐지가 중요한 제조 품질 관리 분야에서 GELAN의 우수한 특징 추출 능력은 YOLOv9 만듭니다.
- 의료 영상: 종양 검출과 같이 순수 속도보다 정확도가 최우선인 작업에서 YOLOv9e는 필요한 mAP 제공합니다.
- 복잡한 장면: 높은 가림 현상이나 복잡한 환경은 프로그래머블 그라디언트의 혜택을 받으며, 이는 모델이 깊은 레이어를 통해 핵심 정보를 유지하도록 돕습니다.
미래: YOLO26과의 만남
YOLOv5 믿음직한 주력 YOLOv5 YOLOv9 높은 정확도를 YOLOv9 , 이 분야는 다시 진화했습니다. 2026년부터 시작되는 신규 프로젝트에는 Ultralytics 성능과 효율성의 정점을 보여줍니다.
왜 YOLO26으로 업그레이드해야 할까요?
- 네이티브 엔드투엔드: YOLOv5 v9과 달리 NMS 필요하지 않은 YOLO26은 NMS 없어 배포 파이프라인을 단순화합니다.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받아, 더 빠르고 안정적인 훈련을 보장합니다.
- 다용도성: 기본적으로 검출, 분할, 자세 추정, OBB 추적, 분류를 지원합니다.
현재 YOLOv5 사용하는 사용자의 경우, YOLO26으로 마이그레이션하면 상당한 속도 향상( CPU 최대 43% 가속화)과 ProgLoss + STAL을 통한 소형 객체 탐지 성능 개선을 얻을 수 있습니다. 따라서 에지 및 클라우드 배포 모두에 권장되는 향후 방향입니다.
결론
두 아키텍처 모두 각자의 장점이 있습니다. YOLOv5 는 단순성과 광범위한 장치 호환성 면에서 여전히 최고이며, "그냥 작동하는" 솔루션이 필요한 개발자에게 적합합니다. YOLOv9 프로그래밍 가능한 그라디언트를 통해 효율적인 딥 러닝의 미래를 엿볼 수 있으며, 최첨단 정확도를 제공합니다.
그러나 Ultralytics 활용하면 특정 솔루션에 묶이지 않습니다. 동일한 API로 YOLOv5, YOLOv9, 그리고 최첨단 YOLO26을 훈련시킬 수 있어, 자체 데이터로 벤치마킹을 수행하고 특정 애플리케이션에 최적화된 모델을 선택할 수 있습니다.
비교 요약
| 기능 | 5 | 9 |
|---|---|---|
| 주요 초점 | 속도, 사용 편의성, 배포 | 정확도, 매개변수 효율성 |
| 아키텍처 | CSPNet 백본, 앵커 기반 | GELAN 백본, PGI, 앵커 기반 |
| 생태계 | 네이티브 Ultralytics | Ultralytics에 통합됨 |
| 최적 용도 | 모바일, 엣지, 레거시 시스템 | 고정밀 연구, 복잡한 장면 |
| 추론 | 매우 빠름 (GPU) | 고정밀도 / 느림 |
Ultralytics 다른 모델을 살펴보세요: