콘텐츠로 건너뛰기

YOLOv5 YOLOv9: 심층 기술 비교

컴퓨터 비전 및 실시간 객체 탐지 분야는 지난 몇 년간 놀라운 발전을 이루었습니다. 검증된 기존 모델과 새로운 연구 아키텍처 사이에서 선택을 내리는 것은 머신러닝 엔지니어들이 흔히 마주하는 과제입니다. 본 가이드는 YOLO 매우 영향력 있는 두 모델 간의 포괄적인 기술적 비교를 제공합니다: YOLOv5YOLOv9.

제한된 에지 디바이스에 배포하든, 고충실도 특징 추출을 연구하든, 복잡한 객체 탐지 파이프라인을 구축하든, 이러한 모델들의 아키텍처적 미묘함, 성능 지표, 생태계 차이를 이해하는 것이 매우 중요합니다.

모델 개요

각 모델의 기원과 주요 목적을 이해하는 것이 건축적 비교를 시작하기 전에 도움이 됩니다.

Ultralytics YOLOv5

글렌 조커가 개발하고 Ultralytics 에 의해 출시된 YOLOv5 개발자들이 비전 모델과 상호작용하는 방식에 패러다임 전환을 YOLOv5 . PyTorch 프레임워크를 완전히 수용함으로써, YOLOv5 이전 Darknet 기반 모델들의 복잡한 컴파일 단계를 직관적인 Python 사용자 경험으로 YOLOv5 .

YOLOv5 사용 편의성과 다양한 하드웨어 환경에서의 안정적인 성능으로 YOLOv5 . 단순한 탐지뿐만 아니라 이미지 분류인스턴스 분할도 지원합니다.

5에 대해 자세히 알아보기

9

대만 중앙연구원 정보과학연구소의 왕젠야오(王建耀)와 마크 리아오홍위안(廖宏源)이 소개한 YOLOv9 심층 신경망의 정보 병목 현상 문제를 완화하기 위해 아키텍처 이론에 중점을 YOLOv9 .

  • 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
  • Organization: Institute of Information Science, Academia Sinica, Taiwan
  • 날짜:21
  • Arxiv:2402.13616
  • GitHub:9 저장소
  • 문서:9 문서

YOLOv9 핵심은 두 가지 주요 이론적 혁신에 YOLOv9 : 프로그래머블 그라디언트 정보(PGI)와 일반화된 효율적 레이어 집계 네트워크(GELAN)입니다. 이러한 개념들은 모델이 심층 네트워크 레이어를 통해 중요한 공간적 특징을 유지하도록 돕습니다.

9에 대해 자세히 알아보기

배포를 미래에 대비하세요

YOLOv5 YOLOv9 , 새로 출시된 YOLO26은 속도와 정밀도의 궁극적인 균형을 구현합니다. 엔드투엔드 NMS 프리 설계와 최대 43% 빠른 CPU 특징으로 하는 YOLO26은 현대적인 엣지 컴퓨팅 및 생산 환경 배포에 적극 권장됩니다.

건축적 및 기술적 차이점

이러한 비전 모델의 내부 작동 원리를 이해하는 것은 모델 배포 전략을 최적화하는 데 매우 중요합니다.

특징 추출 및 정보 보존

YOLOv5 크로스 스테이지 부분 네트워크(CSPNet) 백본을 YOLOv5 역전파 과정에서 정확한 기울기 흐름을 유지하면서도 계산 오버헤드를 효과적으로 줄입니다. 이 설계는 기존 GPU 고도로 최적화되어 있으며, 무거운 트랜스포머 기반 대안들에 비해 훈련 중 더 낮은 메모리 요구량을 보장합니다.

YOLOv9 CSPNet 원칙을 확장한 범용 아키텍처인 GELAN을 YOLOv9 . 보조 가역 분기인 PGI와 결합된YOLOv9 심층 레이어가 정밀한 목적 함수에 필요한 의미론적 데이터를 잃지 않도록YOLOv9 . 이를 YOLOv9 특히 작은 물체에서 높은 정확도를 YOLOv9 있지만, 복잡한 보조 분기 구조는 심하게 제약된 에지 하드웨어로의 수출 파이프라인을 때때로 복잡하게 만들 수 있습니다.

메모리 요구 사항 및 교육 효율성

훈련 효율성 측면에서 YOLOv5 놀라울 정도로 견고합니다. 잘 관리된 Ultralytics 덕분에 YOLOv5 CUDA 소비량이 현저히 적어, 연구자들이 소비자용 GPU에서 배치 크기를 극대화할 수 있습니다. 반면 YOLOv9 우수한 매개변수 효율성(크기에 비해 높은 정확도) YOLOv9 , 최적화된 프레임워크를 활용하지 않을 경우 훈련 과정이 더 많은 자원을 소모할 수 있습니다. 다행히도 YOLOv9 Ultralytics YOLOv9 통합하면 YOLOv5 간소화된 자원 관리와 거의 동등한 수준에 도달할 수 있습니다.

성과 및 지표

이러한 아키텍처를 객관적으로 평가하기 위해 COCO 같은 표준 데이터셋에서의 성능을 비교합니다. 아래는 mAP 평균 정밀도), 추론 속도, 매개변수 수와 같은 지표에 대한 상세한 분석입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

표에서 알 수 있듯이, YOLOv9 동등한 성능 수준에서 더 높은 기본 정확도를 YOLOv9 최신 아키텍처를 반영합니다. 그러나 YOLOv5n은 1.12ms라는 놀라울 정도로 낮은 TensorRT 시간을 유지하여 고속의 국소적 에지 컴퓨팅 애플리케이션에 대한 지속적인 강점을 부각시킵니다.

훈련 방법론 및 사용 편의성

오늘날 컴퓨터 비전을 활용하는 진정한 이점은 도구 체인의 접근성에 있다.

Ultralytics 이점

YOLOv9 같은 모델의 원본 연구 저장소는 YOLOv9 , 종종 복잡한 종속성 행렬과 상용구 스크립트를 동반합니다. Ultralytics Python 이러한 복잡성을 완전히 추상화합니다. Ultralytics 통해 동일한 통합 YOLOv9 YOLOv5 YOLOv9 모두를 훈련, 평가 및 내보낼 수 있습니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model for fast deployment
model_v5 = YOLO("yolov5s.pt")

# Or leverage a YOLOv9 model for high-fidelity accuracy
model_v9 = YOLO("yolov9c.pt")

# Train seamlessly on custom data with automatic MLflow logging
results = model_v9.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX
model_v9.export(format="onnx")

이 단일 API 접근 방식은 선택한 모델에 따라 탐지뿐만 아니라 자세 추정방향성 바운딩 박스(OBB) 까지 지원하는 막대한 다용도성을 제공합니다. 또한 Comet Weights & Biases 과 같은 도구와의 강력한 통합 기능이 훈련 루프에 직접 내장되어 있습니다.

이상적인 사용 사례와 실제 적용 사례

이러한 아키텍처 중 하나를 선택하는 것은 주로 하드웨어의 제약 조건과 애플리케이션 도메인이 요구하는 정밀도에 달려 있습니다.

5 선택해야 할 때

YOLOv5 안정성, 낮은 메모리 사용량, 극한의 내보내기 호환성을 우선시하는 배포 환경에서 빛을 발하는 전투 경험이 풍부한 YOLOv5 .

  • 모바일 배포: YOLOv5 내보내기 TFLite 또는 CoreML 구형 스마트폰에서 온디바이스 추론을 수행하는 것은 놀라울 정도로 매끄럽습니다.
  • 레거시 에지 하드웨어: 라즈베리 파이 또는 초기 세대 NVIDIA 나노와 같은 장치의 경우, YOLOv5 직관적인 컨볼루션은 스마트 주차 관리와 같은 애플리케이션에서 일관된 프레임 속도를 YOLOv5 .
  • 신속한 프로토타이핑: 커뮤니티 튜토리얼의 광범위한 접근성, 맞춤형 사전 훈련된 가중치, 그리고 방대한 데이터셋 호환성 덕분에 개념 증명을 검증하는 가장 빠른 방법이 됩니다.

9 선택해야 할 때

YOLOv9 복잡한 세부 사항을 포착하고 거짓 음성(false negative)을 최소화하는 것이 절대적으로 중요한 시나리오에 YOLOv9 , 이를 위해 약간 더 많은 컴퓨팅 오버헤드가 필요하더라도 마찬가지입니다.

  • 항공 및 위성 영상: PGI 프레임워크는 소형 물체의 정밀도를 유지하는 데 탁월하여, YOLOv9 드론 기반 농업 모니터링에 YOLOv9 적합합니다.
  • 의료 영상 진단: 고해상도 스캔에서 미세한 이상이나 병변을 탐지할 때, GELAN의 정확한 그라디언트 흐름은 재현율 향상에 필수적인 우위를 제공합니다.
  • 고급 소매 분석: 빽빽한 진열대에서 중첩된 제품을 추적하는 작업은 YOLOv9 우수한 특징 보존 능력으로 인해 상당한 이점을 얻습니다.

시야를 넓히기

YOLOv5 YOLOv9 비교하면 2020년부터 2024년까지 아키텍처가 어떻게 진화했는지 명확히 YOLOv9 있지만, AI 분야는 그 어느 때보다 빠르게 발전하고 있습니다. 성능의 최첨단을 추구하는 개발자에게는 최신 YOLO26 모델을 적극 권장합니다. 기존 비최대 억제(NMS)를 엔드투엔드 NMS 프리 설계로 대체하고 고급 MuSGD 최적화기를 활용함으로써, YOLO26은 연구 수준의 정확도와 생산 수준의 속도 간 격차를 해소합니다. DFL 제거 (간소화된 내보내기와 향상된 에지/저전력 장치 호환성을 위한 분포 초점 손실 제거)를 통해 YOLO26은 최대 43% 빠른 CPU 달성하여 에지 컴퓨팅에 이상적입니다. 또한 ProgLoss + STAL은 IoT, 로봇공학, 항공 이미징에 중요한 소형 물체 인식에서 눈에 띄는 개선을 제공하는 향상된 손실 함수를 제공합니다.

다음과 같은 최신 모델들과 비교해 보는 것도 흥미로울 수 있습니다. RT-DETR 이나 매우 뛰어난 성능을 가진 YOLO11과 비교해 보시는 것도 흥미로울 수 있습니다. 통합된 Ultralytics 활용하면 어떤 모델을 선택하든 개발 파이프라인이 깔끔하고 효율적이며 확장 준비가 된 상태를 유지할 수 있습니다.


댓글