콘텐츠로 건너뛰기

YOLOv5 vs YOLOv9: 상세 비교

이 페이지에서는 두 가지 중요한 객체 감지 모델인 Ultralytics YOLOv5와 YOLOv9 간의 기술 비교를 제공합니다. 두 모델 모두 실시간 객체 감지에서 속도와 정확도의 균형을 맞추는 것으로 알려진 영향력 있는 YOLO(You Only Look Once) 시리즈의 일부입니다. 이 비교에서는 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 살펴보고 귀사의 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움을 드립니다.

Ultralytics YOLOv5: 확고한 산업 표준

작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentation: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5는 빠른 속도, 정확성 및 사용 편의성의 균형으로 출시 후 빠르게 인기를 얻었습니다. PyTorch에서 완전히 개발된 YOLOv5는 CSPDarknet53을 백본으로, PANet을 특징 집계에 사용하는 아키텍처와 효율적인 앵커 기반 감지 헤드를 특징으로 합니다. 다양한 모델 크기(n, s, m, l, x)를 제공하므로 사용자는 컴퓨팅 리소스 및 성능 요구 사항에 따라 선택할 수 있습니다.

강점

  • 탁월한 속도 및 효율성: YOLOv5는 빠른 추론에 매우 최적화되어 있어 에지 장치를 포함한 다양한 하드웨어에서 실시간 애플리케이션에 이상적입니다.
  • 사용 편의성: Ultralytics YOLOv5는 간소화된 사용자 경험, 간단한 PythonCLI 인터페이스, 광범위한 설명서로 유명합니다.
  • 잘 관리되는 에코시스템: 활발한 개발, 크고 지원적인 커뮤니티, 잦은 업데이트, 그리고 노코드 훈련을 위한 Ultralytics HUB와 같은 포괄적인 리소스를 특징으로 하는 통합된 Ultralytics 에코시스템을 통해 이점을 얻습니다.
  • 성능 균형: 추론 속도와 감지 정확도 간의 강력한 절충점을 달성하여 다양한 실제 배포 시나리오에 적합합니다.
  • 다양성: 객체 탐지(object detection), 인스턴스 분할(instance segmentation)이미지 분류(image classification)를 포함한 여러 작업을 지원합니다.
  • 학습 효율성: 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치를 제공하며, 일반적으로 다른 많은 아키텍처, 특히 트랜스포머 기반 모델에 비해 더 낮은 메모리 요구 사항을 가집니다.

약점

  • 정확도: 당시에는 매우 정확했지만, YOLOv9와 같은 최신 모델은 COCO와 같은 벤치마크에서 더 높은 mAP 점수를 달성할 수 있습니다.
  • Anchor-Based: 미리 정의된 앵커 박스를 사용하므로, 앵커 프리 방식에 비해 특정 데이터 세트에 대한 튜닝이 더 필요할 수 있습니다.

사용 사례

YOLOv5에 대해 자세히 알아보세요

YOLOv9: 새로운 기술을 통한 정확도 향상

작성자: Chien-Yao Wang, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Documentation: https://docs.ultralytics.com/models/yolov9/

YOLOv9은 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network)이라는 중요한 아키텍처 혁신을 도입했습니다. PGI는 손실 함수 계산을 위한 완전한 입력 정보를 제공하여 데이터가 심층 네트워크를 통해 흐를 때 정보 손실을 완화하는 것을 목표로 합니다. GELAN은 뛰어난 파라미터 활용률과 계산 효율성을 위해 설계된 새로운 아키텍처입니다. 이러한 개선을 통해 YOLOv9은 효율성을 유지하면서 더 높은 정확도를 달성할 수 있습니다.

강점

  • 향상된 정확도: 실시간 객체 감지기용 COCO 데이터 세트에서 새로운 최첨단 결과를 설정하여 mAP에서 YOLOv5 및 기타 모델을 능가합니다.
  • 향상된 효율성: GELAN 및 PGI는 이전 모델보다 비슷하거나 더 나은 성능을 위해 더 적은 매개변수와 계산 리소스(FLOP)를 필요로 하는 모델에 기여합니다.
  • 정보 보존: PGI는 더 깊고 복잡한 네트워크를 정확하게 훈련하는 데 중요한 정보 병목 현상 문제를 효과적으로 해결합니다.

약점

  • 학습 리소스: YOLOv9 문서에 명시된 바와 같이 YOLOv9 모델을 학습하는 것은 Ultralytics YOLOv5에 비해 더 많은 리소스와 시간이 소요될 수 있습니다.
  • 더 새로운 아키텍처: 다른 연구 그룹에서 개발한 더 최신 모델이므로, Ultralytics YOLOv5만큼 생태계, 커뮤니티 지원 및 타사 통합이 성숙하지 않았을 수 있습니다.
  • 작업 다양성: 주로 객체 탐지에 중점을 두며, YOLOv5 및 YOLOv8과 같은 Ultralytics 모델에서 제공하는 분할, 분류 및 포즈 추정에 대한 기본 지원이 부족합니다.

사용 사례

  • 가능한 가장 높은 객체 감지 정확도를 요구하는 애플리케이션.
  • 높은 성능과 함께 계산 효율성이 중요한 시나리오.
  • 고급 비디오 분석 및 고정밀 산업 검사.
  • 최고 수준의 감지가 필요한 교통 관리의 AI스마트 시티 애플리케이션.

YOLOv9에 대해 자세히 알아보세요

성능 및 벤치마크: YOLOv5 vs. YOLOv9

성능을 비교할 때 YOLOv9 모델은 일반적으로 YOLOv5 모델보다 더 높은 mAP 점수를 달성하여 아키텍처 혁신의 효과를 입증합니다. 그러나 Ultralytics YOLOv5는 뛰어난 추론 속도와 고도로 최적화된 구현으로 인해 강력한 위치를 유지하고 있어 초당 프레임 수(FPS)가 중요한 지표인 실시간 애플리케이션에 적합한 선택입니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

심층적인 아키텍처 분석

YOLOv5 아키텍처

Ultralytics YOLOv5의 아키텍처는 YOLO 제품군의 원리를 개선하여 구현한 것입니다. 세 가지 주요 부분으로 구성됩니다.

  • Backbone: 정확도를 유지하면서 계산량을 줄이기 위해 CSP(Cross Stage Partial) 모듈을 통합한 Darknet-53의 수정 버전인 CSPDarknet53 네트워크입니다.
  • Neck: PANet(Path Aggregation Network)은 다양한 백본 레벨의 특징을 통합하여 다양한 스케일의 객체 탐지 성능을 향상시키는 데 사용됩니다.
  • 헤드: 감지 헤드는 앵커 기반이며, 미리 정의된 앵커 박스 모양으로부터 경계 상자를 예측하여 빠른 속도에 기여합니다.

YOLOv9 아키텍처

YOLOv9은 정확도와 효율성의 경계를 넓히기 위한 새로운 개념을 도입했습니다.

  • 프로그래밍 가능한 기울기 정보 (PGI): 이 메커니즘은 심층 네트워크의 정보 병목 현상 문제를 해결하도록 설계되었습니다. 손실 함수 계산에 완전한 입력 정보를 사용할 수 있도록 하여 보다 안정적인 기울기 업데이트와 더 나은 모델 수렴을 유도합니다.
  • Generalized Efficient Layer Aggregation Network (GELAN): 이는 CSPNet 및 ELAN의 원리를 기반으로 구축된 새로운 네트워크 아키텍처입니다. GELAN은 파라미터 활용도와 계산 효율성을 최적화하여 모델이 더 적은 리소스로 더 높은 정확도를 달성할 수 있도록 설계되었습니다.

학습 및 생태계

Ultralytics YOLOv5가 진정으로 빛나는 곳은 학습 경험과 생태계 지원입니다.

  • 사용 편의성: YOLOv5는 간단한 명령줄 및 Python API, 광범위한 튜토리얼 및 포괄적인 설명서를 통해 매우 사용자 친화적인 경험을 제공합니다.
  • 잘 관리되는 에코시스템: 공식 Ultralytics 모델인 YOLOv5는 활발한 개발, GitHubDiscord의 대규모 커뮤니티, 잦은 업데이트 및 Ultralytics HUB와 같은 MLOps 도구와의 원활한 통합을 포함하는 강력한 에코시스템의 일부입니다.
  • 학습 효율성: YOLOv5는 학습이 매우 효율적이며, 즉시 사용 가능한 사전 학습된 가중치와 더 복잡한 아키텍처에 비해 더 낮은 메모리 요구 사항을 갖습니다. 따라서 더 넓은 범위의 하드웨어를 가진 사용자가 액세스할 수 있습니다.

YOLOv9도 강력한 모델이지만, 학습 과정이 더 까다로울 수 있으며, Ultralytics 모델만큼 생태계가 성숙하거나 통합되어 있지는 않습니다. 학습에서 배포까지 원활하고 잘 지원되는 경로를 찾는 개발자에게는 YOLOv5가 확실한 이점을 제공합니다.

결론: 어떤 모델을 선택해야 할까요?

YOLOv5와 YOLOv9는 모두 훌륭한 모델이지만, 서로 다른 우선순위를 충족합니다.

  • Ultralytics YOLOv5는 속도, 사용 편의성, 그리고 성숙하고 잘 지원되는 생태계를 중요하게 생각하는 개발자에게 이상적인 선택입니다. 뛰어난 성능 균형으로 실시간 애플리케이션, 신속한 프로토타입 제작, 그리고 리소스가 제한된 edge AI 장치에 배포하는 데 적합합니다. 여러 비전 작업에서 다재다능함을 제공하므로 범용 비전 AI 프레임워크로서의 가치를 더합니다.

  • YOLOv9는 가능한 가장 높은 객체 detection 정확도를 달성하는 것이 주요 목표이고 학습을 위한 컴퓨팅 리소스가 덜 중요한 애플리케이션에 가장 적합합니다. 혁신적인 아키텍처는 까다로운 벤치마크에서 최첨단 결과를 제공합니다.

대부분의 사용자, 특히 강력한 커뮤니티 및 상업적 지원을 통해 안정적이고 빠르며 사용하기 쉬운 모델을 찾는 사용자에게는 Ultralytics YOLOv5가 여전히 최고의 추천 모델입니다. Ultralytics의 최신 발전에 관심이 있는 사람들을 위해 YOLOv8 및 최신 YOLO11과 같은 모델은 Ultralytics 생태계를 정의하는 사용자 친화적인 경험을 유지하면서 훨씬 더 뛰어난 성능과 다재다능함을 제공합니다.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글