YOLOv9와 YOLOv6-3.0 비교: 상세 비교
물체 감지를 위한 컴퓨터 비전 모델을 선택할 때는 서로 다른 아키텍처 간의 미묘한 차이를 이해하는 것이 중요합니다. 이 페이지에서는 YOLO 제품군의 두 가지 최신 모델인 YOLOv9과 YOLOv6-3.0의 상세한 기술 비교를 제공합니다. 아키텍처 설계, 성능 벤치마크, 적합한 애플리케이션을 자세히 살펴보고 정보에 입각한 결정을 내릴 수 있도록 도와드립니다.
아키텍처 개요
2024년 초 대만 학술원 정보과학연구소의 왕과 리아오가 소개한 YOLOv9는 딥 네트워크의 정보 손실 문제를 해결함으로써 객체 감지 분야에서 큰 도약을 이룰 것으로 기대됩니다. 여기에는 두 가지 주요 혁신이 도입되었습니다:
- 프로그래밍 가능한 그라데이션 정보(PGI): 이 메커니즘은 네트워크 전체에서 중요한 정보를 보존하도록 설계되어 정보 손실을 완화하며, 특히 더 깊고 복잡한 아키텍처에 유용합니다.
- 일반화된 효율적인 계층 집계 네트워크(GELAN): GELAN은 네트워크 아키텍처를 최적화하여 매개변수 활용률과 계산 효율성을 개선하여 더 빠르고 정확한 탐지를 가능하게 합니다.
이러한 발전으로 YOLOv9는 이전 버전에 비해 잠재적으로 더 적은 수의 파라미터로 더 높은 정확도를 달성할 수 있게 되었습니다. 이 아키텍처에 대한 자세한 내용은 arXiv에서 제공되는 논문"YOLOv9: 프로그래밍 가능한 그라데이션 정보를 사용하여 학습하고자 하는 것을 학습하기"에서 확인할 수 있습니다. 공식 코드도 GitHub에서 확인할 수 있습니다.
Meituan이 개발하고 2023년 논문"YOLOv6 v3.0: 본격적인 재장전"에 소개된 것처럼 속도와 정확성 사이의 균형을 맞추는 데 중점을 두어 산업용 애플리케이션과 실시간 시스템에 매우 적합합니다. 아키텍처의 주요 특징은 다음과 같습니다:
- 양방향 연결(BiC) 모듈: 이 모듈은 네트워크 넥 내의 로컬라이제이션 신호를 향상시켜 속도에 큰 영향을 주지 않으면서 감지 정확도를 개선합니다.
- 앵커 보조 훈련(AAT) 전략: AAT는 보다 효과적인 트레이닝을 지원하여 모델의 전반적인 성과에 기여합니다.
YOLOv6-3.0은 더 빠른 추론 시간과 더 작은 모델 크기를 우선시하여 효율성을 위해 설계되었습니다. 코드베이스는 GitHub에서 공개적으로 액세스할 수 있습니다.
성능 지표
아래 표는 COCO 데이터 세트에서 YOLOv9 모델과 YOLOv6-3.0 모델의 성능을 비교한 것입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4TensorRT10 (ms) |
매개변수 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
분석:
- 정확도(mAP): YOLOv9 모델은 일반적으로 더 높은 mAP 점수를 나타내며, 특히 더 큰 모델 크기(m, c, e)에서 물체 감지의 정확도가 우수함을 나타냅니다. 예를 들어, YOLOv9e는 55.6%의 mAPval50-95를 달성하여 52.8%의 YOLOv6-3.0l보다 성능이 뛰어납니다.
- 추론 속도: YOLOv6-3.0 모델은 추론 속도가 현저히 빠르며, 특히 YOLOv6-3.0n 및 YOLOv6-3.0s와 같은 더 작은 변형이 더 빠릅니다. YOLOv6-3.0n은 1.17ms의 TensorRT 속도를 달성하여 2.3ms의 YOLOv9t보다 훨씬 빠릅니다.
- 모델 크기 및 FLOP: YOLOv9 모델은 일부 크기 범주에서 YOLOv6-3.0과 비슷하거나 더 나은 정확도를 위해 더 적은 수의 파라미터와 더 낮은 FLOP을 갖는 경향이 있어 아키텍처의 효율성을 보여줍니다. 예를 들어, YOLOv9c는 비슷한 정확도를 유지하면서 YOLOv6-3.0l(59.6M 및 150.7B)보다 파라미터(25.3M)와 FLOP(102.1B)이 더 적습니다.
사용 사례
YOLOv9:
- 높은 정확도가 요구되는 경우: 자율 주행, 고급 감시 시스템, 상세한 의료 영상 분석 등 정확성이 가장 중요한 애플리케이션에 적합합니다.
- 복잡한 시나리오: 복잡한 배경이나 수많은 작은 물체가 있는 시나리오에서 특징 정보를 보존하는 것이 중요한 경우에 탁월합니다.
- 연구 및 개발: 객체 감지 성능의 한계를 뛰어넘고 새로운 아키텍처 최적화를 모색하는 데 적합합니다.
YOLOv6-3.0:
- 실시간 애플리케이션: 실시간 비디오 분석, 로봇 공학, 드론 기반 시스템 등 빠른 추론 속도가 필요한 애플리케이션에 가장 적합합니다.
- 리소스가 제한된 디바이스: 효율적인 설계와 작은 모델 크기로 인해 컴퓨팅 리소스가 제한된 에지 디바이스, 모바일 플랫폼 및 시스템에 배포하는 데 최적화되어 있습니다.
- 산업용 애플리케이션: 품질 관리, 자동화된 검사, 안전 모니터링과 같은 작업을 위해 강력하고 빠른 물체 감지가 필요한 산업 환경에 적합합니다.
교육 및 구현
YOLOv9와 YOLOv6-3.0 모두 PyTorch 같은 널리 사용되는 딥 러닝 프레임워크를 사용하여 학습 및 구현할 수 있습니다. Ultralytics 두 모델에 대한 포괄적인 문서와 지원을 제공하므로 연구자와 개발자가 액세스할 수 있습니다. 훈련, 검증 및 배포에 대한 자세한 가이드는 YOLOv9 및 YOLOv6용 공식 Ultralytics 문서에서 확인할 수 있습니다.
결론
YOLOv9과 YOLOv6-3.0 중에서 선택하는 것은 프로젝트의 특정 요구사항에 따라 크게 달라집니다. 정확성이 최우선 순위이고 컴퓨팅 리소스에 대한 제약이 적은 경우, YOLOv9은 최첨단 성능을 제공합니다. 반대로 실시간 또는 엣지 배포를 위한 속도와 효율성이 중요한 경우 YOLOv6-3.0은 속도와 합리적인 정확도 간의 탁월한 균형을 제공합니다.
다른 모델을 탐색하는 데 관심이 있는 사용자를 위해 Ultralytics 다음과 같은 다양한 YOLO 모델도 제공합니다. YOLOv8, YOLOv5및 YOLO11등 다양한 사용 사례에 맞는 고유한 강점을 갖춘 다양한 모델이 있습니다. 이러한 모델을 살펴보고 자신의 컴퓨터 비전 요구 사항에 가장 적합한 모델을 찾아보세요.