YOLOv7 vs. YOLOv9: 상세 기술 비교
객체 감지를 위해 YOLO 모델을 선택할 때 다양한 버전 간의 미묘한 차이를 이해하는 것이 중요합니다. 이 페이지에서는 대만 Academia Sinica 정보 과학 연구소의 연구원들이 개발한 YOLO 시리즈의 두 가지 중요한 모델인 YOLOv7과 YOLOv9 간의 자세한 기술 비교를 제공합니다. 다양한 애플리케이션에 대한 아키텍처 혁신, 성능 벤치마크 및 적합성을 살펴보고 다음 컴퓨터 비전 프로젝트에 대한 정보에 입각한 결정을 내리는 데 도움을 드립니다.
YOLOv7: 효율적이고 빠른 객체 탐지
2022년 7월에 출시된 YOLOv7은 실시간 객체 감지의 속도와 정확도를 크게 최적화하여 당시 효율성에 대한 새로운 표준을 설정하는 것을 목표로 한 획기적인 모델이었습니다.
작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/
아키텍처 및 주요 기능
YOLOv7의 설계 철학은 정확성을 저하시키지 않으면서 추론 속도를 최대화하는 데 중점을 둡니다. 이러한 균형을 달성하기 위해 몇 가지 주요 아키텍처 요소와 훈련 전략을 도입했습니다.
- Extended Efficient Layer Aggregation Network (E-ELAN): 백본의 핵심 구성 요소로서 특징 집계를 보다 효율적으로 관리하여 네트워크의 학습 능력을 향상시킵니다. 연구 논문에 자세히 설명된 바와 같이, 모델이 계산 비용을 크게 늘리지 않고도 더욱 강력한 특징을 학습할 수 있도록 합니다.
- Compound Model Scaling: YOLOv7은 모델 깊이와 너비에 대한 Compound Scaling 방법을 도입하여 다양한 계산 예산에 맞춰 다양한 모델 크기에서 효과적인 최적화를 가능하게 했습니다.
- 학습 가능한 Bag-of-Freebies: 이 개념은 고급 데이터 증강 및 레이블 할당 전략과 같은 학습 프로세스 중에 다양한 최적화 기술을 통합하는 것을 포함합니다. 이러한 방법은 추론 비용에 오버헤드를 추가하지 않고 최종 모델의 정확도를 향상시킵니다.
강점과 약점
강점
- 높은 추론 속도: 실시간 애플리케이션에 최적화되어 YOLOv7은 특정 하드웨어 및 배치 크기 구성에서 많은 후속 모델보다 빠른 추론을 제공하는 경우가 많습니다.
- 뛰어난 성능: 경쟁력 있는 mAP 점수를 달성하여 다양한 감지 작업에 안정적이고 강력한 선택이 될 수 있습니다.
- 검증된 모델: YOLOv7은(는) 오랫동안 사용 가능했기 때문에 폭넓은 채택, 광범위한 커뮤니티 리소스 및 수많은 입증된 배포 사례의 이점을 누릴 수 있습니다.
약점
- 낮은 최고 정확도: 최신 YOLOv9와 비교했을 때, YOLOv7은 특히 작거나 겹치는 객체가 많은 복잡한 시나리오에서 약간 낮은 최대 정확도를 보일 수 있습니다.
- Anchor-Based Detection: 사전 정의된 앵커 박스에 의존하므로, 특이하거나 매우 다양한 종횡비를 가진 객체를 감지하는 데 앵커 프리 방식보다 유연성이 떨어질 수 있습니다.
사용 사례
YOLOv7은 추론 속도가 가장 중요한 요소인 애플리케이션에 매우 적합합니다.
- 실시간 비디오 분석 및 감시 시스템.
- 로보틱스 및 드론에서 볼 수 있는 것과 같이 리소스가 제한된 장치에 대한 Edge AI 배포.
- 빠른 전환이 필수적인 객체 감지 시스템의 신속한 프로토타입 제작 및 개발.
YOLOv9: 향상된 정확도를 위한 프로그래밍 가능한 기울기 정보
2024년 2월에 소개된 YOLOv9는 심층 신경망의 정보 손실 문제를 직접적으로 해결하여 정확도에서 상당한 이득을 얻음으로써 중요한 아키텍처 발전을 나타냅니다.
작성자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
문서: https://docs.ultralytics.com/models/yolov9/
아키텍처 및 주요 기능
YOLOv9은 네트워크를 통한 정보 흐름을 개선하여 학습 효과를 높이고 정확도를 향상시키도록 설계된 새로운 개념을 도입했습니다.
- 프로그래밍 가능한 기울기 정보 (PGI): 이는 YOLOv9의 핵심 혁신입니다. PGI는 보조 가역적 분기를 통해 안정적인 기울기를 생성하여 심층 네트워크에 내재된 정보 병목 현상 문제를 해결합니다. 이를 통해 중요한 정보가 더 깊은 레이어의 업데이트를 위해 보존되어 정확한 감지에 필요한 핵심 세부 정보의 손실을 방지합니다.
- GELAN(Generalized Efficient Layer Aggregation Network): YOLOv5에 사용된 CSPNet과 같은 아키텍처의 성공을 기반으로 하는 GELAN은 새롭고 매우 효율적인 네트워크 아키텍처입니다. 파라미터 활용률과 계산 효율성을 최적화하여 YOLOv9이 더 적은 리소스로 더 나은 성능을 달성할 수 있도록 합니다.
강점과 약점
강점
- 향상된 정확도: PGI와 GELAN의 조합은 뛰어난 특징 추출로 이어지고 YOLOv7에 비해 훨씬 더 높은 mAP 점수를 얻을 수 있으며, 이는 더 큰 모델 변형에서 특히 두드러집니다.
- 향상된 효율성: YOLOv9는 이전 모델보다 더 적은 파라미터와 연산으로 더 나은 정확도를 달성합니다. 주어진 정확도 수준에서 YOLOv9는 YOLOv7보다 더 효율적인 경우가 많습니다.
- 최첨단 혁신: 이는 원래 YOLO 연구 계보의 최신 발전을 나타내며, 실시간 객체 감지에서 가능한 것의 경계를 넓힙니다.
약점
- 계산 요구량: 정확도에 비해 효율적이지만 고급 아키텍처, 특히 YOLOv9e와 같은 더 큰 변형 모델은 훈련 및 배포를 위해 상당한 컴퓨팅 자원을 여전히 필요로 할 수 있습니다.
- 더 새로운 모델: 더 최신 릴리스이므로, 커뮤니티 지원 및 타사 배포 튜토리얼은 YOLOv7과 같이 확고하게 자리 잡은 모델보다 덜 광범위할 수 있습니다. 그러나 Ultralytics 생태계에 통합되어 사용자 경험을 간소화하여 이러한 단점을 완화하는 데 도움이 됩니다.
사용 사례
YOLOv9은 최고 수준의 정확도와 효율성을 요구하는 애플리케이션에 이상적인 선택입니다.
- 자율 주행 차량 및 첨단 운전자 보조 시스템의 복잡한 감지 작업.
- 오탐 및 미탐을 최소화해야 하는 고정밀 보안 시스템.
- 모델 크기 및 계산 비용이 중요한 제약 조건이지만 높은 정확도를 타협할 수 없는 애플리케이션.
성능 및 효율성 직접 비교
YOLOv7과 YOLOv9을 직접 비교할 때 명확한 추세가 나타납니다. YOLOv9는 정확도와 계산 비용 간에 우수한 절충점을 제공합니다. 예를 들어 YOLOv9m 모델은 YOLOv7l과 동일한 51.4% mAP를 달성하지만 파라미터(20.0M 대 36.9M)와 FLOP가 거의 절반입니다. 마찬가지로 YOLOv9c는 YOLOv7x(53.0% 대 53.1% mAP)와 비슷한 성능을 제공하면서도 훨씬 더 효율적이며 YOLOv7x의 71.3M에 비해 25.3M 파라미터만 사용합니다. 이러한 효율성 향상은 YOLOv9의 아키텍처 개선, 특히 PGI 및 GELAN의 직접적인 결과이며, 이를 통해 보다 효과적인 학습이 가능합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv9t | 640 | 38.3 | - | 2.30 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
결론 및 권장 사항
YOLOv7과 YOLOv9는 모두 강력한 객체 탐지 모델이지만, 약간 다른 우선순위를 가지고 있습니다.
-
YOLOv7은 특히 원시 추론 속도가 가장 중요하고 확립되고 널리 지원되는 아키텍처가 선호되는 애플리케이션에서 강력한 경쟁자로 남아 있습니다. 많은 실시간 시스템에서 입증된 주력 모델입니다.
-
YOLOv9는 명확한 후속 모델이며 최첨단 정확도와 효율성이 필요한 새로운 프로젝트에 권장되는 선택입니다. 혁신적인 아키텍처는 딥 러닝의 주요 문제를 해결하여 이전 모델보다 더 정확하고 계산적으로 효율적인 모델을 만듭니다.
두 모델 모두 훌륭하지만, 더욱 통합되고 다재다능한 솔루션을 추구하는 개발자는 Ultralytics YOLOv8 및 최신 YOLO11과 같은 Ultralytics 생태계의 모델도 고려해야 합니다. 이러한 모델은 간소화된 사용자 경험, 광범위한 설명서를 제공하며, 단일하고 잘 관리된 프레임워크 내에서 인스턴스 분할, 자세 추정 및 분류를 포함하여 탐지를 넘어선 광범위한 작업을 지원합니다.
다른 모델 살펴보기
자세한 비교 및 다른 최첨단 모델을 탐색하려면 Ultralytics 문서에서 다음 페이지를 확인하십시오.
- YOLOv5: 성능과 광범위한 채택의 균형으로 알려져 있습니다.
- YOLOv8: 다양한 비전 작업을 지원하는 다재다능하고 강력한 모델입니다.
- YOLOv10: NMS의 필요성을 제거하여 실시간 엔드 투 엔드 객체 감지에 중점을 둡니다.
- YOLO11: 최고 수준의 성능과 효율성을 제공하는 Ultralytics의 최신 최첨단 모델입니다.
- RT-DETR: 다른 아키텍처 접근 방식을 제공하는 변환기 기반 감지기입니다.