YOLOv9 vs. EfficientDet: 상세 비교
최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 컴퓨팅 리소스의 균형을 맞추는 컴퓨터 비전 작업에 매우 중요합니다. 이 페이지에서는 객체 감지 분야의 두 가지 중요한 모델인 Ultralytics YOLOv9와 EfficientDet 간의 자세한 기술 비교를 제공합니다. 프로젝트에 대한 정보에 입각한 결정을 내리는 데 도움이 되도록 아키텍처 설계, 성능 벤치마크 및 적합한 애플리케이션을 자세히 살펴보겠습니다.
YOLOv9: 최첨단 정확도 및 효율성
2024년 대만 Academia Sinica 정보 과학 연구소의 Chien-Yao Wang과 Hong-Yuan Mark Liao가 소개한 YOLOv9는 YOLO 시리즈의 중요한 발전을 나타냅니다. 이는 그들의 논문 "YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information"에 자세히 설명되어 있으며 그들의 GitHub 저장소에 구현되어 있습니다. YOLOv9는 PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network)과 같은 혁신적인 아키텍처 요소를 통해 딥 네트워크의 정보 손실 문제를 해결합니다. 이러한 혁신은 모델이 효과적으로 학습하고 더 적은 파라미터로 높은 정확도를 유지하도록 보장하여 성능과 효율성 간의 강력한 균형을 보여줍니다.
기술 세부 사항:
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- 문서: https://docs.ultralytics.com/models/yolov9/
강점
- 최첨단 정확도: YOLOv9는 객체 감지에서 뛰어난 정확도를 달성하며, 유사한 파라미터 수에서 경쟁 모델보다 뛰어난 성능을 보이는 경우가 많습니다.
- 효율적인 파라미터 활용: PGI 및 GELAN 아키텍처는 특징 추출을 향상시키고 정보 손실을 줄여 더 적은 파라미터와 FLOPs로 더 나은 성능을 제공합니다.
- 확장성: YOLOv9 제품군은 다양한 모델 크기(YOLOv9t~YOLOv9e)를 포함하여 다양한 컴퓨팅 성능에 대한 유연성을 제공합니다.
- Ultralytics 생태계: 원래 연구는 Academia Sinica에서 나왔지만 Ultralytics 프레임워크 내에 통합하면 막대한 이점을 얻을 수 있습니다. 여기에는 간단한 Python API를 통한 사용 편의성, 광범위한 문서 및 즉시 사용 가능한 사전 학습된 가중치를 사용한 효율적인 학습 프로세스가 포함됩니다. 잘 관리되는 생태계는 활발한 개발, 강력한 커뮤니티 지원 및 노코드 학습을 위한 Ultralytics HUB와 같은 도구와의 통합을 보장합니다.
- 낮은 메모리 공간: YOLO 모델은 일반적으로 다른 많은 아키텍처, 특히 RT-DETR과 같은 트랜스포머 기반 모델에 비해 훈련 중에 더 낮은 메모리 요구 사항을 나타냅니다.
약점
- 참신성: 최신 모델이므로 실제 배포 예제는 EfficientDet과 같이 기존 모델보다 적을 수 있지만 Ultralytics 커뮤니티 내에서의 채택은 빠르게 진행되고 있습니다.
- Task Specificity: 원래 YOLOv9 논문은 주로 객체 탐지에 중점을 둡니다. 그러나 Ultralytics 생태계에 통합되면서 Ultralytics YOLOv8과 같은 모델의 다중 작업 기능에 맞춰 더 넓은 잠재력을 암시합니다.
사용 사례
YOLOv9은 특히 정확도와 효율성이 가장 중요한 애플리케이션에 적합합니다(예:).
- 컴퓨터 비전을 사용하여 위성 이미지를 분석하는 것과 같은 고해상도 이미지 분석.
- 자율 주행 차량에 필요한 복잡한 장면 이해.
- 제조업의 품질 관리와 같은 작업을 위한 정밀 객체 인식.
EfficientDet: 확장 가능하고 효율적인 객체 감지
EfficientDet은 2019년 Google Research 팀에서 소개되었습니다. 정확도를 희생하지 않고 효율성을 우선시하는 새로운 확장 가능한 객체 감지기 제품군을 제안했습니다. 모델의 아키텍처는 고효율 EfficientNet 백본, 특징 융합을 위한 새로운 Bi-directional Feature Pyramid Network(BiFPN), 모델의 모든 부분에 대해 해상도, 깊이 및 너비를 균일하게 확장하는 복합 확장 방법을 기반으로 합니다.
기술 세부 사항:
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organization: Google
- 날짜: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
강점
- Compound Scaling: EfficientDet의 핵심 혁신은 스케일링에 대한 체계적인 접근 방식으로, 다양한 리소스 제약 조건을 충족하는 모델 패밀리(D0-D7)를 만들 수 있습니다.
- BiFPN: 양방향 특징 피라미드 네트워크는 기존 FPN에 비해 더욱 풍부한 다중 스케일 특징 융합을 가능하게 하여 감지 정확도를 향상시킵니다.
- 역사적 중요성: EfficientDet은 출시 당시 객체 감지 효율성에 대한 새로운 표준을 설정하여 이후의 많은 아키텍처에 영향을 미쳤습니다.
약점
- 구식 성능: EfficientDet은 당시에는 획기적이었지만 YOLOv9와 같은 최신 모델에 의해 정확도와 속도 모두에서 능가되었습니다. 성능 테이블에서 볼 수 있듯이 YOLOv9 모델은 더 적은 파라미터와 훨씬 빠른 추론 속도로 일관되게 더 높은 mAP를 달성합니다.
- 더 느린 추론 속도: NVIDIA T4와 같은 최신 하드웨어에서 가장 작은 EfficientDet 모델조차도 비슷하거나 더 정확한 YOLOv9 변형보다 느립니다.
- 제한된 생태계: EfficientDet은 주로 연구 저장소입니다. 간소화된 훈련, 배포 및 커뮤니티 지원을 포함하는 Ultralytics에서 제공하는 포괄적이고 사용자 친화적인 생태계가 부족합니다.
- 작업 특정성: EfficientDet은 객체 탐지 전용으로 설계되었으며 Ultralytics 프레임워크에서 제공하는 인스턴스 분할 또는 포즈 추정과 같은 다른 작업에 대한 기본 다용도성을 제공하지 않습니다.
사용 사례
EfficientDet은 레거시 시스템이나 학술적 비교를 위한 기준으로 여전히 고려할 수 있습니다. 응용 분야는 다음과 같습니다.
- 고속 추론이 주요 제약 조건이 아닌 범용 객체 감지.
- 특징 피라미드 네트워크 및 모델 스케일링 원리를 이해하기 위한 교육 목적.
- 원래 구현이 있는 TensorFlow 프레임워크에서 표준화된 프로젝트입니다.
성능 분석: YOLOv9 vs. EfficientDet
YOLOv9와 EfficientDet 간의 성능 비교는 지난 몇 년간의 객체 감지 기술 발전을 명확하게 보여줍니다. YOLOv9는 일관되게 정확도, 속도 및 모델 크기 간의 우수한 균형을 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.30 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
표에서 몇 가지 중요한 통찰력을 얻을 수 있습니다.
- 정확도 vs. 효율성: YOLOv9c 모델은 2,530만 개의 파라미터만으로 53.0 mAP를 달성하고 T4 GPU에서 7.16ms의 매우 빠른 추론 시간을 제공합니다. 반면, 정확도가 비슷한 EfficientDet-d6(52.6 mAP)는 두 배 이상의 파라미터(5,190만 개)가 필요하며 89.29ms로 12배 이상 느립니다.
- 최고 수준의 성능: 가장 큰 모델인 YOLOv9e는 인상적인 55.6 mAP에 도달하여 가장 큰 EfficientDet-d7 모델(53.7 mAP)보다 성능이 뛰어나면서도 7배 이상 빠르고 훨씬 적은 FLOPs를 필요로 합니다.
- 경량 모델: 더 작은 모델인 YOLOv9s(46.8 mAP)는 EfficientDet-d3(47.5 mAP)와 비슷한 정확도를 제공하지만 파라미터는 거의 절반이고 GPU에서 5배 이상 빠릅니다.
결론: 어떤 모델을 선택해야 할까요?
거의 모든 최신 객체 감지 애플리케이션에서 YOLOv9가 확실한 승자입니다. 고급 아키텍처는 뛰어난 추론 속도와 파라미터 효율성을 유지하면서 최첨단 정확도를 제공합니다. Ultralytics 생태계로의 통합은 훈련에서 배포에 이르기까지 간소화된 워크플로를 제공하고 강력한 문서와 활성 커뮤니티의 지원을 받아 가치를 더욱 향상시킵니다.
EfficientDet은 모델 스케일링 및 특징 융합의 개념을 개척한 역사적, 학문적 관점에서 중요한 모델로 남아 있습니다. 그러나 실제 개발 및 배포의 경우 성능이 YOLOv9와 같이 더 새롭고 효율적인 아키텍처에 의해 가려졌습니다. 새로운 프로젝트를 시작하거나 기존 프로젝트를 업그레이드하려는 경우 YOLOv9를 선택하면 뛰어난 성능, 더 빠른 개발 주기 및 향후 발전에 대한 더 나은 지원을 제공합니다.
다른 모델 살펴보기
다른 최첨단 모델을 살펴보고 있다면 YOLOv10, YOLOv8 및 RT-DETR과 같은 트랜스포머 기반 아키텍처와의 비교를 고려해 보세요. 자세한 분석은 모델 비교 페이지에서 확인할 수 있습니다.