EfficientDet 대 YOLOv9: 기술 비교
최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 컴퓨팅 리소스의 균형을 맞추는 컴퓨터 비전 작업에 매우 중요합니다. 이 페이지에서는 객체 감지 분야의 두 가지 중요한 모델인 Google의 EfficientDet과 Ultralytics YOLOv9 간의 자세한 기술 비교를 제공합니다. 프로젝트에 대한 정보에 입각한 결정을 내리는 데 도움이 되도록 아키텍처 설계, 성능 벤치마크 및 적합한 애플리케이션을 자세히 살펴보겠습니다.
EfficientDet: 확장 가능하고 효율적인 아키텍처
EfficientDet은 2019년 Google Research의 연구원들에 의해 소개되었으며, 곧 효율적인 객체 감지의 벤치마크가 되었습니다. 체계적인 복합 확장 방법을 사용하여 경량의 엣지 호환 버전부터 고정확도의 클라우드 기반 버전까지 확장할 수 있는 모델 제품군을 제안했습니다.
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organization: Google
- 날짜: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- 문서: https://github.com/google/automl/tree/master/efficientdet#readme
아키텍처 및 주요 기능
EfficientDet 아키텍처는 세 가지 주요 구성 요소를 기반으로 구축되었습니다.
- EfficientNet Backbone: 특징 추출을 위해 매우 효율적인 EfficientNet을(를) 백본으로 사용하며, 이는 정확도와 FLOPs 모두에 최적화하기 위해 NAS(신경망 아키텍처 검색)을 사용하여 설계되었습니다.
- BiFPN (Bi-directional Feature Pyramid Network): EfficientDet은 기존 FPN 대신 BiFPN을 사용하여 가중치가 적용된 연결을 통해 더욱 풍부한 다중 스케일 특징 융합을 가능하게 하여 최소한의 계산 오버헤드로 정확도를 향상시킵니다.
- Compound Scaling: 백본, 특징 네트워크 및 검출 헤드의 깊이, 너비 및 해상도를 균일하게 조정하는 새로운 방법입니다. 이를 통해 다양한 리소스 제약 조건을 충족하는 모델 패밀리(D0~D7)를 만들 수 있습니다.
강점
- 확장성: EfficientDet의 주요 강점은 모바일 장치에서 데이터 센터에 이르기까지 다양한 배포 대상을 위한 광범위한 옵션을 제공하는 모델 제품군입니다.
- 효율성 개척: 출시 당시 경쟁 모델보다 더 적은 파라미터와 FLOP으로 높은 정확도를 달성하여 효율성에 대한 새로운 표준을 세웠습니다.
약점
- 수명 및 성능: 기본적인 아키텍처이지만 2019년에 출시되었습니다. YOLOv9과 같은 최신 모델은 특히 GPU와 같은 최신 하드웨어에서 속도와 정확도 모두에서 이를 능가합니다.
- 추론 속도: 더 큰 EfficientDet 모델은 특히 YOLO 모델의 고도로 최적화된 추론 속도와 비교할 때 느릴 수 있습니다.
- Task Specificity: EfficientDet은 순수하게 객체 탐지를 위해 설계되었으며 최신 프레임워크에서 볼 수 있는 인스턴스 분할 또는 포즈 추정과 같은 다른 작업에 대한 기본 제공 다기능성이 부족합니다.
- Ecosystem: 공식 리포지토리는 사용자 경험에 덜 집중되어 있으며 포괄적인 Ultralytics 에코시스템만큼 활발하게 유지 관리되거나 지원되지 않습니다.
사용 사례
EfficientDet은 여전히 다음과 같은 경우에 실행 가능한 옵션입니다.
- 확장된 변형(D0-D7) 중 하나가 제공하는 특정 균형점이 완벽하게 들어맞는 애플리케이션.
- CPU에서 배포가 필요한 프로젝트에서 더 작은 모델이 경쟁력 있는 성능을 보입니다.
- 모델이 이미 통합되어 있고 적절하게 작동하는 레거시 시스템.
YOLOv9: 최첨단 정확도 및 효율성
Chien-Yao Wang과 Hong-Yuan Mark Liao가 2024년에 소개한 Ultralytics YOLOv9은(는) 실시간 객체 감지의 중요한 발전을 나타냅니다. 혁신적인 아키텍처 요소를 통해 심층 네트워크에서 정보 손실 문제를 해결하여 새로운 최첨단 벤치마크를 설정합니다.
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- 문서: https://docs.ultralytics.com/models/yolov9/
아키텍처 및 주요 기능
YOLOv9의 뛰어난 성능은 두 가지 주요 혁신에서 비롯됩니다.
- 프로그래밍 가능한 기울기 정보 (PGI): 이 개념은 심층 신경망의 정보 병목 현상 문제를 해결하도록 설계되었습니다. PGI는 안정적인 기울기를 생성하여 모델이 완전한 정보를 학습할 수 있도록 보장하여 보다 정확한 특징 표현을 유도합니다.
- Generalized Efficient Layer Aggregation Network (GELAN): YOLOv9는 CSPNet 및 ELAN의 원리를 기반으로 구축된 새롭고 매우 효율적인 아키텍처인 GELAN을 도입했습니다. 파라미터 활용도와 계산 효율성을 최적화하여 모델이 더 적은 리소스로 더 높은 정확도를 달성할 수 있습니다.
강점
- 최첨단 정확도: YOLOv9는 객체 감지에서 뛰어난 정확도를 달성하며, "YOLOv9: 프로그래밍 가능한 기울기 정보를 사용하여 원하는 것을 학습하기" 논문에 자세히 설명된 바와 같이 유사하거나 더 낮은 파라미터 수에서 EfficientDet과 같은 경쟁 모델보다 뛰어난 성능을 보입니다.
- 탁월한 성능 균형: 정확도, 추론 속도 및 모델 크기 간에 뛰어난 균형을 제공하므로 에지 AI에서 고성능 클라우드 서버에 이르기까지 광범위한 애플리케이션에 적합합니다.
- 사용 편의성: Ultralytics 프레임워크 내에서 사용될 때 YOLOv9는 간소화된 사용자 경험, 간단한 Python API 및 광범위한 설명서의 이점을 누릴 수 있습니다.
- 잘 관리되는 에코시스템: Ultralytics 에코시스템은 활발한 개발, 크고 지원적인 커뮤니티, 잦은 업데이트, 노코드 학습 및 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 제공합니다.
- 학습 효율성: YOLO 모델은 일반적으로 다른 아키텍처에 비해 학습 중에 더 낮은 메모리 요구 사항을 갖습니다. 프레임워크는 효율적인 학습 프로세스와 즉시 사용 가능한 사전 학습된 가중치를 제공합니다.
- 다양성: 원본 논문은 탐지에 중점을 두지만, 기본 GELAN 아키텍처는 다재다능합니다. 원본 저장소는 인스턴스 분할 및 파놉틱 분할과 같은 작업에 대한 지원을 제공하며, 이는 YOLOv8과 같은 다른 Ultralytics 모델의 멀티태스킹 기능과 일치합니다.
약점
- 참신성: 최신 모델이므로 실제 배포 예제는 EfficientDet과 같이 기존 모델보다 적을 수 있지만 Ultralytics 커뮤니티 내에서의 채택은 빠르게 진행되고 있습니다.
- 학습 리소스: YOLOv9는 성능 수준에 비해 계산 효율적이지만, 가장 큰 YOLOv9 변형 모델(예: YOLOv9-E)을 학습하려면 여전히 상당한 컴퓨팅 리소스가 필요할 수 있습니다.
사용 사례
YOLOv9은 특히 정확도와 효율성이 가장 중요한 애플리케이션에 적합합니다(예:).
- 위성 이미지와 같은 고해상도 이미지 분석.
- 자율 주행 차량 및 로봇 공학에 필요한 복잡한 장면 이해.
- 제조업의 품질 관리와 같은 작업을 위한 정밀 객체 인식.
성능 분석: YOLOv9 vs. EfficientDet
다음 표는 COCO 데이터 세트에서 벤치마킹된 EfficientDet과 YOLOv9의 다양한 모델 크기에 대한 성능 지표의 직접적인 비교를 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
데이터에서 다음과 같은 몇 가지 주요 통찰력이 나타납니다.
- 정확도 및 효율성: YOLOv9은 일관되게 더 나은 균형을 제공합니다. 예를 들어 YOLOv9-C는 EfficientDet-D6(52.6)보다 파라미터와 FLOPs가 대략 절반이면서 더 높은 mAP(53.0)를 달성합니다.
- 추론 속도: TensorRT로 최적화된 최신 GPU에서 YOLOv9 모델은 훨씬 더 빠릅니다. YOLOv9-E는 EfficientDet-D7보다 7배 이상 빠르면서도 정확도가 더 높습니다. 가장 작은 YOLOv9t 모델조차도 가장 작은 EfficientDet-d0보다 훨씬 빠릅니다.
- 리소스 사용량: YOLOv9 모델은 파라미터 효율성이 더 높습니다. YOLOv9-S(710만 파라미터)는 EfficientDet-D3(1,200만 파라미터)의 정확도를 능가합니다. 이러한 효율성은 리소스가 제한된 장치에 배포하는 데 매우 중요합니다.
결론 및 권장 사항
EfficientDet은 효율성의 경계를 넓힌 획기적인 모델이었지만, 컴퓨터 비전 분야는 빠르게 발전했습니다. 오늘날 시작하는 새로운 프로젝트의 경우 YOLOv9가 명확한 선택입니다. 최첨단 정확도, 최신 하드웨어에서 뛰어난 추론 속도 및 더 뛰어난 계산 효율성을 제공합니다.
Ultralytics 생태계에 YOLOv9를 통합하면 훈련에서 배포에 이르기까지 전체 워크플로를 가속화하는 사용자 친화적이고 잘 지원되며 다재다능한 프레임워크를 개발자에게 제공하여 이점을 더욱 강화합니다. EfficientDet은 역사적으로 중요한 모델로 남아 있으며 레거시 시스템을 유지 관리하는 데 적합할 수 있지만 새로운 고성능 애플리케이션의 경우 YOLOv9가 결정적인 우위를 제공합니다.
다른 모델 살펴보기
다른 최첨단 모델을 탐색하는 경우 다른 비교 페이지도 확인하십시오.