YOLOv9 대 EfficientDet: 종합적인 기술 비교
올바른 객체 감지 모델을 선택하는 것은 컴퓨터 비전 개발에서 중요한 결정이며 애플리케이션의 속도, 정확성 및 리소스 효율성에 직접적인 영향을 미칩니다. 이 가이드에서는 다음과 같은 두 가지 모델을 심층적으로 비교합니다. Ultralytics YOLOv9 과 EfficientDet의 아키텍처 혁신, 성능 메트릭, 최신 배포 시나리오에 대한 적합성을 분석하여 심층적인 기술 비교를 제공합니다.
성능 분석
객체 감지는 빠르게 발전해 왔으며, 최신 아키텍처는 이전 아키텍처보다 훨씬 뛰어난 성능을 발휘합니다. 아래 표는 주요 메트릭을 직접 비교한 것으로, 다음과 같은 발전을 강조합니다. YOLOv9 의 추론 속도와 매개변수 효율성에 관한 주요 지표를 직접 비교한 표입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
주요 요점:
- 속도 우위: YOLOv9 모델은 GPU 하드웨어에서 훨씬 뛰어난 추론 속도를 보여줍니다. 예를 들어, YOLOv9c (53.0% mAP)는 비슷한 정확도의 EfficientDet-d6(52.6% mAP)보다 12배 이상 빠릅니다.
- 파라미터 효율성: YOLOv9 아키텍처는 더 적은 수의 파라미터로 더 높은 정확도를 달성할 수 있습니다. YOLOv9는 710만 개의 파라미터만으로 46.8%의 mAP 달성하는 반면, EfficientDet은 비슷한 정확도 수준인 47.5%에 도달하기 위해 더 큰 D3 변형(12.0만 개의 파라미터)을 필요로 합니다.
- 최첨단 정확도: 가장 큰 모델인 YOLOv9e는 55.6% mAP 높은 기준을 설정하여 가장 무거운 EfficientDet-d7 모델을 능가하는 동시에 지연 시간을 일부만 유지합니다.
YOLOv9: 프로그래밍 가능한 그라데이션 정보의 새로운 시대
2024년 초에 소개된 YOLOv9 YOLO 시리즈의 중요한 도약을 의미합니다. 왕치엔야오와 홍위안 마크 리아오가 개발한 이 기술은 특징 전송 중 정보 손실과 관련된 딥러닝의 근본적인 문제를 해결합니다.
기술 세부 사항:
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직:기관: 대만 학술원 정보 과학 연구소
- 날짜: 2024-02-21
- Arxiv:YOLOv9: 프로그래밍 가능한 그라데이션 정보를 사용하여 학습하고자 하는 것을 학습하기
- GitHub:WongKinYiu/yolov9
- 문서:Ultralytics YOLOv9 문서
아키텍처 혁신
YOLOv9 '정보 병목 현상' 문제를 해결하기 위해 두 가지 핵심 개념을 도입했습니다:
- 프로그래밍 가능한 그라디언트 정보(PGI): 네트워크 가중치를 업데이트하기 위한 안정적인 그라데이션을 생성하여 모델이 심층 레이어 전체에 걸쳐 중요한 정보를 유지하도록 하는 보조 감독 프레임워크입니다.
- 일반화된 효율적인 계층 집계 네트워크(GELAN): CSPNet과 ELAN의 강점을 결합한 새로운 경량 아키텍처입니다. 경사 경로 계획에 우선순위를 두어 정확도 저하 없이 매개변수 효율을 높이고 추론 속도를 높일 수 있습니다.
알고 계셨나요?
GELAN 아키텍처는 하드웨어에 구애받지 않도록 설계되어 하이엔드 GPU뿐만 아니라 컴퓨팅 리소스가 제한된 엣지 디바이스에서도 추론을 최적화할 수 있습니다.
강점 및 사용 사례
- 성능 균형: YOLOv9 속도와 정확도 간의 탁월한 균형을 제공하여 자율 주행 및 비디오 분석과 같은 실시간 추론 애플리케이션에 이상적입니다.
- Ultralytics 에코시스템: Ultralytics 통합은 간소화된 Python API 및 CLI 제공하여 교육, 검증 및 배포를 간소화합니다.
- 트레이닝 효율성: 효율적인 아키텍처 덕분에 YOLOv9 일반적으로 트랜스포머 기반 대안에 비해 트레이닝 중에 더 적은 메모리를 필요로 하므로 일반 소비자급 GPU에서 더 쉽게 커스텀 트레이닝을 수행할 수 있습니다.
코드 예제: Ultralytics 함께 YOLOv9 사용
Ultralytics 패키지를 사용하여 쉽게 추론을 실행하거나 YOLOv9 훈련할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv9c model
model = YOLO("yolov9c.pt")
# Run inference on an image
results = model.predict("path/to/image.jpg")
# Train the model on a custom dataset (e.g., COCO8)
model.train(data="coco8.yaml", epochs=100, imgsz=640)
EfficientDet: 확장 가능한 아키텍처의 선구자
2019년 말 Google Research에서 발표한 EfficientDet은 객체 탐지기를 확장하는 체계적인 방법을 도입한 획기적인 모델입니다. 이 모델은 다양한 리소스 제약 조건에서 효율성을 최적화하는 데 중점을 둡니다.
기술 세부 사항:
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직:조직:Google 리서치
- 날짜: 2019-11-20
- Arxiv:EfficientDet: 확장 가능하고 효율적인 물체 감지
- GitHub:google
건축 하이라이트
EfficientDet은 EfficientNet 백본을 기반으로 구축되었으며 몇 가지 주요 기능을 도입했습니다:
- 양방향 피처 피라미드 네트워크(BiFPN): 기존 FPN과 달리 BiFPN은 다양한 입력 피처에 학습 가능한 가중치를 도입하여 멀티스케일 피처 융합을 쉽게 수행할 수 있습니다.
- 복합 스케일링: 이 방법은 백본, 특징 네트워크, 박스/클래스 예측 네트워크의 해상도, 깊이, 폭을 균일하게 확장하여 다양한 리소스 예산에 맞는 모델 제품군(D0~D7)을 만들 수 있습니다.
강점과 약점
- 확장성: D0-D7 제품군 구조를 통해 사용자는 특정 플롭 예산에 맞는 모델을 선택할 수 있습니다.
- 역사적 의의: 2020년 효율성의 표준을 정립하여 신경 구조 검색의 후속 연구에 큰 영향을 미쳤습니다.
- 레거시 성능: 당시에는 효율적이었지만, EfficientDet은 이제 GPU의 지연 시간 측면에서 YOLOv9 같은 최신 탐지기에 뒤쳐집니다. 깊이별로 분리 가능한 컨볼루션을 많이 사용하기 때문에 FLOP 효율은 높지만, YOLO 아키텍처에 사용되는 최적화된 고밀도 컨볼루션에 비해 NVIDIA T4와 같은 하드웨어에서 추론 속도가 느려지는 경우가 많습니다.
자세한 비교 분석
YOLOv9 EfficientDet 중 하나를 선택할 때는 원시 mAP 외에도 여러 가지 요소가 작용합니다. 다음은 실제 개발 환경에서 이 두 가지를 비교한 분석입니다.
속도 및 지연 시간
가장 뚜렷한 차이점은 추론 속도에 있습니다. YOLOv9 GPU의 대규모 병렬화에 최적화된 GELAN 아키텍처를 활용합니다. 반면, EfficientDet은 복잡한 특징 융합(BiFPN)과 깊이별 분리 가능한 컨볼루션에 의존하기 때문에 가속기에서 메모리 액세스 병목 현상이 발생할 수 있습니다. 성능 표에서 볼 수 있듯이, YOLOv9 모델은 지속적으로 2배에서 10배 더 빠릅니다. TensorRT 에서 비슷한 정확도의 EfficientDet 모델보다 지속적으로 2배에서 10배 더 빠릅니다.
에코시스템 및 사용 편의성
Ultralytics 에코시스템은 YOLOv9 상당한 이점을 제공합니다. EfficientDet은 TensorFlow 환경과 복잡한 설정 스크립트가 필요한 반면, YOLOv9 이를 지원하는 사용자 친화적인 패키지에 통합되어 있습니다:
- 한 줄 설치:
pip install ultralytics - 광범위한 수출 지원: 다음 주소로 원활하게 내보내기 ONNX, TensorRT, CoreML, OpenVINO 등을 통해
model.export()함수. - 적극적인 유지 관리: 잦은 업데이트, 커뮤니티 지원, 개체 추적 및 배포와 같은 작업에 대한 광범위한 가이드가 제공됩니다.
배포 유연성
Ultralytics 학습된 YOLOv9 모델은 TFLite 또는 Edge TPU 같은 형식을 사용하여 엣지 디바이스에 쉽게 배포할 수 있습니다. 자세한 내용은 TFLite 통합 가이드를 확인하세요.
교육 효율성 및 메모리
최신 컴퓨터 비전 모델을 훈련하는 것은 리소스 집약적일 수 있습니다. Ultralytics YOLO 모델은 GPU 메모리를 효율적으로 사용하는 것으로 잘 알려져 있습니다. 따라서 개발자는 구형 아키텍처나 무거운 트랜스포머 기반 모델에 비해 소비자 하드웨어에서 더 큰 배치 크기를 훈련할 수 있습니다. 또한, Ultralytics 즉시 사용 가능한 사전 훈련된 가중치를 제공하므로 EfficientDet을 처음부터 훈련하는 것보다 훨씬 빠르게 수렴하는 전이 학습을 가능하게 합니다.
다용도성
EfficientDet은 엄밀히 말해 오브젝트 탐지기이지만, YOLOv9 (및 더 광범위한 Ultralytics YOLO 제품군)의 아키텍처 원칙은 여러 작업으로 확장할 수 있습니다. Ultralytics 프레임워크가 지원합니다:
이러한 다용도성을 통해 개발자는 다양한 컴퓨터 비전 과제에 단일 통합 API를 사용할 수 있습니다.
결론
대부분의 신규 프로젝트에는 YOLOv9 탁월한 선택입니다. 훨씬 빠른 추론 속도로 최첨단 정확도를 제공하므로 실시간 애플리케이션에 적합합니다. Ultralytics 에코시스템에 통합되어 데이터 준비부터 모델 배포까지 원활한 개발 환경을 보장합니다.
EfficientDet은 복합 확장 및 기능 융합을 이해하는 데 유용한 참조 자료로 남아 있지만 일반적으로 최신 하드웨어의 와트당 성능 및 지연 시간 지표에서는 부족합니다.
최신 컴퓨터 비전 기술을 원하는 개발자는 다음을 살펴봐야 합니다. YOLO11는 이러한 발전을 기반으로 더욱 뛰어난 효율성과 성능을 제공합니다.
다른 모델 살펴보기
더 많은 비교에 관심이 있다면 이러한 관련 모델을 살펴보세요:
- YOLO11 대 YOLOv9: 최신 버전이 YOLOv9 어떻게 개선되었는지 알아보세요.
- RT-DETR: 실시간 시나리오에서 높은 정확도를 제공하는 변압기 기반 검출기입니다.
- YOLOv8: 감지, 세분화 및 포즈 추정을 지원하는 매우 다재다능한 모델 제품군입니다.