콘텐츠로 건너뛰기

EfficientDet 대 YOLOv9: 아키텍처와 성능 비교

컴퓨터 비전 분야의 급속한 발전 속에서, 적절한 객체 탐지 아키텍처를 선택하는 것은 훈련 비용부터 배포 지연 시간에 이르기까지 모든 것에 영향을 미치는 중대한 결정입니다. 본 기술 분석은 효율적인 확장에 Google 선구적 아키텍처인 EfficientDet와YOLOv9를 종합적으로 비교합니다YOLO

경영진 요약

EfficientDet는 모델 확장 및 특징 융합 분야에서 획기적인 개념을 도입했지만, 현재는 구식 아키텍처로 간주됩니다. 복잡한 BiFPN 레이어에 의존하는 특성상, 현대 하드웨어에서 YOLO 간소화된 설계에 비해 추론 속도가 느려지는 경우가 많습니다.

YOLOv9 는 상당한 도약을 이루며, 훨씬 뛰어난 추론 속도와 함께 더 높은 정확도를 제공합니다. 또한 Ultralytics 일환으로서 YOLOv9 통합된 API, 간소화된 배포, 그리고 강력한 커뮤니티 지원을 통해 YOLOv9 , 이는 생산 환경에 권장되는 선택입니다.

EfficientDet: 확장 가능하고 효율적인 객체 감지

EfficientDet는 객체 탐지기의 효율적인 확장 문제를 해결하기 위해 설계되었습니다. 기존 모델들은 종종 백본을 단순히 더 크게 만드는 방식으로 확장했는데, 이는 해상도, 깊이, 너비 간의 균형을 무시하는 방식이었습니다.

주요 아키텍처 기능

  • 복합 스케일링: EfficientDet은 모든 백본, 특징 네트워크, 박스/클래스 예측 네트워크에 대해 해상도, 깊이, 너비를 균일하게 스케일링하는 복합 스케일링 방법을 제안합니다.
  • BiFPN(양방향 피처 피라미드 네트워크): 다중 스케일 피처 융합을 용이하게 하는 핵심 혁신 기술입니다. 기존 FPN과 달리 BiFPN은 상향 경로를 추가하고 단일 입력만 가진 노드를 제거하며, 학습 가능한 가중치를 도입하여 다양한 입력 피처의 중요도를 파악합니다.
  • 효율적인 백본: 매개변수 효율성을 위해 최적화된 EfficientNet을 백본으로 활용합니다.

저자: Mingxing Tan, Ruoming Pang, Quoc V. Le
소속:Google
날짜: 2019-11-20
링크:Arxiv | GitHub

EfficientDet에 대해 자세히 알아보세요.

YOLOv9: 프로그래밍 가능한 그래디언트 정보

YOLOv9 딥 러닝의 근본적인 문제인 정보 병목 현상을 해결합니다. 데이터가 딥 뉴럴 네트워크의 여러 계층을 통과할 때 정보는 필연적으로 손실됩니다. YOLOv9 프로그래머블 그라디언트 정보(PGI)GELAN이라는 새로운 아키텍처를 통해 이를 YOLOv9 .

주요 아키텍처 기능

  • GELAN(일반화된 효율적 레이어 집계 네트워크): 이 아키텍처는 CSPNet과 ELAN의 장점을 결합합니다. 경사 하강 경로를 최적화하여 모델이 가볍지만 정보가 풍부한 특징을 학습하도록 보장합니다.
  • PGI(Programmable Gradient Information): PGI는 학습 과정을 안내하는 보조 감독 분기를 제공하여, 정확한 탐지에 필요한 핵심 정보를 주 분기가 유지하도록 보장합니다. 이는 복잡한 환경에서 탐지가 어려운 표적을 식별하는 데 특히 유용합니다.
  • 단순성: 이러한 내부적 복잡성에도 불구하고 추론 구조는 간결하게 유지되어 EfficientDet에서 사용된 BiFPN과 관련된 막대한 계산 비용을 피합니다.

저자: 왕젠야오(王建耀) 및 리아오홍위안(廖宏源)
소속기관: 대만 중앙연구원 정보과학연구원
날짜: 2024-02-21
링크:Arxiv | GitHub

9에 대해 자세히 알아보기

기술 성능 비교

이러한 모델들을 비교할 때, 매개변수 효율성과 실제 실행 시간 지연 사이의 상충 관계가 명확해진다. EfficientDet는 매개변수 효율적이지만, 그 복잡한 그래프 구조(BiFPN)는 YOLOv9 사용되는 표준 컨볼루션에 비해 GPU 처리에 덜 친화적이다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

성능 분석

YOLOv9 속도 대비 정확도 측면에서 EfficientDet보다 YOLOv9 우수한 성능을 보입니다. 예를 들어, YOLOv9c는 EfficientDet-d6 (52.6%)과 비슷한 mAP 53.0%)를 달성하지만 GPU 12배 이상 빠르게 실행됩니다 GPU 7.16ms 대 89.29ms). 이로 인해 YOLOv9 실시간 애플리케이션에 더 YOLOv9 .

교육 및 생태계 경험

이러한 아키텍처 간의 주요 차별점은 Ultralytics 제공하는 사용 편의성과 생태계 지원입니다.

효율적 탐색 과제

EfficientDet 훈련은 일반적으로 TensorFlow 탐지 API 또는 기존 저장소를 활용하는 과정을 포함합니다. 이러한 환경은 종속성 충돌로 인해 설정하기 어려울 수 있으며, 자동 혼합 정밀도 훈련이나 간편한 클라우드 로깅 통합과 같은 최신 기능에 대한 지원이 부족한 경우가 많습니다.

Ultralytics 이점

Ultralytics YOLOv9 사용하면 원활한 경험을 제공합니다. 이 생태계는 데이터 증강, 하이퍼파라미터 진화 및 내보내기를 자동으로 처리합니다.

  • 사용 편의성: 몇 줄의 코드만으로 훈련을 시작할 수 있습니다.
  • 메모리 효율성: Ultralytics 훈련 중 VRAM 사용량을 줄이도록 최적화되어 있어, 복잡한 다중 분기 네트워크에 비해 소비자용 GPU에서 더 큰 배치 크기를 허용합니다.
  • 다용도성: 탐지 기능을 넘어, Ultralytics 인스턴스 분할자세 추정 기능을 지원합니다. 이는 표준 EfficientDet 구현체에서 기본적으로 제공되지 않는 기능들입니다.
from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

실제 응용 분야

모델 선택은 다양한 응용 분야의 실현 가능성에 상당한 영향을 미친다.

EfficientDet의 이상적인 사용 사례

  • 학술 연구: 특징 융합 기법 및 복합 스케일링 이론 연구에 유용함.
  • 저전력/저속 시나리오: 레거시 하드웨어가 EfficientNet 백본에 고정 코딩된 매우 특수한 극단적 사례(예: 특정 구형 코랄 TPU)에서는 EfficientDet-Lite 변형이 여전히 유용할 수 있습니다.

YOLOv9의 이상적인 사용 사례

  • 자율 주행: 높은 추론 속도는 안전을 보장하기 위해 입력값을 밀리초 단위로 처리해야 하는 자율주행차에 있어 매우 중요합니다.
  • 소매 분석: 재고 관리와 같은 애플리케이션에서 YOLOv9 유사한 제품을 구분하는 데 필요한 정확성을 YOLOv9 결제 시스템을 지연시키지 않습니다.
  • 의료: 의료 영상 분석에서 PGI 아키텍처는 X선이나 MRI 스캔에서 미세한 이상을 감지하는 데 필요한 세밀한 세부 사항을 보존하는 데 도움이 됩니다.

미래: YOLO26으로 업그레이드하기

YOLOv9 강력한 YOLOv9 불구하고, Ultralytics 비전 AI의 한계를 Ultralytics 넓혀가고 있습니다. 최첨단을 추구하는 개발자들에게 YOLO26은 EfficientDet와 YOLOv9 모두에 비해 상당한 발전을 제공합니다.

YOLO26은 엔드투엔드 NMS(NMS-Free) 설계를 도입하여 비최대 억제(NMS) 후처리 단계가 완전히 불필요해졌습니다. 이로 인해 배포 파이프라인이 단순화되고 추론 속도가 향상되었습니다. 또한 SGD )의 하이브리드 방식인 새로운 MuSGD 최적화기를통해 YOLO26은 더욱 안정적인 훈련과 빠른 수렴 속도를 제공합니다.

에지 배포를 위해 YOLO26은 CPU 속도를 최대 43%까지 가속화하도록 최적화되었으며, 저전력 장치와의 호환성을 높이기 위해 DFL 제거 기능을 포함합니다. 로봇 공학이나 고처리량 영상 분석 작업을 수행하든, YOLO26은 새로운 표준을 제시합니다.

YOLO26의 힘을 탐구하세요

최신 아키텍처에 관심이 있는 사용자를 위해 다음과 같은 자료도 살펴보시길 권합니다 YOLO11RT-DETR 를 살펴보시길 Ultralytics .


댓글