콘텐츠로 건너뛰기

EfficientDet 대 YOLOv9: 아키텍처, 성능 및 에지 배포

컴퓨터 비전 분야는 신경망 설계의 지속적인 혁신으로 발전해 왔습니다. 모델 선택 시 계산 효율성과 탐지 정확도 사이의 적절한 균형을 찾는 것이 핵심입니다. Google EfficientDet는 확장 가능한 아키텍처를 도입하여 2019년 강력한 기준점을 제시했으며, YOLOv9는 2024년 출시되어 프로그래머블 그라디언트 정보(PGI)를 활용해 객체 탐지의 한계를 확장했습니다.

이 가이드는 두 모델 간의 포괄적인 기술적 비교를 제공하며, 생산 환경에 최적화된 견고한 엔드투엔드 솔루션을 제공하는 최신 Ultralytics 프레임워크를 소개합니다.

모델 아키텍처와 혁신

YOLOv9 YOLOv9의 근본적인 메커니즘을 이해하는 것은 이들의 최적 사용 사례를 결정하는 데 YOLOv9

EfficientDet: 컴파운드 스케일링 및 BiFPN

Google 개발한 EfficientDet는 체계적인 확장성과 효율적인 특징 융합에 중점을 둡니다. EfficientNet을 백본으로 활용하며 새로운 특징 네트워크 아키텍처를 도입합니다.

  • 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
  • 조직:Google
  • 날짜 날짜: 2019년 11월 20일
  • 링크:Arxiv, GitHub

주요 아키텍처 특징: EfficientDet는 양방향 피라미드 네트워크(BiFPN)에 크게 의존하여 쉽고 빠르게 다중 스케일 특징 융합을 가능하게 합니다. 이와 함께 네트워크의 해상도, 깊이, 너비를 균일하게 조정하는 복합 스케일링 방식을 사용합니다. 당시 기준으로 높은 정확도를 보였지만, EfficientDet는 구형 TensorFlow 환경에 크게 의존하여 현대적인 배포 파이프라인을 복잡하게 만듭니다.

EfficientDet에 대해 자세히 알아보세요.

YOLOv9: 정보 병목 현상 해결

중화민국 학술원 연구진이 개발한 YOLOv9 데이터가 심층 신경망을 통과할 때 발생하는 정보 저하 문제를 YOLOv9 .

  • 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
  • 조직: 정보 과학 연구소, 아카데미아 시니카
  • 날짜: 2024년 2월 21일
  • 링크:Arxiv, GitHub, 문서

주요 아키텍처 특징: YOLOv9 보조 감독을 제공하기 위해 프로그래머블 그라디언트 정보(PGI)YOLOv9 네트워크 가중치 업데이트를 위해 중요한 데이터가 안정적으로 유지되도록 보장합니다. 또한 매개변수 효율성을 극대화하기 위해 일반화된 효율적 레이어 집계 네트워크(GELAN)를 특징으로 합니다. 이러한 발전에도 불구하고, YOLOv9 후처리 과정에서 비최대 억제(NMS)가 YOLOv9 필요하며, 이는 지연 시간을 추가합니다.

9에 대해 자세히 알아보기

성능 비교

이러한 모델을 평가할 때, 경험적 데이터를 분석하면 특정 하드웨어 요구 사항에 대해 최적의 균형을 제공하는 아키텍처를 결정하는 데 도움이 됩니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

중요 분석

YOLOv9 속도 면에서 세대적 도약을 YOLOv9 . 예를 들어, YOLOv9e는 TensorRT 16.77ms로 55.6% mAP 달성합니다. 이와 대조적으로 EfficientDet-d7은 53. mAP 낮은 mAP 제공하지만 엄청난 지연 시간(128.07ms)으로 인해 실시간 비디오 스트림에 배포하기가 극히 어렵습니다.

생산용 모델 내보내기

아키텍처를 최적화된 형식(예: TensorRT 또는 OpenVINOPyTorch 원시 PyTorch 비해 추론 시간이 크게 단축됩니다.

사용 사례 및 권장 사항

EfficientDet과 YOLOv9 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLOv9 .

EfficientDet을 선택해야 하는 경우

EfficientDet은 다음에 대한 강력한 선택입니다:

  • Google 및 TPU : Google Vision API 또는 TPU 깊이 통합된 시스템으로, EfficientDet가 네이티브 최적화를 제공합니다.
  • 복합 스케일링 연구: 균형 잡힌 네트워크 깊이, 너비 및 해상도 스케일링의 효과를 연구하는 데 초점을 맞춘 학술적 벤치마킹.
  • TFLite 통한 모바일 배포: Android 임베디드 Linux 기기용 TensorFlow 내보내기가 특별히 필요한 프로젝트.

9 선택해야 할 때

YOLOv9 다음에 권장YOLOv9 :

  • 정보 병목 연구: 프로그래머블 그라디언트 정보(PGI) 및 일반화된 효율적 레이어 집계 네트워크(GELAN) 아키텍처를 연구하는 학술 프로젝트.
  • 경사 흐름 최적화 연구: 훈련 과정에서 심층 신경망 레이어에서 발생하는 정보 손실을 이해하고 완화하는 데 초점을 맞춘 연구.
  • 고정밀도 탐지 벤치마킹: YOLOv9 강력한 COCO 성능이 아키텍처 비교를 위한 기준점으로 필요한 시나리오들.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

Ultralytics : YOLO26 선택하기

YOLOv9 EfficientDet가 길을 열었지만, 진정으로 현대적이고 생산 환경에 바로 적용 가능한 프레임워크를 찾는 개발자들은 Ultralytics YOLO , 특히 새로 출시된 YOLO26을 고려해야 합니다.

Ultralytics 강력한 로컬 훈련 스크립트와 클라우드 지원 인터페이스를 결합하여 비교할 수 없는 사용 편의성을 제공합니다. YOLO26은 모델 설계에 있어 대대적인 개편을 의미하며, 많은 상업적 응용 분야에서 기존 아키텍처를 쓸모없게 만들었습니다.

YOLO26 기술적 특징

  • 엔드투엔드 NMS 설계: YOLO26은 후처리 병목 현상을 완전히 제거합니다. 비최대 억제(NMS)를 제거함으로써 배포 그래프가 통합되고 에지 AI 칩에서 본질적으로 더 빠른 성능을 발휘합니다.
  • 최대 43% 빠른 CPU : 임베디드 디바이스에 최적화되어 GPU가 없는 환경에서 YOLOv9 EfficientDet보다 현저히 빠른 성능을 제공합니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 혁신을 비전 AI에 통합한 이 하이브리드 최적화기는 훈련 실행을 안정화시켜 모델이 더 적은 자원으로 더 빠르게 수렴할 수 있도록 합니다.
  • 낮은 메모리 요구 사항: 트랜스포머 기반 아키텍처나 최적화되지 않은 CNN과 달리, YOLO26은 훈련 중 CUDA 소비를 최소화하여 소비자용 하드웨어에서도 더 큰 배치 크기를 사용할 수 있게 합니다.
  • ProgLoss + STAL: 우수한 손실 함수 설계로 소형 물체 탐지 정확도가 획기적으로 향상되어, YOLO26은 항공 촬영 이미지와 IoT 네트워크에 이상적입니다.
  • DFL 제거: 단순화된 구조 설계로 모바일 배포 형식으로의 마찰 없는 전환이 가능합니다.

YOLO26에 대해 더 알아보기

Ultralytics 계의 다른 강력한 옵션으로는 YOLO11YOLOv8가 있으며, 인스턴스 분할자세 추정과 같은 다중 작업 유연성도 제공합니다.

Python 를 활용한 간편한 교육

Ultralytics 개발자 경험을 최우선으로 합니다. 최신 모델 훈련을 단 몇 줄의 코드로 압축합니다. Python.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

실제 응용 분야

이러한 아키텍처 중 선택하는 것은 배포 대상에 크게 좌우됩니다.

  • 레거시 클라우드 배포: EfficientDet는 높은 정확도가 요구되고 엄격한 실시간 제약이 존재하지 않는 오프라인 기반 클라우드 배치 처리에서 널리 사용되었습니다.
  • 학술 연구: YOLOv9 이론적 CNN의 한계를 확장하고 네트워크 레이어를 통한 기울기 흐름을 분석하는 연구자들에게 YOLOv9 흥미로운 선택지이다.
  • 엣지 컴퓨팅과 IoT:YOLO26이 실제 응용 분야에서 우위를 점하고 있습니다. NMS(네트워크 모드 NMS)가 필요 없는 파이프라인과 OBB(지향적 바운딩 박스) 기능을 통해 스마트 시티 교통 분석, 소매 재고 모니터링, 드론 기반 점검 분야에서 탁월한 선택지로 자리매김하며, 높은 정확도와 빠른 추론 속도의 탁월한 균형을 제공합니다.

댓글