콘텐츠로 건너뛰기

효율적 탐지(EfficientDet) 대 YOLOv7: 실시간 객체 탐지의 진화

컴퓨터 비전 분야의 발전은 정확성과 계산 효율성 사이의 균형을 지속적으로 추구해온 결과로 형성되었습니다. 이러한 진화 과정에서 두 가지 뚜렷한 철학이 나타났는데, 확장 가능한 효율성에 초점을 맞춘 모델 계열인 EfficientDet와YOLOv7가 대표합니다.

이 비교는 두 영향력 있는 모델의 기술 사양, 아키텍처 차이점 및 성능 지표를 탐구하면서, YOLO26과 같은 현대적 솔루션이 개발자들에게 새로운 표준이 된 이유를 강조합니다.

EfficientDet: 확장 가능한 효율성

2019년 말 출시된 EfficientDet는 이전 탐지기의 비효율성을 해결하기 위해 설계되었으며, 이러한 탐지기는 종종 수동으로 또는 비균일하게 스케일링이 수행되었습니다. 이 탐지기는 해상도, 깊이, 너비를 동시에 스케일링하는 체계적인 방법을 도입했습니다.

기술 개요

아키텍처 및 주요 기능

EfficientDet는 가중치 양방향 피라미드 특징 네트워크(BiFPN)와 결합된 EfficientNet 백본을 활용합니다. BiFPN은 다양한 입력 특징이 출력에 불균등하게 기여하는 불균형을 보정하며, 쉽고 빠르게 다중 스케일 특징 융합을 가능하게 합니다.

이 모델은 백본 네트워크, BiFPN, 클래스/박스 네트워크 및 해상도를 확장하기 위해 간단한 계수를 사용하는 복합 스케일링( Compound Scaling)을 채택합니다. 이 접근법은 주어진 매개변수 수(FLOPs)에 대해 높은 정확도를 제공하지만, BiFPN 레이어의 복잡한 상호 연결은 이러한 불규칙한 메모리 접근 패턴에 특별히 최적화되지 않은 하드웨어에서 더 높은 추론 지연 시간을 초래할 수 있습니다.

YOLOv7: "Bag-of-Freebies" 강자

2022년 7월 출시된 YOLOv7 YOLO You Only Look Once) 계열에서 중대한 도약을 YOLOv7 . EfficientDet가 매개변수 효율성에 중점을 둔 것과 달리, YOLOv7 추론 속도에 YOLOv7 표준 GPU 실시간 객체 탐지가 가능했던 한계를 뛰어넘었습니다.

기술 개요

아키텍처 및 주요 기능

YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)를 YOLOv7 . 이 아키텍처는 가장 짧고 긴 기울기 경로를 제어하여 네트워크가 원래 기울기 경로를 파괴하지 않으면서 더 다양한 특징을 학습할 수 있도록 합니다.

YOLOv7 핵심 개념은 "훈련 가능한 프리비즈 백(trainable bag-of-freebies)" YOLOv7 , 추론 비용을 증가시키지 않으면서 훈련 중 정확도를 향상시키는 최적화 YOLOv7 . 여기에는 복잡한 훈련 구조를 배포를 위해 간소화된 컨볼루션 집합으로 단순화하는 모델 재매개변수화 같은 기법이 포함됩니다. 이를 통해 훈련 과정은 견고하면서도 최종 배포 모델은 매우 빠르게 동작하도록 보장합니다.

7에 대해 자세히 알아보기

성능 비교

다음 표는 다양한 EfficientDet 및 YOLOv7 성능을 비교합니다. EfficientDet 모델(d0-d7) YOLOv7 우수한 매개변수 효율성을 보이지만, 표준 하드웨어에서의 지연 시간은 고속 GPU 최적화된 YOLOv7 현저히 높습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

메트릭 분석

데이터는 중요한 차이점을 부각합니다: 지연 시간 대 FLOPs. EfficientDet-d7은 높은 53.7% mAP 달성하지만, GPU 128ms가 넘는 지연 시간을 보입니다. 반면 YOLOv7x는 비슷한 53.1% mAP 달성하면서도 단 11.57ms로 실행됩니다—10배 이상 빠른 속도입니다. 자율주행차나 영상 분석과 같은 실제 응용 분야에서는 이러한 속도 우위가 종종 결정적인 요소가 됩니다.

지연 시간은 중요합니다

FLOPs(부동소수점 연산)은 복잡성을 측정하는 좋은 이론적 지표이지만, 항상 추론 속도와 선형적으로 연관되지는 않습니다. BiFPN과 같은 아키텍처는 높은 메모리 접근 비용으로 인해 실제 실행 속도가 느려질 수 있는 반면, YOLO 단순한 CNN 구조는 GPU 처리에 매우 최적화되어 있습니다.

Ultralytics 이점: 에코시스템 및 사용성

모델 선택은 종종 순수한 지표만큼이나 소프트웨어 생태계에 달려 있습니다. 이 점에서 Ultralytics 전환은 기존 저장소에 비해 상당한 이점을 제공합니다.

간소화된 사용자 경험

EfficientDet는 최신 PyTorch에 통합하기 어려울 수 있는 구형 TensorFlow 에 의존합니다. PyTorch 워크플로에 통합하기 어려울 수 있습니다. 반면 Ultralytics 모델 훈련, 검증 및 배포를 간단하고 표준화된 작업으로 처리하는 통합 Python Ultralytics .

교육 효율성 및 메모리

Ultralytics YOLO 주요 장점 중 하나는 메모리 요구 사항입니다. 최적화된 데이터 로더와 효율적인 아키텍처 설계 덕분에 YOLO 일반적으로 복잡한 다중 분기 네트워크에 비해 훈련 중 더 적은 CUDA 소비합니다. 이를 통해 개발자는 더 큰 배치 크기를 사용할 수 있어 훈련이 안정화되고 수렴 속도가 빨라집니다.

from ultralytics import YOLO

# Load a model (YOLOv7 or newer)
model = YOLO("yolov7.pt")

# Train the model with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

탐지 불가능한 다재다능함

EfficientDet는 주로 객체 탐지기를 지향하지만, Ultralytics 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB) 등 더 광범위한 작업을 지원합니다. 이러한 다용도성은 팀이 다양한 컴퓨터 비전 과제에 단일 프레임워크를 활용할 수 있음을 의미합니다.

새로운 표준: YOLO26

YOLOv7 2022년 기술의 정점을 YOLOv7 , 이 분야는 빠르게 진화하고 있습니다. 신규 프로젝트에는 2026년 1월 출시된 YOLO26을 권장합니다. 이 모델은 이전 세대의 강점을 계승하면서도 근본적인 아키텍처 변화를 도입했습니다.

  • 엔드투엔드 NMS 설계: YOLOv7 EfficientDet와 달리, YOLO26은 비최대 억제(NMS) 후처리 없이도 본질적으로 엔드투엔드 방식으로 작동합니다. 이는 지연 시간 병목 현상을 제거하고 배포 로직을 단순화하는 획기적인 발전으로, YOLOv10에서 개척한 획기적인 성과입니다.
  • MuSGD 최적화기: Moonshot AI의 Kimi K2에서 영감을 받아 개발된 이 최적화기는 SGD 안정성과 Muon의 속도를 SGD 대규모 언어 모델( LLM ) 훈련의 혁신을 비전 작업에 적용합니다.
  • 향상된 에지 성능: 분포 초점 손실(DFL) 제거 및 특정 최적화를 통해 YOLO26은 CPU 최대 43% 더 빠른 속도를 보여, 라즈베리 파이 또는 휴대폰과 같은 에지 디바이스에서 EfficientDet보다 훨씬 우수한 성능을 발휘합니다.
  • ProgLoss + STAL: 새로운 손실 함수는 소형 물체 인식 성능을 크게 향상시켜 기존 원단계 탐지기의 일반적인 약점을 해결합니다.

YOLO26에 대해 더 알아보기

실제 응용 분야

EfficientDet을 선택해야 하는 경우

EfficientDet는TensorFlow 깊이 통합된 레거시 시스템이나 복합 스케일링에 대한 특정 학술 연구에 여전히 유용합니다. 디스크 저장 공간(모델 가중치 크기, MB 단위)이 실행 속도보다 주요 제약 조건인 경우, 그 소형 변형체(d0-d2) 역시 유용하게 활용될 수 있습니다.

7 선택해야 할 때

YOLOv7 다음과 같은 요건을 필요로 하는 기존 생산 파이프라인에 탁월한 YOLOv7 :

  • 비디오 분석: 보안 또는 소매 인사이트를 위한 고프레임률 스트림 처리.
  • 로봇공학: 저지연이 내비게이션에 중요한로봇공학 분야에 컴퓨터 비전 통합.
  • 일반 탐지: 성숙하고 광범위하게 지원되는 아키텍처가 필요한 시나리오.

YOLO26로 업그레이드할 시점

YOLO26은 사실상 모든 신규 배포에 이상적인 선택으로, 다음과 같은 장점을 제공합니다:

  • 엣지 컴퓨팅: IoT 및 모바일 애플리케이션을 위한 우수한 CPU .
  • 복잡한 작업: 세분화, 자세 및 OBB에 대한 네이티브 지원.
  • 간소화된 작업: NMS 없는 설계로 후처리 및 내보내기 과정에서 발생하는 주요 문제를 제거하여, 훈련 중 확인한 내용이 배포 시 정확히 동일하게 구현되도록 보장합니다.

최첨단을 유지하고자 하는 연구자와 개발자에게 YOLO26을 활용한 Ultralytics 전환은 훈련 안정성, 모델 효율성, 배포 유연성 측면에서 최신 기술 발전을 활용할 수 있는 기회를 제공합니다.


댓글