콘텐츠로 건너뛰기

EfficientDet 대 YOLOv6.0: 객체 탐지 아키텍처 심층 분석

적절한 객체 탐지 모델을 선택하는 것은 종종 정확도, 지연 시간, 배포 제약 조건 사이의 균형 잡기 작업입니다. 이 비교는 컴퓨터 비전 역사에서 두 가지 중요한 이정표를 살펴봅니다: 2019년 매개변수 효율성을 재정의한 Google 확장 가능한 아키텍처 EfficientDet와, 2023년 고처리량 GPU 최적화된 메이투안의 산업용 등급 탐지기 YOLOv6.YOLOv6.

성능 지표 비교

다음 표는 두 아키텍처 간의 성능 차이를 보여줍니다. EfficientDet는 매개변수 효율성(주어진 정확도 대비 더 작은 모델 크기)에 중점을 두는 반면, YOLOv6. YOLOv6 GPU와 같은 하드웨어 가속기에서의 추론 속도를 우선시합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

효율적 탐지: 확장 가능하고 매개변수 효율적

EfficientDet는 객체 탐지 모델을 효율적으로 확장하는 과제를 해결하기 위해 Google 팀이 제안한 모델입니다. 기존 모델들이 단순히 네트워크를 더 깊게 또는 더 넓게 만드는 방식과 달리, EfficientDet는 해상도, 깊이, 너비를 균일하게 확장하는 복합 확장(Compound Scaling ) 방식을 도입했습니다.

주요 아키텍처 기능

  • BiFPN(가중 양방향 특징 피라미드 네트워크): EfficientDet는 복잡한 특징 융합 경로를 생성합니다. 표준 FPN과 달리 BiFPN은 서로 다른 입력 특징에 학습 가능한 가중치를 도입함으로써 다중 스케일 특징 융합을 용이하게 하여 네트워크가 더 중요한 정보를 우선시하도록 보장합니다.
  • EfficientNet 백본: 이 모델은 부동소수점 연산(FLOPs)과 매개변수 수에 대해 고도로 최적화된 EfficientNet을 백본으로 활용합니다.
  • 복합 스케일링: 간단한 계수 $\phi$가 백본, BiFPN, 클래스/박스 네트워크의 스케일링을 동시에 제어합니다.

복잡성 경고

BiFPN은 수학적으로 우아하고 매개변수 효율적이지만, 불규칙한 메모리 접근 패턴으로 인해 YOLO 발견되는 단순한 컨볼루션 블록에 비해 특정 하드웨어 가속기에서 최적화하기 어려울 수 있습니다.

메타데이터:

EfficientDet에 대해 자세히 알아보세요.

YOLOv6.0: 산업계의 속도 괴물

2023년 메이투안(美团)에서 공개한 YOLOv6. YOLOv6(흔히 "풀스케일 리로딩"이라 불림)은 산업용 애플리케이션을 위해 특별히 설계되었습니다. 저자들은 이론적 FLOPs보다 GPU 상의 실제 추론 속도를 우선시하여, 비디오 분석과 같은 고처리량 시나리오에서 탁월한 성능을 발휘하는 모델을 구현했습니다.

주요 아키텍처 기능

  • RepBi-PAN: 이 업데이트된 목 구조는 RepVGG 스타일 블록을 채택합니다. 훈련 중에는 더 나은 기울기 흐름을 위해 다중 분기 토폴로지를 가집니다. 추론 시에는 구조적으로 단일 3x3 컨볼루션으로 재매개변수화되어 지연 시간을 획기적으로 줄입니다.
  • 앵커 보조 훈련(AAT): YOLOv6 근본적으로 앵커 프리 탐지기이지만, v3.0에서는 추론 속도에 영향을 주지 않으면서 수렴을 안정화하고 정확도를 향상시키기 위해 훈련 중 보조 앵커 기반 분기를 도입했습니다.
  • 분리된 헤드: 분류 및 회귀 작업이 서로 다른 분기로 분리되는 설계 선택으로, 이 두 목표 간의 상충을 해결하기 위해 현대 탐지기에서 표준이 된 방식이다.

메타데이터:

6에 대해 자세히 알아보기

비교 분석

지연 시간 및 처리량

YOLOv6.YOLOv6 GPU 현저히 빠른 성능을 보입니다. 표에서 확인할 수 있듯이, YOLOv6.YOLOv6 TensorRT 단 8.95ms에 불과한 상태에서 52. mAP 달성합니다. 반면 EfficientDet-d6은 비슷한 52.6% mAP 89.29ms가소요되어 사실상 10배 이상 느립니다. 이로 인해 NVIDIA 또는 Jetson 장치에서 실시간 처리가 필요한 애플리케이션에서는 YOLOv6 확실한 YOLOv6 .

매개변수 효율성

EfficientDet은 저장 공간이 주요 병목 현상인 환경에서 탁월한 성능을 발휘합니다. EfficientDet-d0은390만 개의 mAP 34.6 mAP 준수한 mAP 제공합니다. 이는 YOLOv6 낮은 수치입니다. 학술 연구나 극도로 제한된 저장 공간 환경(예: 소형 모바일 앱 패키지에 모델을 직접 임베딩하는 경우)에서는 EfficientDet의 작은 메모리 사용량이 여전히 유의미합니다.

교육 및 사용성

EfficientDet는 구형 TensorFlow 생태계에 의존하는데, 이는 현대적인 PyTorch 워크플로에 통합하기 번거로울 수 있습니다. 훈련 과정에서는 복합 스케일링을 위한 복잡한 하이퍼파라미터 튜닝이 종종 필요합니다. YOLOv6. YOLOv6 보다 현대적인 훈련 방식을 제공하지만, 객체 탐지에 집중되어 있어 핵심 릴리스에서 분할이나 자세 추정 같은 다른 작업에 대한 기본 지원이 부족합니다.

Ultralytics 이점

이러한 아키텍처를 연구하는 것은 귀중한 통찰력을 제공하지만, 현대적인 개발에는 통합 플랫폼이 필요합니다. Ultralytics 머신러닝 라이프사이클 전체에 초점을 맞춰 개별 모델 아키텍처를 뛰어넘는 포괄적인 생태계를 Ultralytics .

왜 Ultralytics 전환해야 할까요?

  • 탁월한 다용도성: 주로 객체 YOLOv6 EfficientDet 및 YOLOv6 달리, Ultralytics 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB), 분류를 기본적으로 지원합니다.
  • 사용 편의성: 일관된 Python 통해 단일 문자열 변경만으로 모델 세대 간 전환(예: YOLO11 )이 가능합니다.
  • 메모리 효율성: Ultralytics 훈련 중 VRAM 사용량을 줄이도록 최적화되어 있어, 메모리 집약적인 EfficientDet 아키텍처에 비해 소비자용 GPU에서 더 큰 배치 크기를 허용합니다.

YOLO26 등장: 새로운 표준

최첨단을 추구하는 개발자들에게 YOLO26은 효율성과 성능의 정점을 보여줍니다. 2026년 1월 출시된 이 모델은 EfficientDet(속도)와 YOLOv6 CPU )의 한계를 모두 해결합니다.

YOLO26의 혁신:

  • 엔드투엔드 NMS 프리: 비최대 억제(NMS)를 제거함으로써 YOLO26은 배포 로직을 단순화하고 추론 지연 시간 편차를 줄입니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 얻은 이 하이브리드 최적화기는 훈련 과정을 안정화하고 수렴 속도를 가속화합니다.
  • 가장자리 최적화: 분포 초점 손실(DFL) 제거 및 특정 아키텍처 조정으로 YOLO26은 CPU 추론 이전 세대 대비 최대 43% 더 빠르며, EfficientDet가 종종 어려움을 겪는 라즈베리 파이 및 모바일 배포 환경에서 우수한 성능을 발휘합니다.
  • 고급 손실 함수: ProgLoss와 STAL의 통합은 드론 영상 및 IoT 센서에 필수적인 소형 물체 탐지 성능을 크게 향상시킵니다.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

YOLO26에 대해 더 알아보기

사용 사례 권장 사항

  • 다음과 같은 경우 EfficientDet를 선택하십시오: 특징 융합 스케일링에 대한 학술 연구를 수행 중이거나 모델 가중치 크기(MB)가 엄격한 제약 조건인 기존 TensorFlow 다루고 있는 경우.
  • 다음과 같은 경우 YOLOv6.0을 선택하십시오: NVIDIA (예: T4 또는 A10)에만 배포하며, 표준 객체 탐지에 대한 순수 처리량(FPS)이 유일한 지표인 경우.
  • Ultralytics 선택해야 하는 경우: * GPU 균형을 맞춘 즉시 사용 가능한 솔루션이 필요할 때 * 복잡한 후처리(NMS)가 필요하지 않을 때 * 단순 탐지(세그멘테이션 또는 OBB 등)를 넘어선 작업을 수행해야 할 때 * 간소화된 훈련 워크플로가 요구될 때

현대 객체 탐지기를 더 깊이 탐구하려면 YOLOv8 비교 분석이나 실시간 탐지 트랜스포머(RT-DETR)의 성능에 관한 글을 읽어보시기 바랍니다.


댓글