콘텐츠로 건너뛰기

EfficientDet 대 YOLO11: 포괄적인 기술 비교

최적의 신경망 아키텍처를 선택하는 것은 성공적인 컴퓨터 비전 애플리케이션의 기초입니다. 이 포괄적인 가이드는 Google EfficientDet와 Ultralytics YOLO11의 심층적인 기술적 비교를 제공하며, 두 아키텍처의 차이점, 성능 지표 및 이상적인 배포 시나리오를 분석합니다.

엣지 AI 장치에서 밀리초 단위의 지연 시간을 목표로 하든, 클라우드 기반 추론에 확장 가능한 정확도가 필요하든, 이러한 모델의 미묘한 차이를 이해하는 것이 중요합니다.

모델 프로필 및 기술적 세부사항

각 아키텍처의 계보와 근본적인 설계 철학을 이해하는 것은 실제 객체 탐지 작업에서의 성능을 맥락화하는 데 도움이 됩니다.

EfficientDet

Google 연구진이 개발한 EfficientDet는 새로운 양방향 피라미드 특징 네트워크(BiFPN)와 함께 객체 탐지 네트워크를 확장하는 체계적인 접근법을 제시했다.

EfficientDet에 대해 자세히 알아보세요.

YOLO11

YOLO11 실시간 성능, 매개변수 효율성 및 다중 작업 학습의 한계를 뛰어넘으며 Ultralytics 계에서 중요한 진화를 YOLO11 .

YOLO11에 대해 자세히 알아보세요

아키텍처 비교

이 두 모델 간의 구조적 차이는 수년에 걸친 설계 전략의 분화를 부각시킨다.

EfficientDet는 EfficientNet 백본을 활용하며 상향식 및 하향식 다중 스케일 특징 융합을 가능하게 하는 BiFPN을 도입합니다. 이 방법은 모든 백본, 특징 네트워크, 박스/클래스 예측 네트워크에 대해 해상도, 깊이, 너비를 동시에 균일하게 조정하는 복합 스케일링 기법을 사용합니다. 평균 정밀도(mAP) 극대화에 매우 효과적이지만, BiFPN의 복잡한 라우팅은 추론 과정에서 메모리 대역폭 병목 현상을 유발할 수 있습니다.

반면 YOLO11 최적화된 C2f 모듈과 고급 앵커 프리 탐지 헤드를 활용합니다. 이 간소화된 접근 방식은 특징 추출 과정에서의 오버헤드를 최소화합니다. Ultralytics YOLO11 GPU 활용도를 YOLO11 Ultralytics , 기존 아키텍처나 무거운 트랜스포머 모델에 비해 훈련 및 추론 시 모두 메모리 요구량을 현저히 낮췄습니다.

다중 작업 유연성

EfficientDet은 순수한 객체 탐지 모델인 반면, YOLO11 극도의 다용도성을 YOLO11 . 단일 YOLO11 인스턴스 세그멘테이션, 이미지 분류, 자세 추정, 방향성 바운딩 박스(OBB)를 기본적으로 지원합니다.

성능 벤치마크

아래 표는 COCO 데이터셋에서 다양한 규모에 걸쳐 두 모델 계열의 성능을 비교합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

균형 잡힌 분석: 강점과 약점

GPU : YOLO11 GPU YOLO11 GPU YOLO11 . 예를 들어, GPU 경우 YOLO11m은 4.7ms라는 놀라운 속도로 51. mAP 달성합니다. TensorRT을 활용하여 51.5 Ultralytics 의 mAP를 4.7ms라는 놀라운 속도로 달성합니다. 비슷한 정확도를 달성하기 위해 EfficientDet-d5는 67.86ms가 소요되어 14배 이상 느립니다. 이는 실시간 Ultralytics 위한 Ultralytics 성능 균형을 보여줍니다.

CPU CPU : EfficientDet은 d0 및 d1과 같은 소형 변형에서 ONNX을 사용하여 매우 최적화된 CPU GPU 속도를 보여줍니다. 그러나 d7과 같은 더 큰 변종에서는 GPU 페널티를 크게 발생시키지 않고 정확도를 확장하는 데 어려움을 겪습니다.

교육 방법론 및 에코시스템

개발자 경험은 모델의 이론적 성능만큼이나 중요합니다. 바로 이 점에서 Ultralytics 빛을 발합니다.

EfficientDet는 기존 TensorFlow 생태계와 복잡한 AutoML 라이브러리에 크게 의존합니다. 맞춤형 훈련 파이프라인을 설정하려면 가파른 학습 곡선, 복잡한 종속성 관리, 앵커와 손실 함수의 수동 구성이 필요합니다.

반대로, Ultralytics 비교할 수 없는 사용 편의성을 Ultralytics . 잘 관리된 PyTorch 지원을 받아 YOLO 훈련에는 단 몇 줄의 코드만 필요합니다. 이 프레임워크는 하이퍼파라미터 튜닝, 고급 데이터 증강, 최적의 학습률 스케줄링을 기본적으로 자동으로 관리합니다.

코드 예시: Ultralytics 시작하기

이 견고하고 즉시 사용 가능한 코드 조각은 Python 내에서 훈련과 추론이 얼마나 간편한지 보여줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

이상적인 사용 사례

EfficientDet 사용 시점: TensorFlow 깊숙이 자리 잡은 연구 환경이나 d0 같은 초기 아키텍처가 충분히 성능을 발휘하는 특정 CPU 제약 조건에서는 EfficientDet이 여전히 유효한 선택지입니다.

YOLO11 사용 시점: YOLO11 현대적인 기업 배포 환경에 최적의YOLO11 . 탁월한 처리 속도로 자율주행 차량, 실시간 스포츠 분석, 대량 생산 결함 검출에 완벽합니다. 또한 낮은 메모리 사용량으로 NVIDIA 같은 리소스 제약 하드웨어에서도 유연한 배포가 가능합니다.

앞으로의 전망: YOLO26 업그레이드

YOLO11 탁월한 성능을 YOLO11 Ultralytics YOLO11 , 신규 프로젝트를 시작하는 개발자들은 검증된 YOLOv8 이나 새로 출시된 YOLO26과 같은 다른 YOLO11 아키텍처를 평가해야 합니다. 2026년 초에 출시된 YOLO26은 YOLO11 기반을 바탕으로 YOLO11 같은 획기적인 혁신을 도입했습니다:

  • 엔드투엔드 NMS 설계: YOLOv10의 유산을 바탕으로, YOLO26은 후처리 과정에서 비최대 억제(NMS)를 완전히 제거하여 지연 시간을 대폭 줄이고 배포 파이프라인을 단순화합니다.
  • MuSGD 최적화기: 표준 SGD 뮤온(대규모 언어 모델 훈련에서 영감을 얻음) SGD 결합한 하이브리드 최적화기로, 훈련 안정성을 획기적으로 향상시킵니다.
  • 최대 43% 빠른 CPU : 특정 최적화를 통해 YOLO26은 별도의 GPU가 없는 에지 디바이스에서도 놀라울 정도로 강력한 성능을 발휘합니다.
  • ProgLoss + STAL: 항공 촬영 및 로봇 공학에 중요한 소형 물체 탐지 성능을 획기적으로 향상시키는 고급 손실 함수.

비전 아키텍처의 더 넓은 지형을 탐구해 보세요. 여기에는 다음과 같은 트랜스포머 기반 탐지기가 포함됩니다. RT-DETR와 같은 트랜스포머 기반 탐지기를 포함한 Ultralytics 아키텍처의 광범 Ultralytics 포괄적인 Ultralytics 살펴보세요.


댓글