EfficientDet vs YOLO11: 포괄적인 기술 비교
최적의 신경망 아키텍처를 선택하는 것은 성공적인 컴퓨터 비전 애플리케이션의 토대입니다. 이 포괄적인 가이드는 Google의 EfficientDet과 Ultralytics YOLO11 사이의 심도 있는 기술적 비교를 제공하며, 아키텍처의 차이점, 성능 지표 및 이상적인 배포 시나리오를 분석합니다.
엣지 AI 장치에서 밀리초 단위의 지연 시간을 목표로 하든, 클라우드 기반 추론을 위한 확장 가능한 정확도가 필요하든, 이러한 모델의 미묘한 차이를 이해하는 것이 매우 중요합니다.
모델 프로필 및 기술 세부 정보
각 아키텍처의 계보와 기본 설계 철학을 이해하면 실제 객체 탐지 작업에서의 성능을 맥락화하는 데 도움이 됩니다.
EfficientDet
Google Brain 연구원들이 개발한 EfficientDet은 새로운 BiFPN(양방향 특징 피라미드 네트워크)과 함께 객체 탐지 네트워크를 확장하는 원칙적인 접근 방식을 도입했습니다.
- 저자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직: Google
- 날짜: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- 문서: https://github.com/google/automl/tree/master/efficientdet#readme
YOLO11
YOLO11은 Ultralytics 생태계의 중요한 진화를 나타내며 실시간 성능, 매개변수 효율성 및 멀티태스킹 학습의 경계를 넓히고 있습니다.
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: https://docs.ultralytics.com/models/yolo11/
아키텍처 비교
이 두 모델 간의 아키텍처 차이는 수년간의 설계 전략 차이를 극명하게 보여줍니다.
EfficientDet은 EfficientNet 백본을 활용하며 하향식 및 상향식 다중 스케일 특징 융합을 가능하게 하는 BiFPN을 도입했습니다. 또한 모든 백본, 특징 네트워크 및 박스/클래스 예측 네트워크의 해상도, 깊이 및 너비를 동시에 균일하게 확장하는 복합 확장 방식을 사용합니다. mAP(평균 정밀도)를 극대화하는 데 매우 효과적이지만, BiFPN의 복잡한 라우팅은 때때로 추론 중에 메모리 대역폭 병목 현상을 일으킬 수 있습니다.
반면 YOLO11은 최적화된 C2f 모듈과 고급 앵커 프리 탐지 헤드를 활용합니다. 이러한 간소화된 접근 방식은 특징 추출 중 오버헤드를 최소화합니다. Ultralytics는 YOLO11이 GPU 하드웨어 활용도를 극대화하도록 설계했으며, 그 결과 구형 아키텍처나 무거운 transformer 모델에 비해 학습 및 추론 시 메모리 요구 사항이 상당히 낮습니다.
EfficientDet은 엄격히 객체 탐지기인 반면, YOLO11은 뛰어난 범용성을 자랑합니다. 단일 YOLO11 아키텍처는 인스턴스 세그멘테이션, 이미지 분류, 자세 추정 및 지향성 경계 상자(OBB)를 기본적으로 지원합니다.
성능 벤치마크
아래 표는 COCO 데이터셋에서 다양한 규모에 걸쳐 두 모델 제품군의 성능을 대조합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
균형 잡힌 분석: 강점과 약점
GPU 가속: YOLO11은 GPU 환경에서 압도적인 성능을 보입니다. 예를 들어, YOLO11m은 TensorRT를 사용하는 T4 GPU에서 4.7ms라는 엄청난 속도로 51.5%의 mAP를 제공합니다. 비슷한 정확도를 달성하기 위해 EfficientDet-d5는 67.86ms가 소요되며, 이는 14배 이상 느린 속도입니다. 이는 실시간 애플리케이션을 위한 Ultralytics 모델의 우수한 성능 균형을 강조합니다.
CPU 환경: EfficientDet은 ONNX를 사용하여 소형 변형(d0 및 d1 등)에서 매우 최적화된 CPU 추론 속도를 보여줍니다. 그러나 d7과 같은 대형 변형에서는 막대한 GPU 지연 시간 페널티 없이 정확도를 확장하기 어렵습니다.
학습 방법론 및 생태계
개발자 경험은 모델의 이론적 성능만큼이나 중요한 경우가 많습니다. 바로 이 점이 Ultralytics 생태계가 빛나는 이유입니다.
EfficientDet은 레거시 TensorFlow 생태계와 복잡한 AutoML 라이브러리에 크게 의존합니다. 사용자 정의 학습 파이프라인을 설정하려면 가파른 학습 곡선, 복잡한 종속성 관리, 앵커 및 손실 함수의 수동 구성이 필요합니다.
반면, Ultralytics는 타의 추종을 불허하는 사용 편의성을 제공합니다. 잘 관리된 PyTorch 생태계를 기반으로 하므로, YOLO 모델을 학습시키는 데 단 몇 줄의 코드만 필요합니다. 이 프레임워크는 하이퍼파라미터 튜닝, 고급 데이터 증강 및 최적의 학습률 스케줄링을 즉시 자동으로 관리합니다.
코드 예제: Ultralytics 시작하기
이 강력하고 프로덕션 준비가 완료된 스니펫은 Python API 내에서 학습 및 추론이 얼마나 간단한지 보여줍니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()이상적인 활용 사례
EfficientDet을 사용해야 할 때: EfficientDet은 TensorFlow 파이프라인에 깊이 관여하는 연구 환경이나 d0와 같은 초기 아키텍처가 충분히 성능을 발휘하는 특정 CPU 제한 환경에서 여전히 유효한 선택입니다.
YOLO11을 사용해야 할 때: YOLO11은 현대적인 엔터프라이즈 배포를 위한 확실한 선택입니다. 뛰어난 속도 덕분에 자율 주행 차량, 실시간 스포츠 분석 및 고처리량 제조 결함 탐지에 완벽합니다. 또한 낮은 메모리 사용량 덕분에 NVIDIA Jetson과 같은 리소스가 제한된 하드웨어에서도 유연하게 배포할 수 있습니다.
미래를 향해: YOLO26 업그레이드
YOLO11은 매우 유능하지만, 새로운 프로젝트를 시작하는 개발자는 검증된 YOLOv8이나 새롭게 출시된 YOLO26과 같은 다른 Ultralytics 아키텍처를 고려해야 합니다. 2026년 초에 출시된 YOLO26은 YOLO11의 토대 위에 여러 획기적인 혁신을 도입했습니다.
- 엔드투엔드 NMS-프리 설계: YOLOv10의 유산을 바탕으로, YOLO26은 후처리 중 NMS(비최대 억제)를 완전히 제거하여 지연 시간을 줄이고 배포 파이프라인을 단순화합니다.
- MuSGD 최적화 도구: 대규모 언어 모델 학습에서 영감을 받은 Muon과 표준 SGD를 혼합한 하이브리드 최적화 도구로, 학습 안정성을 크게 향상시킵니다.
- 최대 43% 더 빠른 CPU 추론: 특정 최적화를 통해 YOLO26은 별도의 GPU가 없는 엣지 장치에서 놀라운 성능을 발휘합니다.
- ProgLoss + STAL: 항공 이미지 및 로봇 공학에 필수적인 소형 객체 탐지 성능을 획기적으로 개선하는 고급 손실 함수입니다.
RT-DETR과 같은 Transformer 기반 탐지기를 포함하여 비전 아키텍처의 더 넓은 환경을 Ultralytics Docs에서 확인하십시오.