EfficientDet vs. YOLO11: 상세 기술 비교
이 페이지에서는 Google의 EfficientDet과 Ultralytics YOLO11이라는 두 가지 주요 객체 감지 모델 간의 자세한 기술 비교를 제공합니다. 아키텍처, 성능 벤치마크, 다양한 애플리케이션에 대한 적합성을 분석하여 귀사의 컴퓨터 비전 요구 사항에 맞는 최적의 모델을 선택할 수 있도록 지원합니다. 두 모델 모두 효율적이고 정확한 객체 감지를 목표로 하지만 서로 다른 연구 라인(Google 및 Ultralytics)에서 비롯되었으며 뚜렷한 아키텍처 철학을 채택하고 있습니다.
EfficientDet
EfficientDet은 Google Brain 연구진이 개발한 객체 감지 모델 제품군입니다. 2019년에 소개된 이 모델은 강력한 백본(backbone)과 새로운 특징 융합 메커니즘, 고유한 스케일링 방법을 결합하여 효율성에 대한 새로운 기준을 세웠습니다.
기술 세부 사항:
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직: Google
- 날짜: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- 문서: https://github.com/google/automl/tree/master/efficientdet#readme
아키텍처 및 주요 기능
EfficientDet 아키텍처는 세 가지 핵심 구성 요소를 기반으로 구축되었습니다.
- EfficientNet Backbone: 특징 추출을 위해 매우 효율적인 EfficientNet을(를) 백본으로 사용합니다.
- BiFPN (양방향 특징 피라미드 네트워크): 간단하고 빠른 다중 스케일 특징 융합을 가능하게 하는 새로운 가중 특징 피라미드 네트워크입니다. 다양한 입력 특징의 중요도를 파악하고 하향식 및 상향식 연결을 모두 적용하기 위해 학습 가능한 가중치를 도입했습니다.
- Compound Scaling: 모델 깊이, 너비 및 해상도가 단일 Compound 계수를 사용하여 함께 확장되는 주요 혁신입니다. 이를 통해 모델 제품군(D0에서 D7까지)은 광범위한 리소스 제약 조건에 걸쳐 효율적으로 확장할 수 있습니다.
강점
- 높은 효율성: EfficientDet 모델은 낮은 파라미터 및 FLOPs 수로 유명하며, 연산 예산에 비해 강력한 정확도를 달성합니다.
- 확장성: 복합 스케일링 방식은 모델을 확장하거나 축소할 수 있는 명확한 경로를 제공하므로 모바일 장치에서 데이터 센터에 이르기까지 다양한 하드웨어 프로필에 적응할 수 있습니다.
- 강력한 학술 벤치마크: 출시 당시 최첨단 모델이었으며 효율성 중심 연구를 위한 강력한 기준선으로 남아 있습니다.
약점
- GPU 추론 속도 저하: FLOP 효율성에도 불구하고 EfficientDet은 병렬 처리 하드웨어에 특화되어 설계된 YOLO11과 같은 모델에 비해 GPU에서 실제 추론 지연 시간이 더 느릴 수 있습니다.
- 제한적인 다용도성: EfficientDet은 주로 객체 감지기입니다. Ultralytics와 같은 최신 프레임워크에 통합된 인스턴스 분할, 포즈 추정 또는 분류와 같은 다른 작업에 대한 기본 지원이 부족합니다.
- 유지 관리가 덜 되는 생태계: 공식 저장소는 Ultralytics 생태계만큼 활발하게 개발되지 않습니다. 이로 인해 유용성, 커뮤니티 지원 및 최신 도구 및 배포 플랫폼과의 통합에 어려움이 발생할 수 있습니다.
Ultralytics YOLO11
Ultralytics YOLO11은 Ultralytics에서 개발한 YOLO(You Only Look Once) 시리즈의 최신 발전입니다. YOLOv8과 같은 이전 모델의 성공을 기반으로 사용 편의성과 다재다능성을 제공하면서 정확도와 실시간 성능의 경계를 넓히는 데 중점을 둡니다.
기술 세부 사항:
- 저자: Glenn Jocher, Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: https://docs.ultralytics.com/models/yolo11/
아키텍처 및 주요 기능
YOLO11은 속도와 정밀도에 최적화된 단일 단계 앵커 프리(Anchor-Free) 감지기 아키텍처를 사용합니다. 이 설계는 개선된 특징 추출 레이어와 간소화된 네트워크 구조를 특징으로 하여 정확도를 희생하지 않고 매개변수 수와 계산 부하를 줄입니다. 이를 통해 NVIDIA Jetson과 같은 에지 장치에서 강력한 클라우드 서버에 이르기까지 다양한 하드웨어에서 뛰어난 성능을 보장합니다.
YOLO11의 중요한 장점은 포괄적인 Ultralytics 생태계 내 통합입니다. 이는 개발자에게 다음을 제공합니다:
- 사용 편의성: 간단하고 직관적인 Python API 및 CLI를 통해 학습, 검증 및 추론이 간단해집니다.
- 다양성: YOLO11은 단일 통합 프레임워크 내에서 객체 탐지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(Oriented Bounding Box)를 지원하는 멀티태스크 모델입니다.
- 잘 관리되는 에코시스템: 이 모델은 활발한 개발, 크고 지원적인 오픈 소스 커뮤니티, 잦은 업데이트, 엔드 투 엔드 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻습니다.
- 학습 및 메모리 효율성: YOLO11은 효율적인 학습을 위해 설계되었으며 종종 더 적은 CUDA 메모리가 필요하고 대안보다 빠르게 수렴됩니다. COCO와 같은 데이터 세트에 대한 즉시 사용 가능한 사전 훈련된 가중치가 함께 제공됩니다.
강점
- 최첨단 성능: 특히 GPU에서 높은 mAP 점수와 빠른 추론 속도 간의 탁월한 균형을 달성합니다.
- Deployment Flexibility: 광범위한 하드웨어에 최적화되어 있으며, 최대 성능을 위해 ONNX 및 TensorRT와 같은 형식으로 쉽게 내보낼 수 있습니다.
- 사용자 친화적인 프레임워크: 광범위한 설명서, 튜토리얼 및 강력한 커뮤니티를 통해 초보자와 전문가 모두가 쉽게 접근할 수 있습니다.
- 다중 작업 지원: 단일 YOLO11 모델을 다양한 비전 작업에 대해 훈련할 수 있어 개발 복잡성과 시간이 줄어듭니다.
약점
- CPU 성능 절충: GPU에 고도로 최적화되어 있지만 더 큰 YOLO11 모델은 가장 작은 EfficientDet 변형에 비해 CPU 전용 환경에서 더 느릴 수 있습니다.
- 소형 객체 감지: 다른 원-스테이지 감지기와 마찬가지로, 극도로 작거나 심하게 가려진 객체를 조밀한 장면에서 감지하는 데 어려움을 겪을 수 있지만, 각 버전마다 지속적인 개선이 이루어지고 있습니다.
성능 및 벤치마크
COCO val2017 데이터 세트의 성능 비교는 EfficientDet과 YOLO11의 서로 다른 설계 철학을 강조합니다. EfficientDet은 특히 더 작은 모델에서 이론적 효율성(매개변수/FLOP당 mAP)이 뛰어납니다. 그러나 실제 배포, 특히 GPU에서 YOLO11은 추론 속도에서 명확한 이점을 보여줍니다.
예를 들어 YOLO11s는 EfficientDet-d3(47.5)와 비슷한 mAP(47.0)를 달성하지만 T4 GPU에서 2.9배 더 빠른 추론 속도를 제공합니다. 가장 큰 모델인 YOLO11x는 모든 EfficientDet 모델보다 정확도(54.7 mAP)가 높으면서도 중간 크기의 EfficientDet 모델보다 GPU에서 훨씬 빠릅니다. 따라서 실시간 추론이 중요한 애플리케이션에 YOLO11이 더 나은 선택입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
이상적인 사용 사례
EfficientDet
EfficientDet은 컴퓨팅 자원이 주요 병목 현상이고 GPU 최적화가 덜 중요한 시나리오에 가장 적합합니다.
- 학술 연구: 모델 효율성 및 아키텍처 설계에 중점을 둔 연구에 탁월합니다.
- CPU 바운드 애플리케이션: 소형 버전(D0-D2)은 전용 GPU가 없는 환경에서 잘 작동할 수 있습니다.
- 비용에 민감한 클라우드 배포: 요금이 FLOP 또는 CPU 사용량과 직접적으로 연결되는 경우.
YOLO11
YOLO11은 높은 정확도, 속도 및 개발 효율성이 요구되는 광범위한 실제 애플리케이션에서 뛰어납니다.
- 자율 시스템: 낮은 지연 시간의 인지 기능으로 로보틱스 및 자율 주행 자동차를 지원합니다.
- 보안 및 감시: 보안 시스템 및 공공 안전을 위한 실시간 모니터링을 지원합니다.
- 산업 자동화: 생산 라인에서 고속 품질 관리 및 결함 감지에 사용됩니다.
- 소매 분석: 재고 관리 및 고객 행동 분석과 같은 애플리케이션을 추진합니다.
결론
EfficientDet은 모델 효율성의 경계를 넓힌 획기적인 아키텍처입니다. 확장 가능한 디자인은 특히 리소스가 제한된 환경에서 해당 분야에 귀중한 기여를 하고 있습니다.
그러나 최첨단, 다재다능하며 사용자 친화적인 솔루션을 찾는 개발자와 연구자에게는 Ultralytics YOLO11이 명확한 선택입니다. 특히 최신 하드웨어에서 정확도와 실제 속도의 뛰어난 조합을 제공합니다. YOLO11의 주요 장점은 성능뿐만 아니라 이를 둘러싼 강력한 생태계에 있습니다. 간소화된 API, 광범위한 문서, 다중 작업 기능 및 활발한 커뮤니티 지원은 개발 및 배포 수명 주기를 크게 가속화하여 오늘날 광범위한 컴퓨터 비전 문제에 가장 실용적이고 강력한 옵션이 됩니다.
다른 모델 살펴보기
더 자세한 내용을 알아보려면 다른 최첨단 모델과의 비교를 살펴보십시오.