효율적 탐지(EfficientDet) 대 YOLOv5: 확장성과 실시간 성능의 균형
적절한 객체 탐지 아키텍처를 선택하려면 정확도, 추론 속도, 배포 복잡성 간의 장단점을 비교 검토해야 합니다. 본 가이드는 Google 확장 가능한 아키텍처인 EfficientDet와 YOLOv5 간의 심층적인 기술적 비교를 제공합니다. YOLOv5( Ultralytics 널리 채택된 실시간 탐지기) 간의 심층적인 기술적 비교를 제공합니다.
EfficientDet이 복합 스케일링 분야에서 획기적인 개념을 도입한 반면, YOLOv5 간소화된 API와 강력한 생태계를 통해 고성능 컴퓨터 비전을 접근 가능하게 함으로써 해당 분야에 혁 YOLOv5 .
모델 개요
EfficientDet은 EfficientNet 백본을 기반으로 해 해상도, 깊이, 너비를 균일하게 확장하는 복합 스케일링 방식을 적용합니다. 다중 스케일 특징 융합을 쉽고 빠르게 수행할 수 있도록 양방향 특징 피라미드 네트워크(BiFPN)를 도입했습니다.
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직:Google
- 날짜:20
- Arxiv:EfficientDet: 확장 가능하고 효율적인 물체 감지
- GitHub:EfficientDet 저장소
Ultralytics YOLOv5
YOLOv5 실제 환경에서의 사용성과 속도에 중점을 둡니다. CSPDarknet 백본을 활용하며 다양한 하드웨어에서 훈련 및 배포가 용이하도록 설계되었습니다. 성능과 효율성의 균형 덕분에 여전히 가장 인기 있는 모델 중 하나입니다.
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜:26
- 문서:5 문서
- GitHub:5 저장소
기술 아키텍처 비교
이 두 모델의 건축 철학은 크게 달라서 서로 다른 작업에 적합한지 여부에 영향을 미칩니다.
EfficientDet: 컴파운드 스케일링 및 BiFPN
EfficientDet의 핵심 혁신은 가중치 양방향 특징 피라미드 네트워크( BiFPN )입니다. 특징을 구분 없이 합산하는 표준 FPN과 달리, BiFPN은 학습 가능한 가중치를 도입하여 서로 다른 입력 특징의 중요도를 이해합니다. 이를 통해 네트워크는 특징 융합 과정에서 더 유용한 특징을 우선적으로 처리할 수 있습니다.
또한 EfficientDet는 백본, 피처 네트워크, 예측 네트워크의 해상도, 깊이, 너비를 동시에 증가시키는 복합 스케일링( Compound Scaling)을 사용합니다. 이를 통해 사용자는 자원 제약에 따라 D0부터 D7까지의 모델 계열 중에서 선택할 수 있습니다. 그러나 이러한 복잡성은 해당 연산을 위한 전용 지원이 부족한 에지 디바이스에서 더 높은 지연 시간으로 이어질 수 있습니다.
YOLOv5: CSPDarknet 및 PANet
YOLOv5 CSPDarknet 백본을 YOLOv5 , 이는 Cross Stage Partial 네트워크를 통합합니다. 이 설계는 베이스 레이어에서 특징 맵을 분할함으로써 정확도를 유지하면서 매개변수 수와 FLOPS를 줄입니다.
특징 집계에는 YOLOv5 경로 집계 네트워크(PANet)를 YOLOv5 . 이 구조는 하위 계층에서 상위 계층으로의 정보 흐름을 강화하여 객체 국소화 성능을 향상시킵니다. 이는 정확한 바운딩 박스 생성에 핵심적입니다. 헤드 모듈은 앵커 기반 방식으로, 사전 정의된 앵커 박스에서 오프셋을 예측합니다. 이 아키텍처는 GPU 처리에 최적화되어 있어, EfficientDet의 복잡한 스케일링 연산에 비해 더 빠른 추론 속도를 제공합니다.
Ultralytics 에코시스템의 이점
YOLOv5 선택하면 Ultralytics 접근할 YOLOv5 , Ultralytics 통해 데이터 주석 작업, 실험 추적, 클라우드 훈련을 위한 도구들과 원활한 통합이 보장됩니다. 이러한 지원 구조는 EfficientDet과 같은 연구 중심 저장소에서는 흔히 찾아보기 어렵습니다.
성능 지표
성능을 평가할 때 정확도(mAP)과 속도(지연 시간)를 모두 살펴보는 것이 중요합니다. EfficientDet은 더 큰 변형 YOLOv5 (D7)을 통해 정확도를 높일 수 있지만, 비슷한 크기의 YOLOv5 비해 상당한 속도 저하를 초래하는 경우가 많습니다.
아래 표는 성능 차이를 보여줍니다. YOLOv5 CPU 현저히 더 YOLOv5 주목하십시오. 이는 특수 가속기 없이도 배포에 훨씬 더 실용적임을 의미합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| 0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| 1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| 2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| 3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| 4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| 5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| 6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| 7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
분석
- 속도 대 정확도: EfficientDet-d0은 FLOPs 측면에서 매우 효율적이지만, 실제로는 YOLOv5n과 YOLOv5s가 하드웨어 친화적인 연산(일부 구형 CUDA 느릴 수 있는 깊이별 분리 가능 컨볼루션 회피) 덕분에 표준 GPU에서 더 빠르게 실행되는 경우가 많습니다.
- 메모리 효율성: YOLOv5 훈련 중 더 적은 VRAM을 필요로 하여 소비자 등급 하드웨어에서 더 큰 배치 크기를 허용합니다. EfficientDet의 복잡한 연결은 메모리 오버헤드를 증가시킬 수 있습니다.
- 최적화: EfficientDet는 아키텍처 설정을 위해 AutoML 검색에 크게 의존하며, 이는 수정하기 어려울 수 있습니다. YOLOv5 YAML 구성에서 깊이와 너비 배수를 직접 더 쉽게 사용자 정의할 수 있도록 YOLOv5 .
교육 및 사용성
교육 효율성
Ultralytics YOLOv5 "즉시 사용 가능한" 훈련 기능으로YOLOv5 . 저장소에는 모자이크 데이터 증강, 자동 앵커 계산, 하이퍼파라미터 진화 기능이 포함되어 있습니다. 이는 사용자가 광범위한 튜닝 없이도 맞춤형 데이터셋에서 우수한 결과를 얻을 수 있음을 의미합니다. 반면 EfficientDet 구현은 종종 TensorFlow 대한 수동 설정과 신중한 학습률 스케줄링이 더 많이 필요합니다.
배치 유연성
EfficientDet은 주로 객체 탐지 모델이지만, YOLOv5 Ultralytics 후속 모델들은 더 광범위한 작업을 지원합니다. 동일한 API 구조를 사용하여 인스턴스 세그멘테이션이나 이미지 분류로 원활하게 전환할 수 있습니다.
또한, YOLOv5 배포는 ONNX, TensorRT, CoreML, TFLite 원클릭 변환을 지원하는 내보내기 모드를 통해 YOLOv5 .
from ultralytics import YOLO
# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")
# Train the model on a custom dataset
model.train(data="coco128.yaml", epochs=100)
# Export to ONNX format for deployment
model.export(format="onnx")
미래 대비: YOLO26의 필요성
YOLOv5 강력한 선택지이지만, 해당 분야는 진화해 왔습니다. 최첨단을 추구하는 개발자들을 위해 YOLO26은 YOLOv5 유산을 YOLOv5 상당한 아키텍처 개선을 YOLOv5
YOLO26은 엔드투엔드 NMS 설계를 도입하여 비최대 억제(NMS) 후처리 단계가 필요하지 않습니다. 이는 지연 시간을 줄이고 배포 파이프라인을 단순화하여 EfficientDet 및 YOLOv5 대비 주요 이점을 제공합니다. 또한 YOLO26은 LLM 훈련에서 영감을 받은 MuSGD 최적화기를 활용하여 어려운 데이터셋에서도 더 빠른 수렴과 안정적인 훈련을 보장합니다.
프로젝트에 엣지 AI가 포함된다면, YOLO26은 CPU 위해 특별히 최적화되어 이전 세대보다 최대 43% 빠른 속도를 제공합니다.
이상적인 사용 사례
EfficientDet을 선택해야 하는 경우
- 연구 제약 사항: 복합 스케일링 법칙 연구나 특정 학술 벤치마크 재현이 주요 목표일 때.
- 저 FLOP 체제: FLOP 수가 유일한 관심 지표인 이론적 시나리오에서, 메모리 접근 비용이나 하드웨어 상의 실제 지연 시간을 무시하는 경우.
Ultralytics YOLOv5 또는 YOLO26)를 선택해야 할 때
- 실시간 애플리케이션: 자율 주행, 영상 분석, 로봇 공학 등 지연 시간이 절대 허용되지 않는 분야.
- 에지 배포: 메모리 효율성과TensorRT 중요한 라즈베리 파이, NVIDIA 또는 모바일 기기에서 실행됩니다.
- 신속한 개발: 빠른 반복 주기, 손쉬운 데이터셋 관리, 신뢰할 수 있는 사전 훈련된 가중치가 필요한 프로젝트.
- 다양한 작업: 프로젝트가 자세 추정 또는 방향 객체 탐지(OBB)를 포함하도록 확장될 수 있다면, Ultralytics 이를 기본적으로 지원합니다.
요약
EfficientDet과 YOLOv5 모두 컴퓨터 비전 분야에 중대한 기여를 YOLOv5 . EfficientDet은 체계적인 확장성의 힘을 입증했으며, YOLOv5 고성능 탐지 기술을 YOLOv5 . 오늘날 대부분의 실용적 응용 분야에서 YOLOv5 최첨단 YOLO26으로대표되는 Ultralytics 지속적으로 업데이트되는 코드베이스와 활발한 커뮤니티의 지원을 받아 속도, 정확도, 사용 편의성 사이에서 탁월한 균형을 제공합니다.
모델 비교에 대한 추가 자료로는 YOLO YOLOv8 EfficientDet 또는 트랜스포머 기반 모델과 어떻게 비교되는지 살펴보세요. RT-DETR를 살펴보세요.