EfficientDet vs YOLOv7: 기술 비교
정확도, 속도 및 계산 비용의 요구 사항 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 뛰어난 매개변수 효율성으로 유명한 EfficientDet과 실시간 객체 감지의 랜드마크 모델인 YOLOv7이라는 두 가지 영향력 있는 모델 간의 자세한 기술 비교를 제공합니다. 아키텍처, 성능 지표 및 이상적인 사용 사례를 검토하여 프로젝트에 가장 적합한 모델을 선택하는 데 필요한 통찰력을 제공하는 동시에 최신 대안의 장점을 강조하는 것을 목표로 합니다.
EfficientDet: 확장성 및 효율성
EfficientDet은 Google Brain 팀에서 매우 효율적이고 확장 가능한 객체 감지기 제품군으로 소개되었습니다. 핵심 혁신은 모델 아키텍처와 확장 원리를 최적화하여 더 적은 파라미터와 계산 리소스(FLOP)로 더 나은 성능을 달성하는 데 있습니다.
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organization: Google
- 날짜: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- 문서: https://github.com/google/automl/tree/master/efficientdet#readme
아키텍처 및 주요 기능
EfficientDet의 디자인은 세 가지 핵심 요소로 구성됩니다.
- EfficientNet Backbone: 특징 추출을 위해 매우 효율적인 EfficientNet을(를) 백본으로 사용하며, 이는 NAS(신경망 아키텍처 검색)를 사용하여 설계되었습니다.
- BiFPN (Bi-directional Feature Pyramid Network): EfficientDet은 표준 FPN 대신 BiFPN을 도입하여 가중치가 적용된 연결을 통해 더욱 풍부한 다중 스케일 특징 융합을 가능하게 하여 최소한의 오버헤드로 정확도를 향상시킵니다.
- Compound Scaling: 단일 Compound Scaling 계수를 사용하여 백본, 특징 네트워크 및 예측 헤드의 깊이, 너비 및 해상도를 균일하게 조정하는 새로운 스케일링 방법입니다. 이를 통해 모델을 경량 EfficientDet-D0에서 매우 정확한 D7로 확장하여 광범위한 컴퓨팅 예산을 충족할 수 있습니다.
강점과 약점
강점:
- 탁월한 효율성: 주어진 매개변수 및 FLOP 수에 대해 높은 정확도를 제공하므로 교육 및 배포 모두에 매우 비용 효율적입니다.
- 확장성: 복합 스케일링 방식은 에지 AI 장치에서 강력한 클라우드 서버에 이르기까지 하드웨어 제약 조건에 따라 모델을 확장하거나 축소할 수 있는 명확한 경로를 제공합니다.
- 표준 벤치마크에서 강력한 성능: 출시 당시 COCO 데이터 세트에서 최첨단 결과를 달성하여 효과를 입증했습니다.
약점:
- 더 느린 추론 속도: FLOP에서 효율적이지만, 아키텍처로 인해 YOLO 제품군과 같이 실시간 추론을 위해 특별히 설계된 모델에 비해 지연 시간이 더 높을 수 있습니다.
- 작업 특정성: EfficientDet은 주로 객체 탐지 모델이며 최신 프레임워크에서 제공하는 기본 멀티태스크 다용도성이 부족합니다.
- 복잡성: BiFPN 및 복합 스케일링 개념은 강력하지만 더 간단한 아키텍처에 비해 처음부터 구현하기가 더 복잡할 수 있습니다.
YOLOv7: 실시간 성능 향상
원래 YOLOv4의 작성자가 개발한 YOLOv7은 속도와 정확도를 모두 크게 향상시켜 실시간 객체 감지기의 새로운 표준을 세웠습니다. YOLOv7은 GPU 하드웨어에서 가능한 범위를 넓히기 위해 새로운 훈련 기술과 아키텍처 최적화를 도입했습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- 문서: https://docs.ultralytics.com/models/yolov7/
아키텍처 및 주요 기능
YOLOv7의 발전은 다음과 같은 주요 영역에서 비롯됩니다.
- 아키텍처 개선: 원래의 그래디언트 경로를 손상시키지 않으면서 네트워크의 학습 능력을 향상시키기 위해 E-ELAN(Extended Efficient Layer Aggregation Network)을 도입했습니다.
- 학습 가능한 Bag-of-Freebies: 주요 기여는 추론 비용을 추가하지 않고 정확도를 향상시키는 학습 중 최적화 전략을 사용하는 것입니다. 여기에는 재매개변수화된 컨볼루션 및 Coarse-to-Fine Lead Guided Training과 같은 기술이 포함됩니다.
- 모델 스케일링: YOLOv7은 연결 기반 모델의 스케일링 방법을 제공하여 아키텍처가 더 높은 정확도를 위해 확장될 때 최적의 상태를 유지하도록 보장합니다.
강점과 약점
강점:
- 뛰어난 속도-정확도 균형: 출시 당시 실시간 감지기 중에서 mAP과 추론 속도 간의 최상의 균형을 제공했습니다.
- 효율적인 훈련: "bag-of-freebies" 접근 방식을 통해 더 긴 훈련 또는 더 복잡한 후처리가 필요한 모델에 비해 더 효율적인 훈련 주기로 높은 정확도를 달성할 수 있습니다.
- 검증된 성능: 벤치마크에서 강력한 결과를 보여주는 잘 확립된 모델로, 고성능 애플리케이션을 위한 신뢰할 수 있는 선택입니다.
약점:
- 리소스 집약적: 더 큰 YOLOv7 모델은 훈련에 상당한 GPU 리소스가 필요합니다.
- 제한적인 활용성: 다른 작업에 대한 커뮤니티 버전이 존재하지만, 공식 모델은 객체 탐지에 중점을 두고 있습니다. Ultralytics YOLOv8과 같은 통합 프레임워크는 세분화, 분류 및 포즈 추정에 대한 기본 지원을 제공합니다.
- 복잡성: 아키텍처 변경 사항과 고급 학습 기법의 조합은 완전히 이해하고 사용자 정의하기에 복잡할 수 있습니다.
성능 분석: 효율성 vs. 속도
EfficientDet과 YOLOv7의 주요 차이점은 설계 철학에 있습니다. EfficientDet은 계산 효율성(FLOPs)과 파라미터 수를 우선시하는 반면, YOLOv7은 GPU에서 원시 추론 속도(지연 시간)를 우선시합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
표에서 볼 수 있듯이 더 작은 EfficientDet 모델은 파라미터와 FLOP에서 매우 가볍습니다. 그러나 YOLOv7x는 T4 GPU에서 훨씬 낮은 대기 시간으로 EfficientDet-d6/d7과 비슷한 mAP를 달성하여 실시간 애플리케이션에 적합함을 강조합니다.
Ultralytics YOLO 모델을 선택해야 하는 이유
EfficientDet과 YOLOv7은 모두 강력한 모델이지만, 컴퓨터 비전 분야는 빠르게 발전했습니다. 최신 Ultralytics YOLO 모델(YOLOv8 및 YOLO11 등)은 현대적인 개발에 있어 우수한 선택이 될 수 있는 상당한 이점을 제공합니다.
- 사용 편의성: Ultralytics 모델은 간소화된 Python API, 광범위한 문서 및 간단한 CLI 명령어를 특징으로 하며, 학습, 검증 및 배포를 매우 간단하게 만들어 사용자를 염두에 두고 설계되었습니다.
- 잘 관리되는 에코시스템: 사용자는 활발한 개발, 대규모 오픈 소스 커뮤니티, 잦은 업데이트, 그리고 엔드 투 엔드 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻습니다.
- 성능 균형: Ultralytics 모델은 속도와 정확성 사이에서 뛰어난 균형을 제공하여 에지 장치에서 클라우드 플랫폼에 이르기까지 광범위한 실제 시나리오에 적합합니다.
- 메모리 효율성: Ultralytics YOLO 모델은 효율적인 메모리 사용을 위해 설계되었습니다. 트랜스포머 기반 모델 및 EfficientDet 또는 YOLOv7의 일부 변형보다 학습에 필요한 CUDA 메모리가 더 적어 더 광범위한 하드웨어에서 학습할 수 있습니다.
- 다재다능함: YOLOv8 및 YOLO11과 같은 모델은 단순한 검출기가 아닙니다. 인스턴스 분할, 이미지 분류, 자세 추정 및 방향이 지정된 객체 탐지(OBB)를 즉시 지원하는 멀티태스킹 프레임워크입니다.
- 학습 효율성: 효율적인 학습 프로세스, COCO와 같은 데이터 세트에서 즉시 사용 가능한 사전 학습된 가중치, 더 빠른 수렴 시간을 통해 이점을 얻으십시오.
결론
EfficientDet은 파라미터 및 FLOP 효율성이 가장 중요한 시나리오에서 탁월하며, 다양한 리소스 예산에 걸쳐 뛰어난 확장성을 제공합니다. 리소스가 제한된 장치나 계산 비용이 주요 요인인 대규모 클라우드 환경에서 애플리케이션에 적합합니다. YOLOv7은 고급 학습 기술을 활용하여 특히 GPU 하드웨어에서 뛰어난 속도와 정확도를 제공하여 실시간 객체 감지의 경계를 넓힙니다.
그러나 강력한 성능, 훌륭한 문서 및 포괄적인 생태계를 갖춘 현대적이고 다재다능하며 사용자 친화적인 프레임워크를 찾는 개발자에게는 YOLOv8 및 YOLO11과 같은 Ultralytics 모델이 더 매력적인 선택을 제시합니다. 이러한 모델은 광범위한 비전 작업에 대한 통합 솔루션을 제공하여 연구에서 프로덕션 배포에 이르기까지 개발 파이프라인을 간소화합니다.
기타 모델 비교
자세한 탐색을 위해 EfficientDet, YOLOv7 및 기타 관련 모델과 관련된 다음 비교를 고려하십시오.
- EfficientDet 대 YOLOv8
- EfficientDet 대 YOLOv5
- YOLOv7 vs YOLOv8
- YOLOv7 vs YOLOv5
- RT-DETR vs YOLOv7
- YOLOX vs YOLOv7
- YOLOv10 및 YOLO11과 같은 최신 모델을 살펴보세요.