YOLOv8 vs. EfficientDet: 기술 비교
적합한 객체 감지 모델을 선택하려면 정확도, 속도 및 계산 비용 간의 균형을 고려해야 합니다. 이 페이지에서는 속도와 다재다능성으로 유명한 최첨단 모델인 Ultralytics YOLOv8과 뛰어난 파라미터 효율성을 위해 설계된 Google의 모델 제품군인 EfficientDet이라는 두 가지 영향력 있는 아키텍처 간의 자세한 기술 비교를 제공합니다. 둘 다 강력하지만 서로 다른 설계 철학에서 비롯되어 서로 다른 애플리케이션에 적합합니다.
Ultralytics YOLOv8: 다재다능성 및 성능
작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8은 이전 YOLO 버전의 성공을 기반으로 하는 최첨단 단일 단계 객체 감지기입니다. 주요 아키텍처 개선 사항을 도입하여 매우 다재다능하고 강력한 프레임워크로 자리 잡았습니다. 여기에는 새로운 CSPDarknet 백본, 향상된 기능 융합을 위한 C2f 넥, 앵커 프리 분리형 헤드가 포함됩니다. 이 디자인은 성능을 향상시킬 뿐만 아니라 광범위한 컴퓨터 비전 작업 전반에 걸쳐 유연성을 제공합니다.
YOLOv8의 강점
- 성능 균형: YOLOv8은 추론 속도와 정확도 간의 뛰어난 균형을 달성하여 엣지 장치에서 강력한 클라우드 서버에 이르기까지 다양한 실제 배포에 적합합니다.
- 다재다능함: YOLOv8의 주요 장점은 단일 통합 프레임워크 내에서 여러 비전 작업을 기본적으로 지원한다는 것입니다. 여기에는 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(oriented bounding box)가 포함됩니다.
- 사용 편의성: 이 모델은 사용자 경험을 우선시하는 잘 관리된 에코시스템의 일부입니다. 광범위한 문서와 수많은 튜토리얼을 통해 지원되는 간소화된 Python API와 간단한 CLI를 제공합니다.
- 학습 효율성: YOLOv8은 효율적인 학습 프로세스를 특징으로 하며, 즉시 사용 가능한 사전 학습된 가중치를 제공하여 사용자 정의 모델 개발을 간소화합니다. 일반적으로 더 복잡한 아키텍처에 비해 학습에 필요한 CUDA 메모리가 더 적습니다.
- 잘 관리되는 에코시스템: 사용자는 지속적인 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트, 그리고 엔드 투 엔드 MLOps 워크플로우를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻습니다.
YOLOv8의 약점
- YOLOv8x와 같은 더 큰 모델은 훈련 및 배포에 상당한 컴퓨팅 리소스를 요구합니다.
- 극도로 제한된 리소스 환경의 하드웨어에 배포하려면 양자화와 같은 추가적인 최적화가 필요할 수 있습니다.
YOLOv8의 이상적인 사용 사례
YOLOv8은 고급 로보틱스, 지능형 보안 시스템 및 스마트 시티 인프라와 같이 높은 정확도와 실시간 성능이 필요한 애플리케이션에 이상적입니다. 또한 다재다능함 덕분에 단순 객체 감지 외에 다른 비전 작업으로 확장될 수 있는 프로젝트에 가장 적합한 선택입니다.
EfficientDet: 확장성 및 효율성
작성자: Mingxing Tan, Ruoming Pang, and Quoc V. Le
기관: Google
날짜: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Docs: https://github.com/google/automl/tree/master/efficientdet#readme
EfficientDet은 Google Brain 팀에서 개발한 객체 감지 모델 제품군입니다. 주요 혁신은 효율성과 확장성에 중점을 둔 것입니다. 이 아키텍처는 EfficientNet 백본, 효과적인 다중 스케일 특징 융합을 위한 새로운 Bi-directional Feature Pyramid Network (BiFPN), 그리고 복합 스케일링 방법을 사용합니다. 이 방법은 백본, 특징 네트워크, 예측 헤드의 깊이, 너비, 해상도를 균일하게 조정하여 모델을 다양한 리소스 제약 조건에 맞게 조정할 수 있도록 합니다.
EfficientDet의 강점
- 높은 효율성: EfficientDet은 정확도를 최대화하면서 파라미터 수와 FLOPs를 최소화하도록 설계되어 당시 가장 연산 효율적인 아키텍처 중 하나입니다.
- 확장성: 복합 스케일링 방식은 모바일 장치에서 대규모 클라우드 서버에 이르기까지 사용 가능한 컴퓨팅 예산에 따라 선택할 수 있는 모델 패밀리(D0~D7)를 제공합니다.
- 정확도: 더 큰 EfficientDet 모델은 COCO 데이터 세트와 같은 표준 벤치마크에서 경쟁력 있는 정확도를 달성합니다.
EfficientDet의 약점
- 추론 속도: EfficientDet은 FLOP 면에서는 효율적이지만, 특히 병렬 처리에 고도로 최적화된 YOLOv8과 같은 아키텍처와 비교할 때 GPU에서 가장 빠른 실제 추론 속도로 이어지지는 않습니다.
- 제한적인 다용도성: EfficientDet은 주로 객체 감지 모델이며 Ultralytics 프레임워크에서 볼 수 있는 분할 또는 포즈 추정과 같은 다른 작업에 대한 기본 지원이 부족합니다.
- 생태계 및 유지 관리: 공식 리포지토리는 Ultralytics 생태계만큼 새로운 기능 및 통합으로 활발하게 유지 관리되지 않으므로 개발자가 채택하고 배포하기가 더 어려울 수 있습니다.
EfficientDet의 이상적인 사용 사례
EfficientDet은 파라미터 수와 이론적 계산 비용(FLOP)이 가장 중요한 제약 조건인 시나리오에서 탁월합니다. 모델 크기가 엄격하게 제한된 특정 에지 AI 장치나 계산 비용을 최소화하는 것이 우선 순위인 클라우드 환경에서 애플리케이션에 적합합니다.
성능 비교: 속도, 정확도 및 효율성
YOLOv8과 EfficientDet을 비교할 때 서로 다른 목표에 최적화되어 있다는 것이 분명합니다. YOLOv8은 실제 추론 속도와 정확도의 우수한 균형을 우선시하는 반면 EfficientDet은 모델 파라미터와 FLOP를 최소화하는 데 중점을 둡니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
표에서 다음 사항을 관찰할 수 있습니다.
- 정확도 vs. 파라미터: YOLOv8 모델은 비슷하거나 더 많은 수의 파라미터를 가진 EfficientDet 모델보다 일관되게 더 높은 mAP 점수를 달성합니다. 예를 들어 YOLOv8s(1,120만 개 파라미터)는 44.9 mAP를 달성하여 EfficientDet-d2(810만 개 파라미터)의 43.0 mAP보다 성능이 뛰어납니다.
- 추론 속도: YOLOv8은 특히 TensorRT 최적화를 사용한 GPU에서 추론 속도 면에서 상당한 이점을 보여줍니다. YOLOv8x 모델은 파라미터 수가 더 많음에도 불구하고 T4 GPU에서 유사한 EfficientDet-d7 모델보다 8배 이상 빠릅니다. YOLOv8은 또한 훨씬 빠른 CPU 추론 속도를 보여줍니다.
- 효율성 절충: EfficientDet 모델은 FLOPs가 낮지만 이것이 곧바로 더 빠른 추론으로 이어지지는 않습니다. YOLOv8의 아키텍처는 최신 하드웨어 가속에 더 적합하여 실제 시나리오에서 대기 시간이 더 짧습니다.
Ultralytics YOLO 모델을 선택해야 하는 이유
EfficientDet은 당시 획기적인 모델이었지만, YOLOv8 및 최신 YOLO11과 같은 최신 Ultralytics YOLO 모델은 현대 개발자와 연구자에게 중요한 이점을 제공합니다.
- 뛰어난 성능: Ultralytics 모델은 실시간 추론에 중요한 속도와 정확도의 더 나은 균형을 제공합니다.
- 최신 아키텍처: 앵커 프리(anchor-free) 감지 및 고급 특징 융합 네트워크와 같은 딥 러닝의 최신 발전을 통합합니다.
- Comprehensive Ecosystem: Ultralytics 생태계는 광범위한 지원, 문서 및 통합을 통해 학습에서 배포에 이르기까지 원활한 경험을 제공합니다.
- 다중 작업 기능: 하나의 프레임워크 내에서 감지, 분할 등을 처리할 수 있는 기능은 개발 시간을 절약하고 복잡성을 줄여줍니다.
결론
EfficientDet은 특히 모델 스케일링 및 효율성에 대한 혁신적인 접근 방식으로 인해 주목할 만한 아키텍처로 남아 있습니다. 파라미터 수와 FLOP 최소화가 가장 중요한 우선 순위인 애플리케이션에 적합합니다.
하지만 대부분의 최신 컴퓨터 비전 애플리케이션에서는 YOLOv8이(가) 더 매력적인 옵션을 제시합니다. 뛰어난 속도, 더 높은 정확도 및 탁월한 다재다능성을 제공합니다. 사용자 친화적이고 적극적으로 관리되는 Ultralytics 생태계와 결합된 YOLOv8은 개발자가 고성능 AI 솔루션을 더 빠르고 효과적으로 구축하고 배포할 수 있도록 지원합니다. 가장 진보되고 사용하기 쉬운 솔루션을 찾는 사람들에게는 Ultralytics 모델이 권장되는 선택입니다.
기타 모델 비교
더 자세한 내용을 알아보려면 YOLOv8, EfficientDet 및 기타 관련 모델과 관련된 다음 비교를 살펴보십시오.
- YOLOv8 vs. YOLOv7
- EfficientDet vs. YOLOv7
- YOLOv8 vs. YOLOv5
- EfficientDet vs. YOLOv5
- RT-DETR vs. YOLOv8
- RT-DETR vs. EfficientDet
- YOLOv10 및 YOLO11과 같은 최신 모델을 살펴보세요.