EfficientDet vs. YOLOv10: 기술 비교
최적의 객체 감지 모델을 선택하는 것은 정확도, 추론 속도 및 계산 비용의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 컴퓨터 비전 분야의 두 가지 영향력 있는 모델인 EfficientDet과 YOLOv10 간의 자세한 기술 비교를 제공합니다. 프로젝트에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석하고 Ultralytics 생태계 내에서 YOLOv10이 제공하는 이점에 특히 중점을 둘 것입니다.
EfficientDet: 확장 가능하고 효율적인 아키텍처
EfficientDet은 Google Brain 팀에서 매우 효율적이고 확장 가능한 객체 감지기 제품군으로 소개되었습니다. 핵심 혁신은 모델 확장에 대한 체계적인 접근 방식으로, 광범위한 계산 예산에서 정확도와 효율성을 모두 최적화하는 것을 목표로 합니다.
기술 세부 사항:
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직: Google
- 날짜: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
아키텍처 및 주요 기능
EfficientDet 아키텍처는 세 가지 주요 구성 요소를 기반으로 구축되었습니다.
- EfficientNet Backbone: 특징 추출을 위해 매우 효율적인 EfficientNet을 백본으로 사용하며, 이는 신경망 아키텍처 검색을 사용하여 설계되었습니다.
- BiFPN (양방향 특징 피라미드 네트워크): 쉽고 빠른 다중 스케일 특징 융합을 가능하게 하는 새로운 특징 네트워크입니다. 기존 FPN과 달리 BiFPN은 양방향 교차 스케일 연결을 가지고 있으며 가중 특징 융합을 사용하여 다양한 입력 특징의 중요도를 학습합니다.
- Compound Scaling: 간단한 Compound Scaling 계수를 사용하여 백본, 특징 네트워크 및 예측 헤드의 깊이, 너비 및 해상도를 동시에 균일하게 조정하는 고유한 스케일링 방법입니다. 이를 통해 모든 규모에서 균형 잡히고 최적화된 아키텍처를 보장합니다.
강점과 약점
강점:
- 뛰어난 확장성: 복합 스케일링 방법은 다양한 리소스 제약 조건을 충족하기 위해 모델을 확장하거나 축소(EfficientDet-D0에서 D7까지)할 수 있는 명확한 경로를 제공합니다.
- 파라미터 및 FLOP 효율성: 출시 당시, 이전 검출기보다 더 적은 파라미터와 FLOPs로 높은 정확도를 달성하여 효율성에 대한 새로운 기준을 세웠습니다.
약점:
- 수명 및 성능: 기본적인 아키텍처이지만 출시된 지 몇 년 되었습니다. YOLOv10과 같은 최신 모델은 특히 GPU와 같은 최신 하드웨어에서 속도와 정확도-효율성 균형 모두에서 이를 능가합니다.
- 생태계 및 유지 관리: 원래 리포지토리는 최신 대안만큼 활발하게 유지 관리되지 않습니다. Ultralytics 모델에서 볼 수 있는 포괄적인 생태계, 광범위한 documentation 및 커뮤니티 지원이 부족합니다.
- Task Versatility: EfficientDet은 특히 객체 탐지를 위해 설계되었으며 인스턴스 분할 또는 포즈 추정과 같은 다른 작업을 기본적으로 지원하지 않습니다.
이상적인 사용 사례
EfficientDet은 FLOPs와 파라미터 수가 절대적으로 가장 중요한 제약 조건인 시나리오에 여전히 적합한 모델입니다.
- 리소스 제한적 하드웨어: 더 작은 모델은 모든 FLOP이 중요한 제한된 컴퓨팅 성능을 가진 장치에 배포하는 데 적합합니다.
- 학술 벤치마킹: 모델 효율성 및 아키텍처 설계 연구를 위한 강력한 기준 역할을 합니다.
YOLOv10: 실시간 엔드 투 엔드 감지
Ultralytics YOLOv10은 칭화대학교의 최첨단 실시간 객체 감지기입니다. 계산 중복성을 줄이고 NMS(Non-Maximum Suppression)의 필요성을 없애 진정한 엔드 투 엔드 감지를 가능하게 하는 아키텍처 혁신을 도입하여 성능의 경계를 넓힙니다.
기술 세부 사항:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- Organization: Tsinghua University
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
아키텍처 및 주요 기능
YOLOv10의 디자인은 전체적인 효율성과 정확성에 중점을 둡니다.
- NMS-Free 학습: 학습 중에 레이블에 대해 일관된 이중 할당을 사용하여 후처리 중에 NMS 없이도 경쟁력 있는 성능을 달성할 수 있습니다. 이는 추론 지연 시간을 크게 줄이고 배포를 단순화합니다.
- 전체적인 효율성-정확도 설계: 모델 아키텍처는 엔드 투 엔드로 최적화되어 있습니다. 여기에는 계산 오버헤드를 줄이기 위한 경량 분류 헤드와 풍부한 특징 정보를 보다 효율적으로 보존하기 위한 공간-채널 분리 다운샘플링이 포함됩니다.
- Ultralytics 생태계 통합: YOLOv10은 Ultralytics 프레임워크에 완벽하게 통합되어 간소화된 사용자 경험, 간단한 Python 및 CLI 인터페이스, 효율적인 학습 프로세스 및 즉시 사용 가능한 사전 훈련된 가중치의 이점을 누릴 수 있습니다.
강점과 약점
강점:
- 최첨단 성능: 속도와 정확성 간의 탁월한 균형을 제공하며 실제 지연 시간에서 EfficientDet과 같은 이전 모델보다 훨씬 뛰어난 성능을 보이는 경우가 많습니다.
- End-to-End 배포: NMS가 없는 설계로 진정한 end-to-end가 가능하며, 이는 실시간 추론에 큰 이점입니다.
- 사용 편의성: Ultralytics 생태계의 일부인 YOLOv10은 사용이 매우 간편합니다. 개발자는 몇 줄의 코드만으로 모델을 학습, 검증 및 배포할 수 있습니다.
- 잘 관리되는 에코시스템: 활발한 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트, 그리고 원활한 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 통해 이점을 얻습니다.
- 메모리 효율성: YOLOv10 모델은 효율적인 메모리 사용을 위해 설계되었으며, 다른 복잡한 아키텍처에 비해 훈련 및 추론 중에 더 적은 CUDA 메모리를 필요로 하는 경우가 많습니다.
약점:
- Task Specialization: EfficientDet과 마찬가지로 YOLOv10은 주로 객체 탐지에 중점을 둡니다. 다중 작업 기능이 필요한 프로젝트의 경우 Ultralytics YOLOv8과 같은 모델이 통합 프레임워크에서 분할, 분류 및 포즈 추정을 지원하므로 더 적합할 수 있습니다.
이상적인 사용 사례
YOLOv10은 속도와 효율성이 중요한 애플리케이션에서 뛰어납니다.
- 실시간 애플리케이션: 낮은 지연 시간으로 인해 자율 시스템, 로보틱스 및 고속 비디오 감시에 적합합니다.
- Edge AI: 더 작은 변형(YOLOv10n, YOLOv10s)은 NVIDIA Jetson 및 Raspberry Pi와 같이 리소스가 제한된 에지 장치에 배포하도록 고도로 최적화되어 있습니다.
- 산업 자동화: 빠르고 정확한 감지가 제조 공정 속도를 따라가는 데 필요한 생산 라인의 품질 관리에 적합합니다.
성능 분석: 속도, 정확도 및 효율성
EfficientDet과 YOLOv10 간의 성능 비교는 모델 아키텍처 및 최적화의 빠른 발전을 강조합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
- GPU 속도: YOLOv10은 GPU 지연 시간에서 엄청난 이점을 보여줍니다. 예를 들어 YOLOv10-B는 EfficientDet-d6보다 더 높은 mAP(52.7 vs. 52.6)를 달성하지만 TensorRT를 사용하는 T4 GPU에서 13배 이상 빠릅니다.
- 정확도 vs. 파라미터: YOLOv10 모델은 주어진 파라미터 수에서 일관되게 더 나은 정확도를 제공합니다. YOLOv10-L은 EfficientDet-d7보다 정확도가 높고(53.3 vs. 53.7은 매우 근접함) 10배 이상 빠르며 파라미터는 거의 절반만 사용합니다.
- 전반적인 효율성: EfficientDet-d0은 가장 낮은 FLOPs를 갖지만 YOLOv10n은 훨씬 더 높은 mAP(39.5 대 34.6)를 제공하며 비슷한 수의 파라미터로 GPU에서 훨씬 빠릅니다. 이는 YOLOv10과 같은 최신 아키텍처가 단순히 FLOPs를 최소화하는 것보다 더 나은 실제 효율성 절충안을 제공한다는 것을 보여줍니다.
결론: 어떤 모델을 선택해야 할까요?
EfficientDet은 당시 선구적인 모델이었지만, YOLOv10은 거의 모든 최신 애플리케이션에서 명확한 승자입니다. 뛰어난 속도와 정확도를 제공하며, 엔드 투 엔드, NMS-free 설계는 실제 배포에 큰 이점입니다.
개발자 및 연구자에게 Ultralytics 생태계의 이점으로 인해 선택이 더욱 분명해집니다. YOLOv10은 다음을 제공합니다.
- 뛰어난 성능: 최신 하드웨어에서 속도와 정확성 간의 더 나은 균형을 제공합니다.
- 사용 편의성: 학습, 검증 및 추론을 위한 간단하고 통합된 API를 제공합니다.
- 견고한 생태계: 광범위한 문서, 활발한 커뮤니티 지원 및 전체 MLOps 파이프라인을 간소화하는 Ultralytics HUB와 같은 도구에 액세스할 수 있습니다.
객체 감지 이상의 기능이 필요한 프로젝트의 경우 감지, 분할, 포즈 추정, 분류 및 추적을 위한 다용도 최첨단 프레임워크를 제공하는 Ultralytics YOLOv8을 살펴보는 것이 좋습니다.
다른 모델 비교 살펴보기
결정을 내리는 데 도움이 되도록 이러한 모델 및 기타 최첨단 모델과 관련된 다른 비교를 살펴보십시오.
- EfficientDet 대 YOLOv8
- YOLOv10 vs YOLOv8
- YOLOv10 vs RT-DETR
- Ultralytics의 최신 발전을 위해 YOLO11과 같은 최신 모델을 살펴보세요.