효율적 탐지(EfficientDet) 대 YOLOv10: 실시간 객체 탐지의 진화
컴퓨터 비전 분야는 2019년 Google EfficientDet 출시와 YOLOv10 칭화대학교의 YOLOv10 출시 사이 극적으로 변화했다. 개발자와 연구자에게 복잡한 복합 스케일링에서 간소화된 엔드투엔드 아키텍처로의 진화 경로를 이해하는 것은 작업에 적합한 도구를 선택하는 데 필수적이다. 본 분석은 EfficientDet의 기존 정밀도와 YOLOv10의 저지연 혁신을 비교한다. YOLOv10의 저지연 혁신을 비교하며, Ultralytics 같은 현대적 솔루션이 생산 환경에서 새로운 기준을 어떻게 설정하고 있는지 조명합니다.
효율적 탐지: 복합 확장성의 유산
Google 팀이 발표한 EfficientDet는 신경망 효율성 최적화의 주요 이정표였습니다. 이 모델은 단일 차원만 조정하는 대신 네트워크 백본의 해상도, 깊이, 너비를 균일하게 확장하는 '복합 확장( Compound Scaling)' 개념을 도입했습니다.
효율적탐지 기술적 세부사항:
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직:조직:Google 리서치
- 날짜:20
- Arxiv:EfficientDet: 확장 가능하고 효율적인 물체 감지
- GitHub:google
EfficientDet의 핵심은 양방향 피라미드 네트워크(BiFPN)입니다. 기존 FPN이 서로 다른 스케일의 특징을 단순히 합산하는 것과 달리, BiFPN은 복잡한 가중치 기반 특징 융합을 가능하게 하여 모델이 다양한 입력 특징의 중요도를 학습할 수 있게 합니다. 이 아키텍처는 당시 COCO 최첨단 평균 정밀도(mAP)를 달성했으나, BiFPN 레이어 간의 복잡한 상호 연결로 인해 상당한 계산 오버헤드가 발생하여, 특히 에지 디바이스에서의 추론 속도가 현대적 아키텍처에 비해 느려집니다.
YOLOv10: 종단간 혁명
칭화대학교 연구진이 개발한 YOLOv10 YOLO 주요 병목 현상인 비최대 억제(NMS) 문제를 해결합니다. 훈련 과정에서 일관된 이중 할당 전략을 적용함으로써, YOLOv10 각 객체에 대해 단일 최적 경계 상자를 예측하도록 YOLOv10 효과적으로 NMS 종단간 탐지기가 됩니다.
YOLOv10 세부사항:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직:조직: 칭화 대학교
- 날짜:23
- Arxiv:YOLOv10: 실시간 종단 간 객체 detect
- GitHub:THU-MIG/yolov10
이러한 아키텍처 변경으로 추론 지연 시간이 크게 감소합니다. 또한 본 모델은 대규모 커널 컨볼루션과 부분적 자기 주의를 활용하여 효율성과 정확도를 종합적으로 고려한 설계를 도입함으로써, 기존 모델에서 나타나는 매개변수 과잉 현상 없이 성능을 향상시킵니다.
성능 비교: 속도 vs. 정확도
이 두 세대 모델 간의 성능 차이는 특히 추론 속도 측면에서 극명합니다. EfficientDet-d7은 높은 정확도를 추구하지만, 그 대가로 엄청난 지연 시간(100ms 이상)을 감수해야 하는 반면, YOLOv10 한 자릿수 밀리초 단위로 유사하거나 더 나은 정확도를 달성합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| 0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| 1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| 2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| 3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| 4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| 5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| 6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| 7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
아키텍처 분석
- 후처리: EfficientDet는 중첩된 박스를 필터링하기 NMS 크게 의존합니다. 밀집된 장면에서는 이 후처리 단계가 CPU 현상이 되어 GPU 무관하게 전체 GPU 증가시킵니다. YOLOv10 NMS 없는 설계는 이 단계를 완전히 제거합니다.
- 메모리 사용량: EfficientDet, 특히 d7과 같은 높은 스케일링은 BiFPN 구조로 인해 상당한 VRAM을 소모합니다. YOLOv10 낮은 메모리 사용량을 위해 YOLOv10 , 엣지 AI 애플리케이션에 더 적합합니다.
- 최적화: EfficientDet는 TensorFlow 기반으로 구축되어 ONNX 같은 형식으로 내보내기가 복잡할 수 있습니다 TensorFlow TensorRT 로 내보내는 것은 현대적인 YOLO의 네이티브 PyTorch 비해 복잡할 수 있습니다.
Ultralytics 에코시스템의 이점
YOLOv10 인상적인 아키텍처 발전을 YOLOv10 , Ultralytics 내에서 이를 활용하면 그 유용성이 더욱 증폭됩니다. 개발자들은 종종 학술 저장소의 파편화로 어려움을 겪습니다. Ultralytics 단일하고 잘 관리되는 Python 아래 모델들을 통합함으로써 이 문제를 Ultralytics .
왜 Ultralytics 선택해야 할까요?
- 사용 편의성: 단 한 줄의 코드로 YOLOv8, YOLOv10, YOLO11, YOLO26 간 전환 가능.
- 훈련 효율성: 사전 조정된 하이퍼파라미터와 자동 배치 크기 처리를 통해 최적의 자원 활용을 보장합니다.
- 배포 준비 완료: TFLite, CoreML, OpenVINO 및 ONNX 원클릭 내보내기.
- Ultralytics : Ultralytics 통해 데이터셋을 원활하게 관리하고, 클라우드에서 모델을 훈련하며, 모델을 배포하세요.
코드 예제
Ultralytics 사용한 추론 실행은 파이썬 스타일의 직관적인 방식으로 Ultralytics . YOLOv10 로드하고 예측을 실행하는 방법은 다음과 같습니다:
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Run inference on an image from the internet
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
생산 권장 사항: YOLO26으로 업그레이드
EfficientDet는 중요한 역사적 벤치마크 역할을 수행했으며 YOLOv10 NMS 패러다임을 YOLOv10 , Ultralytics 모델은 이 진화의 정점을 생산 환경에서 구현한 사례입니다.
2026년 1월 출시된 YOLO26은 YOLOv10 NMS( NMS Multi- NMS) 없는 혁신을 기반으로 YOLOv10 실제 환경에서의 견고성을 위해 개선되었습니다. 이 모델은 분포 초점 손실(DFL) 제거 기능을 특징으로 하여 모델 그래프를 단순화함으로써 더 쉬운 내보내기와 저전력 에지 장치와의 향상된 호환성을 제공합니다.
또한 YOLO26은 SGD ( SGD 대규모 언어 모델 훈련 혁신에서 영감을 얻음)의 하이브리드인 MuSGD 최적화기를 도입하여 더 빠른 수렴과 안정적인 훈련을 보장합니다. ProgLoss 및 STAL (형상 인식 작업 정렬 손실)과 같은 최적화를 통해 YOLO26은 우수한 소형 물체 탐지 성능을 제공하며, CPU 시 이전 세대 대비 최대 43% 더 빠른 속도를 보여줍니다.
실제 사용 사례
적합한 모델 선택은 특정 제약 조건에 따라 달라집니다:
- 효율적 탐색(EfficientDet): 복합 스케일링이나 BiFPN 아키텍처 연구가 필요한 학술 연구에 가장 적합합니다. 또한 마이그레이션 비용이 최신 모델의 성능 이점을 상회하는 레거시 시스템에서도 발견됩니다.
- YOLOv10 YOLOv26: 이상적인 선택 실시간 애플리케이션.
- 로봇공학: NMS 설계는 지연 시간 변동을 줄여주며, 이는 항법 및 장애물 회피에 매우 중요합니다.
- 트래픽 모니터링: 높은 처리량으로 GPU 객체 추적을 GPU 다중 비디오 스트림을 처리할 수 있습니다.
- 모바일 앱: 매개변수 수가 적고 메모리 사용량이 낮아 iOS Android 배포하기에 이상적인 모델입니다.
속도, 정확도, 배포 용이성의 최적 균형을 추구하는 개발자를 위해, Ultralytics 또는 YOLO11 으로의 전환이 권장되는 방향입니다.