YOLOv7 대 EfficientDet: 실시간 객체 감지 아키텍처의 기술적 비교
물체 감지는 컴퓨터 비전의 초석으로, 자율 주행부터 의료 영상에 이르기까지 다양한 분야에서 혁신을 주도하고 있습니다. 정확도, 속도, 컴퓨팅 리소스의 균형을 맞추려면 올바른 아키텍처를 선택하는 것이 중요합니다. 이 분석에서는 다음과 같은 아키텍처에 대해 자세히 살펴봅니다. YOLOv7 과 실시간 감지 환경을 형성한 두 가지 영향력 있는 모델인 EfficientDet에 대해 자세히 살펴봅니다.
건축 설계 및 철학
이 두 아키텍처의 근본적인 차이점은 최적화 목표에 있습니다. Google Brain 팀에서 개발한 EfficientDet은 매개변수 효율성과 부동 소수점 연산(FLOP)에 우선순위를 둡니다. 확장 가능한 아키텍처를 활용하여 사용자가 리소스와 정확도를 선형적으로 교환할 수 있습니다. 이와 대조적으로 YOLOv7은 최신 정확도를 유지하면서 GPU 하드웨어에서 추론 속도를 극대화하는 데 초점을 맞추고 있습니다(Chien-Yao Wang 외).
EfficientDet: 컴파운드 스케일링 및 BiFPN
EfficientDet은 네트워크 해상도, 깊이, 폭을 균일하게 확장하는 복합 확장 방법을 사용하는 EfficientNet 백본을 기반으로 구축되었습니다. EfficientDet의 핵심 혁신은 양방향 피처 피라미드 네트워크(BiFPN)입니다. 기존 FPN과 달리 BiFPN은 학습 가능한 가중치를 도입해 다양한 입력 특징의 중요성을 학습함으로써 쉽고 빠르게 멀티스케일 특징 융합을 수행할 수 있습니다. 이러한 설계 덕분에 EfficientDet은 메모리와 FLOP이 엄격하게 제한되는 엣지 컴퓨팅 애플리케이션에 매우 효과적입니다.
YOLOv7: E-ELAN 및 모델 재매개변수화
YOLOv7 확장된 효율적인 레이어 집계 네트워크(E-ELAN)를 도입했습니다. 이 아키텍처는 최단 및 최장 경사 경로를 제어하여 원래 경사 경로를 파괴하지 않고 네트워크의 학습 능력을 향상시킵니다. 또한 YOLOv7 복잡한 학습 구조를 간소화된 추론 구조로 단순화하는 기술인 모델 재파라미터화를 사용합니다. 그 결과 훈련 중에는 견고하지만 GPU에 배포할 때는 매우 빠른 모델이 생성됩니다.
성능 분석: 메트릭 및 벤치마크
성능을 비교할 때, 배포 하드웨어에 따라 선택이 달라지는 경우가 많습니다. EfficientDet은 저전력 환경(CPU)에서 뛰어난 성능을 발휘하는 반면, YOLOv7 높은 처리량의 GPU 추론을 위해 설계되었습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
주요 내용
- 지연 시간 대 효율성: EfficientDet-d0은 훨씬 적은 수의 파라미터(3.9M)를 사용하는 반면, YOLOv7l은 GPU에서 매우 낮은 지연 시간(6.84ms)으로 훨씬 더 높은 mAP (51.4%)를 제공합니다. 이는 병렬 처리 능력에 대한 YOLOv7 뛰어난 활용도를 보여줍니다.
- 확장성: EfficientDet은 d0에서 d7까지 세분화된 확장 경로를 제공하여 개발자가 특정 CPU 제약 조건에 맞게 모델 크기를 미세 조정할 수 있습니다.
- 하이엔드 정확도: 최고급형인 EfficientDet-d7은 뛰어난 정확도(53.7% mAP)를 달성하지만 지연 시간(~128ms)이 길다는 대가를 치릅니다. YOLOv7x는 T4 GPU 10분의 1도 안 되는 추론 시간(11.57ms)으로 비슷한 정확도(53.1% mAP)를 달성합니다.
하드웨어 고려 사항
배포 대상이 일반 CPU 또는 모바일 프로세서인 경우, EfficientDet 모델(특히 d0-d2)의 낮은 FLOPs는 배터리 수명 및 열 관리 측면에서 더 나은 결과를 가져오는 경우가 많습니다. 에지 GPU(예: NVIDIA Jetson) 또는 클라우드 추론 서버의 경우, YOLOv7 은 실시간 비디오 분석을 위해 훨씬 더 높은 프레임 속도를 제공합니다.
교육 방법론 및 최적화
이러한 모델의 교육 전략은 아키텍처 목표를 반영합니다.
YOLOv7 은 '공짜 가방' 접근 방식을 사용하여 학습 비용은 증가하지만 추론 속도에 영향을 주지 않고 정확도를 향상시키는 방법을 통합합니다. 주요 기술은 다음과 같습니다:
- 거칠고 세밀한 심층 감독: 보조 헤드는 네트워크의 중간 계층을 감독하는 데 사용되며, 보조 헤드를 리드 헤드와 다르게 안내하는 레이블 할당 전략을 사용합니다.
- 동적 라벨 할당: 이 모델은 학습 중에 앵커에 대한 기준점 객체 할당을 조정하여 수렴을 개선합니다.
EfficientDet은 최적의 백본 및 기능 네트워크 아키텍처를 찾기 위해 AutoML에 크게 의존합니다. 일반적으로 교육에는 다음이 포함됩니다:
- 확률적 깊이: 일반화를 개선하기 위해 훈련 중에 무작위로 레이어를 떨어뜨립니다.
- 스위시 활성화: 부드럽고 단조롭지 않은 기능으로, 더 깊은 네트워크에서 지속적으로 ReLU보다 뛰어난 성능을 발휘합니다.
Ultralytics 이점
YOLOv7 EfficientDet은 모두 강력하지만 컴퓨터 비전의 환경은 빠르게 진화하고 있습니다. Ultralytics 에코시스템은 다음과 같은 최신 대안을 제공합니다. YOLO11 과 같은 최신 대안을 제공하며, 이는 이전 아키텍처의 장점을 종합하는 동시에 개발자 경험을 향상시킵니다.
사용 편의성 및 에코시스템
연구 지향 리포지토리(예: 원래 EfficientDet 코드베이스)의 주요 과제 중 하나는 통합의 복잡성입니다. Ultralytics 통합된 Python 패키지로 이 문제를 해결합니다. 개발자는 포괄적인 문서와 활발한 커뮤니티 지원의 지원을 받아 단 몇 줄의 코드만으로 모델을 훈련, 검증 및 배포할 수 있습니다.
다용도성 및 성능 균형
Ultralytics 모델은 바운딩 박스에만 국한되지 않습니다. 기본적으로 인스턴스 세분화, 포즈 추정, 분류 및 OBB(지향 객체 감지)를 지원합니다. 성능 측면에서 최신 YOLO 버전(예: YOLOv8 및 YOLO11)은 종종 EfficientDet보다 파라미터당 정확도가 높고 YOLOv7 추론 속도가 빠르며 실제 배포에 이상적인 균형을 이룹니다.
메모리 및 교육 효율성
Ultralytics YOLO 모델은 메모리 효율성이 뛰어난 것으로 유명합니다. 일반적으로 트랜스포머 기반 검출기나 확장 가능한 구형 아키텍처에 비해 훈련 시 CUDA 메모리를 덜 필요로 합니다. 따라서 연구자들은 소비자용 하드웨어에서 최첨단 모델을 훈련할 수 있습니다. 또한 즉시 다운로드할 수 있는 고품질의 사전 훈련된 가중치를 통해 전이 학습을 간소화할 수 있습니다.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with high speed
predictions = model("https://ultralytics.com/images/bus.jpg")
모델 사양
YOLOv7
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 출시일: 출시일: 2022년 7월 6일
- Paper:YOLOv7: 훈련 가능한 공짜 가방, 실시간 물체 감지기를 위한 새로운 최첨단 기술을 선보입니다.
- 출처GitHub 리포지토리
EfficientDet
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직 조직: Google 리서치, 브레인 팀
- 출시일 출시일: 2019년 11월 20일
- Paper:EfficientDet: 확장 가능하고 효율적인 물체 감지
- 출처GitHub 리포지토리
실제 사용 사례
EfficientDet을 선택해야 하는 경우
GPU 가속을 사용할 수 없는 임베디드 시스템에서는 여전히 EfficientDet이 강력한 후보입니다.
- 모바일 앱: CPU 객체 감지를 수행하는 iOS 애플리케이션.
- 원격 IoT 센서: 배터리로 구동되는 장치로, 모든 밀리와트 연산이 중요한 환경 변화를 모니터링합니다.
YOLOv7 선택해야 하는 경우
YOLOv7 고성능 산업 환경에서 탁월한 성능을 발휘합니다.
- 자율 주행: 높은 프레임 속도로 보행자와 차량을 감지하여 안전을 보장합니다.
- 스마트 시티: 엣지 서버에서 트래픽 관리를 위해 여러 비디오 스트림을 동시에 분석합니다.
결론
두 아키텍처 모두 컴퓨터 비전의 중요한 이정표입니다. EfficientDet은 매개변수 효율성을 위한 복합 스케일링의 힘을 보여주었고 YOLOv7 은 GPU 지연 시간 최적화의 한계를 뛰어넘었습니다.
그러나 가장 현대적이고 유지 관리가 용이하며 다양한 기능을 갖춘 솔루션을 찾는 개발자를 위해 Ultralytics YOLO11 모델 제품군을 권장합니다. 이 솔루션은 정확도와 속도 간의 뛰어난 트레이드오프, 더욱 간소화된 워크플로, 데이터 세트 큐레이션에서 배포까지의 여정을 간소화하는 강력한 에코시스템을 제공합니다.
다른 모델 살펴보기
다른 객체 감지 아키텍처를 비교하는 데 관심이 있다면 다음 리소스를 참조하세요: