Link to this sectionEfficientDet 대 PP-YOLOE+#

컴퓨터 비전 분야는 객체 탐지 모델의 지속적인 발전으로 크게 변화해 왔습니다. 이 여정에서 중요한 두 가지 이정표는 Google의 EfficientDet과 Baidu의 PP-YOLOE+입니다. 두 아키텍처 모두 계산 효율성과 탐지 정확도 사이의 미묘한 균형을 맞추도록 설계되었지만, 이 과제에 접근하는 설계 철학은 근본적으로 다릅니다.

이 포괄적인 가이드에서는 두 모델의 아키텍처, 학습 방법론 및 실제 배포 시나리오를 분석하여 차기 컴퓨터 비전 애플리케이션에 최적인 신경망을 선택할 수 있도록 돕습니다.

Link to this section아키텍처 혁신 및 설계 철학#

엣지 디바이스든 클라우드 서버든 프로덕션 환경에 이 모델들을 효과적으로 배포하려면 이들의 기초 아키텍처를 이해하는 것이 중요합니다.

Link to this sectionEfficientDet: 복합 스케일링의 힘#

Google Research에서 개발한 EfficientDet은 모델 스케일링을 임시 방편적인 과정이 아닌 수학적으로 원칙을 지키는 복합 스케일링 방법으로 다룸으로써 패러다임의 변화를 가져왔습니다.

저자: Mingxing Tan, Ruoming Pang, Quoc V. Le
조직: Google Research
날짜: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl
문서: EfficientDet 문서

EfficientDet에 대해 자세히 알아보기

EfficientDet의 핵심 혁신은 **Bi-directional Feature Pyramid Network (BiFPN)**에 있습니다. 상향식(top-down)으로만 피처를 합치는 기존 FPN과 달리, BiFPN은 학습 가능한 가중치를 도입하여 상향식 및 하향식으로 교차 스케일 피처 융합을 수행합니다. 이를 통해 네트워크는 다양한 입력 피처의 중요도를 직관적으로 파악할 수 있습니다. EfficientNet 백본과 결합된 EfficientDet은 해상도, 깊이, 너비를 동시에 스케일링하여 다양한 계산 예산에 맞는 모델 제품군(d0에서 d7)을 구성합니다.

EfficientDet 스케일링

EfficientDet을 배포할 때는 타겟 하드웨어를 신중하게 고려하십시오. d0는 모바일 디바이스에 적합하지만, d7까지 스케일링하려면 상당한 GPU 메모리와 연산 능력이 필요합니다.

Link to this sectionPP-YOLOE+: PaddlePaddle의 한계를 넘어서#

이전 모델들의 성공을 바탕으로 개발된 PP-YOLOE+는 Baidu의 PaddlePaddle 팀이 고처리량 서버 배포에 최적화된 최첨단 성능을 제공하기 위해 엔지니어링했습니다.

저자: PaddlePaddle 저자진
조직: Baidu
날짜: 2022-04-02
Arxiv: 2203.16250
GitHub: PaddlePaddle/PaddleDetection
문서: PP-YOLOE+ 구성

PP-YOLOE+에 대해 더 알아보기

PP-YOLOE+는 Cross Stage Partial 네트워크와 재매개변수화 기법을 결합하여 추론 지연 시간 증가 없이 피처 추출을 강화하는 CSPRepResNet 백본을 특징으로 합니다. **ET-head(Efficient Task-aligned head)**는 분류 및 로컬라이제이션 작업 간의 정렬을 크게 개선합니다. 또한 앵커 프리(anchor-free) 설계와 동적 레이블 할당(TAL)을 결합하여 학습 과정을 간소화하고 다양한 데이터셋에 대한 일반화 성능을 향상시킵니다.

Link to this section성능 지표 및 벤치마크#

실시간 추론을 위한 모델을 선택할 때는 mAP(mean Average Precision)과 계산 속도 사이의 균형을 평가하는 것이 가장 중요합니다. 아래 표는 두 모델 제품군의 주요 성능 지표를 요약한 것입니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

살펴본 바와 같이, PP-YOLOE+는 일반적으로 동일한 파라미터 수에서 더 높은 정확도 정점을 달성하며, 특히 더 큰 모델 변형(l 및 x)에서 그렇습니다. 이 모델은 GPU 처리량에 최적화되어 있어 배치 처리 서버 배포에 매우 적합합니다. 반면, 더 작은 EfficientDet 모델은 매우 효율적인 파라미터 대 FLOP 비율을 제공하여 메모리 제약이 심한 환경에서 유리할 수 있습니다.

Link to this section이상적인 사용 사례 및 배포 전략#

이 아키텍처들 사이에서 선택하는 것은 기존 기술 스택과 배포 하드웨어에 크게 좌우되는 경우가 많습니다.

EfficientDet을 선택해야 할 때:

AutoML 워크플로우: Google 생태계에 깊이 투자되어 있고 자동화된 아키텍처 탐색 기능에 의존하는 경우.
자원 제약이 있는 엣지: 하위 모델(d0, d1)은 파라미터 풋프린트가 엄격한 제약 사항인 모바일 CPU에서 예측 가능한 성능을 제공합니다.

PP-YOLOE+를 선택해야 할 때:

고성능 GPU 서버: 스마트 시티 감시를 위해 수백 개의 동시 비디오 스트림을 처리하는 등 NVIDIA 하드웨어에서 최대 처리량을 요구하는 시나리오.
PaddlePaddle 생태계: 개발 팀이 이미 Baidu의 딥러닝 프레임워크를 사용 중이라면 PP-YOLOE+ 통합은 매우 원활합니다.

Link to this sectionUltralytics의 강점: YOLO26 소개#

EfficientDet과 PP-YOLOE+는 강력한 모델이지만, 빠르게 변화하는 AI 혁신 속도는 최첨단 성능과 타의 추종을 불허하는 사용 편의성을 모두 제공하는 솔루션을 요구합니다. 바로 이 지점에서 Ultralytics YOLO26이 탁월한 역량을 발휘하며, 현대적인 컴퓨터 비전 애플리케이션을 위한 최고의 선택지로 자리매김하고 있습니다.

2026년에 출시된 YOLO26은 네이티브 End-to-End NMS-Free Design을 도입하여 실시간 객체 탐지를 완전히 재정의합니다. 이전 모델들에서 고질적인 병목 현상이었던 NMS(Non-Maximum Suppression) 후처리를 제거함으로써, YOLO26은 배포를 획기적으로 단순화하고 추론 지연 시간 지터를 감소시킵니다.

또한, YOLO26은 엣지 배포에 최적화되어 있습니다. DFL(Distribution Focal Loss)을 제거하여 ONNX 및 TensorRT와 같은 형식으로의 내보내기 과정을 간소화했으며, 이전 세대 대비 최대 43% 더 빠른 CPU 추론을 제공합니다. 이는 배터리 구동 IoT 디바이스에 절대적인 성능을 제공합니다.

MuSGD를 통한 학습 안정성

YOLO26은 SGD와 Muon의 하이브리드인 혁신적인 MuSGD 옵티마이저를 통합했습니다. LLM 학습의 발전에 영감을 받은 이 옵티마이저는 고도로 안정적인 학습과 빠른 수렴을 보장하여 귀중한 GPU 연산 시간을 절약해 줍니다.

개발자들은 ProgLoss + STAL을 포함한 YOLO26의 고급 손실 함수를 활용할 수도 있으며, 이는 항공 이미지 및 정밀 농업 애플리케이션의 핵심 요구 사항인 소형 객체 인식에서 놀라운 성능 개선을 보여줍니다.

Link to this sectionUltralytics를 통한 원활한 배포#

Ultralytics의 진정한 힘은 통합된 생태계에 있습니다. 복잡하고 맞춤화된 학습 스크립트가 필요한 모델들과 달리, YOLO26은 놀라울 정도로 간소화된 API를 제공합니다. 커스텀 데이터셋에서 모델을 학습시키는 데는 단 몇 줄의 Python 코드면 충분합니다:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference on a new image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

표준 탐지가 필요하든 인스턴스 세그멘테이션 및 자세 추정과 같은 전문적인 작업이 필요하든, YOLO26은 모두 동일한 사용자 친화적 프레임워크 내에서 멀티 스케일 프로토타입과 RLE(Residual Log-Likelihood Estimation)를 통해 이를 네이티브하게 지원합니다.

Link to this section다른 주목할 만한 모델 살펴보기#

특정 기업 요구 사항에 맞는 아키텍처를 평가 중이라면, 여전히 강력한 프로덕션 테스트를 거친 Ultralytics YOLO11을 고려하는 것도 좋습니다. Transformer 기반 아키텍처가 필요한 애플리케이션의 경우 RT-DETR이 흥미로운 대안을 제공하지만, 일반적으로 매우 효율적인 YOLO 변형 모델들에 비해 학습 중 더 높은 CUDA 메모리 오버헤드를 요구합니다.

결론적으로 EfficientDet은 원칙적인 스케일링을 제공하고 PP-YOLOE+는 특정 프레임워크 내에서 뛰어난 GPU 처리량을 제공하지만, Ultralytics YOLO26은 오늘날 사용할 수 있는 가장 균형 잡히고 다재다능하며 개발자 친화적인 솔루션을 제공합니다. 네이티브한 종단간(End-to-End) 아키텍처와 광범위한 통합 기능 덕분에 차세대 비전 AI의 기반으로 추천되는 모델입니다.

기여자

GLglenn-jocher¹⁴ SEsergiuwaxmann¹

생성됨 2025년 1월 27일업데이트됨 3주 전