콘텐츠로 건너뛰기

PP-YOLOE+ 대 EfficientDet: 포괄적인 기술 비교

강력한 컴퓨터 비전 애플리케이션을 구축하는 데 있어 올바른 아키텍처 선택은 매우 중요한 단계입니다. 본 기술 가이드에서는 두 가지 잘 알려진 객체 탐지 모델인 PP-YOLOE+와 EfficientDet 간의 장단점을 살펴봅니다. 두 모델의 아키텍처를 분석하고 성능 지표를 평가하며, 각각의 이상적인 배포 시나리오를 탐구할 것입니다.

두 모델 모두 해당 분야에 상당한 기여를 해왔지만, Ultralytics 같은 현대적 대안들이 어떻게 훨씬 뛰어난 메모리 효율성, 더 빠른 추론 속도, 그리고 매우 간소화된 개발자 경험을 제공하는지에 대해서도 논의할 것입니다.

건축 개요: PP-YOLOE+

PP-YOLOE+는 PaddlePaddle 내 서버 측 GPU에서 성능을 최적화하기 위해 특별히 구축된,YOLO 진화 버전입니다. 이 모델은 앵커 프리 패러다임에 중점을 두고 기본 아키텍처에 여러 개선 사항을 도입했습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

PP-YOLOE+는 CSPRepResNet 백본과 효율적인 작업 정렬 헤드(ET-head)를 특징으로 하며, 분류에는 가변 초점 손실(varifocal loss)을, 바운딩 박스 회귀에는 분포 초점 손실(distribution focal loss)을 중점적으로 활용합니다. 앵커 프리(anchor-free) 탐지기 설계로의 전환은 후처리 파이프라인을 간소화하여 출시 당시 매우 경쟁력 있는 성능을 발휘했습니다.

통합 혜택

이미 바이두의 PaddlePaddle 깊이 투자한 팀들은 인스턴스 분할과 같은 작업에 PP-YOLOE+를 더 쉽게 채택할 수 있지만, 최신 도구에서 볼 수 있는 광범위한 다중 프레임워크 지원은 부족합니다.

건축 개요: 효율적 감지

EfficientDet은 객체 탐지에 근본적으로 다른 접근 방식을 취하며, 신경망 구조 탐색과 복합 스케일링 원리에 크게 의존합니다.

EfficientDet에 대해 자세히 알아보세요.

EfficientDet의 핵심은 양방향 피처 피라미드 네트워크(BiFPN)입니다. 기존 FPN과 달리 BiFPN은 학습 가능한 가중치를 도입하여 다양한 입력 피처의 중요도를 학습함으로써 쉽고 빠르게 다중 스케일 피처 융합을 가능하게 합니다. EfficientNet 백본과 결합된 EfficientDet는 네트워크 폭, 깊이, 해상도를 동시에 체계적으로 확장합니다.

이론적으로 FLOPs 측면에서 매우 효율적인 EfficientDet 모델은 복잡한 메모리 접근 패턴으로 인해 이론적 효율성을 실제 에지 디바이스 속도로 전환하는 데 어려움을 겪을 수 있으며, 이는 YOLO 모델의 낮은 메모리 요구 사항과 극명한 대조를 이룬다.

성능 분석 및 벤치마크

아래 표는 COCO 같은 표준 데이터셋에 대한 주요 지표를 비교합니다. 평균 정밀도(mAP) 와 추론 속도를 비교함으로써 파레토 최전선을 명확히 파악할 수 있습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0

그림에서 보듯이, PP-YOLOE+는 고성능 mAP 원시 mAP 측면에서 일반적으로 더 우수한 확장성을 보이며, EfficientDet는 매개변수 최소화를 시도합니다. 그러나 양자 모두 최첨단 엣지 AI에 요구되는 현대적 실시간 처리 능력에는 미치지 못합니다.

사용 사례 및 권장 사항

PP-YOLOE+와 EfficientDet 중 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 다음에 대한 강력한 선택입니다:

  • PaddlePaddle 통합: 기존 인프라가 바이두의 PaddlePaddle 프레임워크 및 툴링을 기반으로 구축된 조직.
  • 패들 라이트 에지 배포: 패들 라이트 또는 패들 추론 엔진 전용으로 고도로 최적화된 추론 커널을 갖춘 하드웨어에 배포합니다.
  • 고정밀 서버 측 탐지: 프레임워크 의존성이 문제가 되지 않는 강력한 GPU 최대 탐지 정확도를 우선시하는 시나리오.

EfficientDet을 선택해야 하는 경우

EfficientDet는 다음에 권장됩니다:

  • Google 및 TPU : Google Vision API 또는 TPU 깊이 통합된 시스템으로, EfficientDet가 네이티브 최적화를 제공합니다.
  • 복합 스케일링 연구: 균형 잡힌 네트워크 깊이, 너비 및 해상도 스케일링의 효과를 연구하는 데 초점을 맞춘 학술적 벤치마킹.
  • TFLite 통한 모바일 배포: Android 임베디드 Linux 기기용 TensorFlow 내보내기가 특별히 필요한 프로젝트.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

현대적 대안: Ultralytics

PP-YOLOE+와 EfficientDet는 중요한 역사적 이정표이지만, 최첨단 정확도, 낮은 메모리 소비량, 간소화된 사용자 경험을 추구하는 개발자들은 Ultralytics 고려해야 합니다.

YOLO26은 객체 탐지에서 획기적인 발전을 이루었으며, 다음과 같은 중요한 혁신을 도입했습니다:

  • 엔드투엔드 NMS 설계: YOLOv10의 혁신을 바탕으로, YOLO26은 추론 과정에서 비최대 억제(NMS)를 기본적으로 제거합니다. 이로 인해 지연 시간이 크게 감소하고 복잡한 후처리 병목 현상이 사라집니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 혁신에서 영감을 받아, YOLO26은 SGD 뮤온 최적화기를 SGD 하이브리드 방식을 활용합니다. 이는 훈련 안정성을 획기적으로 개선하고 수렴 시간을 단축시킵니다.
  • 극한의 속도: YOLO26은 이전 세대( CPU : YOLO11보다 최대 43% 빠른 CPU 추론을 제공하여 배터리 구동 또는 CPU 전용 에지 디바이스에 대한 최고의 선택입니다.
  • 고급 손실 함수: ProgLoss와 STAL의 통합은 드론 분석로봇 공학과 같은 작업에 필수적인 소형 물체 인식 성능을 크게 향상시킵니다.

다중 작업 유연성

EfficientDet가 순수하게 탐지에만 집중하는 것과 달리, YOLO26은 동일한 잘 관리된 생태계 내에서 자세 추정, 이미지 분류, 방향성 경계 상자(OBB)를 모두 기본적으로 처리합니다.

사용 편의성과 생태계 통합

기존 모델(예: EfficientDet)의 가장 큰 단점 중 하나는 훈련 파이프라인과 자동화된 머신러닝 설정의 복잡성입니다. 반면 Ultralytics 비교할 수 없는 개발자 경험을 제공합니다.

Ultralytics 사용한 모델 배포는 몇 줄의 코드만으로 Ultralytics , 이는 기존 프레임워크에서 요구하는 장황한 구성과 극명한 대조를 이룹니다.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

다른 대안을 모색하는 분들을 위해, 다음과 같은 아키텍처가 있습니다. RT-DETR 이나 구형 YOLOv8 과 같은 아키텍처도 Ultralytics 내에서 사용할 수 있어, 원활한 교체 및 테스트가 가능합니다.

결론

PP-YOLOE+는 Paddle 생태계 내 특정 서버 배포에 여전히 강력한 선택지이며, EfficientDet는 자동화된 아키텍처 설계에 대한 흥미로운 연구 사례로 남아 있습니다. 그러나 실시간 추론, 배포 용이성, 최소 메모리 요구사항을 요구하는 현대적 애플리케이션에는 Ultralytics 가장 매력적인 성능 균형을 제공합니다. 본질적으로 NMS 설계와 초고속 CPU AI 인프라의 미래 대비를 위한 확실한 선택으로 자리매김합니다.


댓글