콘텐츠로 건너뛰기

EfficientDet vs. PP-YOLOE+: 기술 비교

컴퓨터 비전의 진화에서 Google EfficientDet과 바이두의 PP-YOLOE+의 대조만큼 디자인 철학의 변화를 명확하게 보여주는 비교는 드뭅니다. EfficientDet이 복합 스케일링을 통해 매개변수 효율성의 이정표를 세웠다면, PP-YOLOE+는 GPU 추론에 최적화된 앵커 없는 고속 감지의 현대적 시대를 대표합니다.

이 분석에서는 아키텍처, 성능 메트릭 및 실제 애플리케이션을 자세히 살펴보고 개발자가 특정 객체 감지 요구 사항에 적합한 도구를 선택하는 데 도움을 줍니다.

정면 대결 성능 분석

이 두 모델의 출시 사이에 성능 환경이 크게 변화했습니다. EfficientDet은 FLOP (부동 소수점 연산)과 매개변수 수를 최소화하는 데 중점을 두어 이론적으로 효율적입니다. 그러나 PP-YOLOE+는 GPU와 같은 하드웨어 가속기에서 실질적인 추론 속도를 위해 설계되었으며, TensorRT 최적화를 활용합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

데이터에서 중요한 인사이트를 발견할 수 있습니다. EfficientDet-d0은 가벼운 반면, 더 큰 변형(d5-d7)은 상당한 지연 시간을 겪습니다. 반대로 PP-YOLOE+l은 평균 평균 정밀도(mAP) 가 EfficientDet-d6과 비슷하지만(52.9 vs 52.6), T4 GPU 10배 이상 빠르게 실행됩니다(8.36ms vs 89.29ms).

EfficientDet: 확장 가능한 효율성

EfficientDet은 이전 탐지기의 효율성 제약을 극복하기 위해 Google Brain AutoML 팀에서 도입했습니다. 이 제품은 해상도, 깊이, 폭을 균일하게 확장하는 복합 확장 방법을 적용하는 EfficientNet 백본을 기반으로 구축되었습니다.

저자: 저자: 탄 밍싱, 팡 루밍, 레 콕
조직:Google
날짜: 2019-11-20
아카이브:1911.09070
깃허브:google
문서:README

주요 아키텍처 기능

  1. BiFPN(양방향 피처 피라미드 네트워크): 기존 FPN과 달리 BiFPN을 사용하면 멀티스케일 특징 융합을 쉽게 수행할 수 있습니다. 학습 가능한 가중치를 도입하여 다양한 입력 특징의 중요성을 학습하고 하향식 및 상향식 멀티스케일 특징 융합을 반복적으로 적용합니다.
  2. 복합 스케일링: 단일 복합 계수 $\phi$로 네트워크 폭, 깊이, 해상도를 제어하여 다양한 리소스 제약 조건에 맞는 모델 제품군(D0~D7)을 사용할 수 있습니다.

강점과 약점

  • 장점: 뛰어난 매개변수 효율성, FLOP이 주요 병목 현상인 저전력 CPU에 효과적, 고도로 구조화된 확장 접근 방식.
  • 약점: BiFPN의 복잡한 연결과 깊이별로 분리 가능한 컨볼루션은 종종 GPU의 메모리를 사용하므로, 낮은 FLOP 수에도 불구하고 실제 추론 지연 시간이 느려집니다.

알고 계셨나요?

EfficientDet은 깊이별로 분리 가능한 컨볼루션을 많이 사용하므로 파라미터 수가 크게 줄어들지만, YOLO 같은 모델에 사용되는 표준 컨볼루션에 비해 GPU 사용률이 낮아질 수 있습니다.

EfficientDet에 대해 자세히 알아보세요.

PP-YOLOE+: 닻을 내리지 않는 도전자

PaddlePaddle 생태계의 일부로 바이두에서 출시한 PP-YOLOE+는 PP-YOLOv2의 진화된 버전입니다. 완전히 앵커가 없는 메커니즘과 고급 트레이닝 전략을 채택하여 YOLOv5 YOLOX의 성능을 능가하는 것을 목표로 합니다.

저자들: PaddlePaddle 저자
조직:바이두
날짜: 2022-04-02
아카이브:2203.16250
깃허브:PaddlePaddle
문서:PP-YOLOE+ 컨피그스

주요 아키텍처 기능

  1. 앵커 프리 디자인: 사전 정의된 앵커 박스를 제거함으로써 PP-YOLOE+는 감지 헤드를 간소화하고 하이퍼파라미터 조정 부담을 줄입니다.
  2. CSPRepResNet: 백본은 훈련 중 잔여 연결의 이점을 결합하여 추론을 위한 간소화된 구조로 다시 매개변수화하는 RepResBlock을 활용합니다.
  3. TAL(작업 정렬 학습): 분류 점수와 로컬라이제이션 품질을 동적으로 조정하는 고급 라벨 할당 전략입니다.

강점과 약점

  • 강점: COCO 데이터 세트의 최첨단 정확도, TensorRT 하드웨어에서 매우 빠른 속도, 혁신적인 헤드 디자인.
  • 약점: PyTorch 표준화된 팀에 통합 문제를 야기할 수 있는 PaddlePaddle 프레임워크에 크게 묶여 있음; 소규모 모델의 경우 EfficientDet-d0에 비해 파라미터 수가 약간 더 많음.

Ultralytics 이점: 통합 솔루션

EfficientDet은 이론적인 효율성을 제공하고 PP-YOLOE+는 원시 속도를 제공하지만, 개발자는 종종 성능과 사용성 및 에코시스템 지원 간의 균형을 맞추는 솔루션을 필요로 합니다. 바로 여기에 Ultralytics YOLO11 가 탁월한 솔루션입니다.

비교 모델의 특수한 특성과 달리, Ultralytics 모델은 최신 MLOps 워크플로우를 위해 설계되어 교육 및 배포가 간편한 기본 PyTorch 환경을 제공합니다.

Ultralytics YOLO11을 선택해야 하는 이유

  • 사용의 용이성: 개발자 경험에 초점을 맞춘 Ultralytics 사용하면 설치부터 추론까지 Python 코드 3줄로 완료할 수 있습니다. 복잡한 연산자 라이브러리를 수동으로 컴파일하거나 독점 형식을 변환할 필요가 없습니다.
  • 다용도성: 단일 프레임워크가 오브젝트 감지, 인스턴스 세분화, 포즈 추정, 분류OBB(오리엔티드 바운딩 박스)를 지원합니다.
  • 성능 균형: YOLO11 속도와 정확성 간의 균형을 최적화하여 Jetson과 같은 엣지 디바이스와 클라우드 GPU 모두에서 실시간 추론 기능을 제공합니다.
  • 메모리 요구 사항: Ultralytics YOLO 모델은 일반적으로 트랜스포머 기반 대안이나 구형 멀티스케일 피처 네트워크에 비해 훈련 중에 CUDA 메모리를 덜 필요로 하는 최적화된 아키텍처를 사용합니다.
  • 잘 관리된 에코시스템: 활발한 오픈 소스 커뮤니티의 지원을 받는 리포지토리는 자주 업데이트되어 최신 버전의 PyTorch, CUDA 및 Python 호환성을 보장합니다.
  • 훈련 효율성: 사용자는 즉시 사용 가능한 사전 학습된 가중치를 활용하여 사용자 지정 데이터 세트에서 모델을 빠르게 미세 조정할 수 있으므로 학습 데이터 요구 사항과 컴퓨팅 비용을 크게 줄일 수 있습니다.

코드 예시: YOLO11 시작하기

최첨단 모델을 실행하는 것은 복잡하지 않아야 합니다. 다음은 Ultralytics 사용하여 객체 감지를 얼마나 쉽게 구현할 수 있는지 설명합니다:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

YOLO11에 대해 자세히 알아보세요

결론

하드웨어 제약 조건과 레거시 요구 사항에 따라 EfficientDet과 PP-YOLOE+ 중 어떤 것을 선택할지 결정해야 합니다.

  • EfficientDet은 매개변수 효율적 확장에 대한 연구에 유효한 참조로 남아 있으며 메모리 대역폭이 부족한 특정 CPU 시나리오에 적합합니다.
  • PP-YOLOE+는 고성능 GPU 배포를 위한 탁월한 선택으로, PaddlePaddle 생태계를 탐색하는 데 익숙하다면 지연 시간과 정확도의 균형을 훨씬 더 잘 맞출 수 있습니다.

그러나 스마트 시티 분석부터 농업 모니터링에 이르기까지 대부분의 실제 애플리케이션에서는 다음과 같은 방법을 사용합니다.Ultralytics YOLO11 이 가장 실용적인 선택입니다. 이 제품은 최신 앵커 프리 디텍터의 아키텍처 혁신과 탁월한 사용자 경험을 결합하여 복잡한 프레임워크 디버깅 대신 비즈니스 문제 해결에 집중할 수 있도록 해줍니다.

다른 모델 알아보기

더 자세히 알아보려면 관련 비교 자료를 검토해 보세요:


댓글