PP-YOLOE+ vs. EfficientDet: 객체 감지를 위한 기술 비교
올바른 객체 감지 모델을 선택하는 것은 컴퓨터 비전 애플리케이션의 성능, 확장성, 효율성에 영향을 미치는 중요한 결정입니다. 이 기술 비교에서는 두 가지 대표적인 아키텍처를 분석합니다: 바이두의 PaddlePaddle 에코시스템의 고성능 앵커 프리 디텍터인 PP-YOLOE+와 복합 확장 방식으로 유명한 Google 확장 가능한 아키텍처인 EfficientDet을 비교합니다.
PP-YOLOE+: 속도와 정확성에 최적화
PP-YOLOE+는 정밀도와 추론 속도 사이의 최적의 균형을 제공하기 위해 개발된 YOLO 시리즈의 중요한 진화를 나타냅니다. 앵커 프리 패러다임을 기반으로 구축된 이 제품은 탐지 파이프라인을 간소화하는 동시에 작업 정렬 학습(TAL)과 같은 고급 기술을 활용합니다.
- 작성자: PaddlePaddle 작성자
- 조직조직: Baidu
- 날짜: 2022-04-02
- Arxiv:https://arxiv.org/abs/2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- Docs:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
주요 아키텍처 기능
PP-YOLOE+는 CSPNet의 효율성과 ResNet의 재파라미터화 기능을 결합한 CSPRepResNet 백본을 통합합니다. 이를 통해 모델은 과도한 계산 비용을 들이지 않고도 풍부한 특징 표현을 캡처할 수 있습니다. 목은 효과적인 멀티스케일 특징 융합을 위해 경로 집계 네트워크(PAN)를 사용하여 작은 물체를 더 높은 신뢰도로 감지합니다.
눈에 띄는 기능은 효율적인 작업 정렬 헤드(ET-Head)입니다. 기존의 결합 헤드와 달리 ET-Head는 분류 작업과 로컬라이제이션 작업을 분리하여 TAL을 사용하여 최상의 앵커를 기준점 오브젝트에 동적으로 정렬합니다. 이 접근 방식은 수렴 속도와 최종 정확도를 크게 향상시킵니다.
EfficientDet: 확장 가능한 효율성
EfficientDet은 정확도와 효율성을 동시에 최적화하는 데 초점을 맞춘 새로운 모델 확장 방식을 도입했습니다. EfficientNet 백본을 기반으로 구축되었으며 가중치가 적용된 양방향 기능 피라미드 네트워크(BiFPN)를 도입했습니다.
- 작성자: Mingxing Tan, Ruoming Pang, Quoc V. Le
- 조직:Google
- 날짜: 2019-11-20
- Arxiv:https://arxiv.org/abs/1911.09070
- GitHub:https://github.com/google/automl/tree/master/efficientdet
- Docs:https://github.com/google/automl/tree/master/efficientdet#readme
주요 아키텍처 기능
EfficientDet의 핵심 혁신은 쉽고 빠른 멀티스케일 피처 융합을 가능하게 하는 BiFPN입니다. 특징을 동일하게 합산하는 이전의 FPN과 달리, BiFPN은 각 입력 특징에 가중치를 할당하여 네트워크가 다양한 입력 특징의 중요성을 학습할 수 있도록 합니다. 또한 EfficientDet은 모든 백본, 특징 네트워크, 박스/클래스 예측 네트워크에 대해 해상도, 깊이, 폭을 균일하게 확장하는 복합 확장 방법을 사용하여 다양한 리소스 제약에 맞춘 모델 제품군(D0~D7)을 제공합니다.
성능 분석: 속도 vs. 정확도
이러한 모델을 평가할 때 추론 속도와 평균 정밀도mAP 사이의 상충 관계가 명확해집니다. EfficientDet은 출시 당시 높은 기준을 세웠지만, PP-YOLOE+와 같은 최신 아키텍처는 하드웨어 인식 설계를 활용하여 최신 GPU에서 우수한 성능을 달성했습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
데이터에 따르면 PP-YOLOE+는 GPU 추론 지연 시간에서 EfficientDet보다 훨씬 뛰어난 성능을 발휘합니다. 예를 들어, PP-YOLOE+l은 T4 GPU 10배 이상 빠르면서 (8.36ms 대 89.29ms) EfficientDet-d6 (52.6)보다 더 높은 mAP (52.9)를 달성합니다. EfficientDet은 초저전력 모바일 CPU와 같이 FLOPs가 주요 제약 조건인 시나리오에서 관련성을 유지하지만, 처리량이 많은 서버 환경에서는 경쟁하기 어렵습니다.
하드웨어 최적화
PP-YOLOE+의 아키텍처 선택 사항은 다음과 같은 GPU 하드웨어 가속기에 적합하도록 특별히 설계되었습니다. TensorRT. 연산은 병렬 처리를 극대화하도록 구조화되어 있지만, EfficientDet의 BiFPN의 복잡한 연결은 때때로 GPU에서 메모리 액세스 병목 현상을 일으킬 수 있습니다.
강점과 약점
각 모델의 장단점을 이해하면 특정 컴퓨터 비전 작업에 적합한 도구를 선택하는 데 도움이 됩니다.
PP-YOLOE+
- 강점:
- 높은 정확도-속도 비율: GPU에서 실시간 추론 기능을 갖춘 최첨단 mAP 제공합니다.
- 앵커 프리: 복잡한 앵커 박스 튜닝이 필요 없으므로 교육 설정이 간소화됩니다.
- 동적 라벨 할당: 분류와 로컬라이제이션 간의 더 나은 정렬을 위해 TAL을 사용합니다.
- 약점:
- 에코시스템 특이성: PyTorch 익숙한 사용자에게는 학습 곡선이 나타날 수 있는 PaddlePaddle 프레임워크에 크게 최적화되어 있습니다.
- 리소스 집약도: 더 큰 변형(L 및 X)은 상당한 메모리를 필요로 하므로 RAM 제한이 엄격한 에지 디바이스에서는 배포가 제한될 수 있습니다.
EfficientDet
- 강점:
- 매개변수 효율성: 구형 감지기에 비해 상대적으로 적은 수의 파라미터로 높은 정확도를 달성할 수 있습니다.
- 확장성: 복합 스케일링 방식을 사용하면 사용 가능한 컴퓨팅에 따라 모델 크기(d0~d7)를 쉽게 전환할 수 있습니다.
- BiFPN: 다양한 규모의 개체를 효율적으로 처리하는 혁신적인 기능 융합.
- 약점:
- 느린 추론: 낮은 FLOP 수에도 불구하고 복잡한 그래프 구조로 인해 실제 추론 시간이 느려지는 경우가 많으며, 특히 GPU에서는 더욱 그렇습니다.
- 훈련 속도: 아키텍처의 복잡성으로 인해 최신 1단계 감지기에 비해 훈련 속도가 느릴 수 있습니다.
실제 사용 사례
이러한 모델은 아키텍처의 강점을 기반으로 다양한 환경에서 탁월한 성능을 발휘합니다.
제조 및 산업 자동화: PP-YOLOE+는 제조업의 품질 관리에 탁월한 선택입니다. 빠른 추론 속도를 통해 밀리초가 중요한 빠르게 움직이는 조립 라인에서 실시간으로 결함을 감지할 수 있습니다.
스마트 리테일 및 인벤토리: 자동 결제 또는 진열대 모니터링과 같은 리테일 분석의 경우, PP-YOLOE+의 정확도는 복잡한 장면에서도 제품을 정확하게 식별할 수 있도록 해줍니다.
원격 감지 및 항공 이미지: 더 높은 해상도(예: D7)까지 확장할 수 있는 EfficientDet의 기능은 큰 이미지에서 작은 특징을 감지하는 것보다 처리 속도가 덜 중요한 고해상도 위성 또는 드론 이미지를 분석하는 데 유용합니다.
저전력 엣지 디바이스: 총 FLOP이 하드한계이고 GPU 가속을 사용할 수 없는 레거시 엣지 AI 하드웨어에는 더 작은 EfficientDet 변형(D0-D1)이 선호되기도 합니다.
Ultralytics의 장점: YOLO11을 선택해야 하는 이유
PP-YOLOE+와 EfficientDet은 강력한 솔루션을 제공하지만, 그 외에도 Ultralytics YOLO11 모델은 대부분의 개발자와 연구자에게 탁월한 경험을 제공합니다. 이 모델은 최신 아키텍처 혁신과 사용자 중심 에코시스템의 장점을 결합합니다.
YOLO11 돋보이는 이유
- 사용 편의성: Ultralytics 모델은 '즉시 사용 가능한' 사용성으로 유명합니다. 다른 프레임워크에 필요한 복잡한 구성 파일과 달리, 간단한 Python API와 직관적인 CLI 사용하면 몇 분 만에 모델을 훈련, 검증 및 배포할 수 있습니다.
- 잘 관리된 에코시스템: Ultralytics 커뮤니티는 활발하게 활동하며 성장하고 있습니다. 정기적인 업데이트를 통해 최신 버전의 PyTorch, ONNX 및 CUDA 호환성을 보장하여 장기 프로젝트를 위한 안정적인 기반을 제공합니다.
- 성능 균형: YOLO11 PP-YOLOE+를 능가하는 속도와 정확도를 유지하거나 능가하는 놀라운 균형을 달성합니다. 하드웨어에 구애받지 않도록 설계되어 CPU, GPU, NPU에서 탁월한 성능을 발휘합니다.
- 메모리 효율성: 트랜스포머 기반 모델이나 구형 아키텍처에 비해 Ultralytics YOLO 모델은 훈련 중 메모리 소비를 줄이도록 최적화되어 있습니다. 따라서 표준 하드웨어에서 더 큰 배치 크기와 더 빠른 컨버전스가 가능합니다.
- 다목적성: 주로 객체 검출기인 EfficientDet과 달리 YOLO11 단일 통합 프레임워크 내에서 인스턴스 분할, 포즈 추정, 방향성 객체 감지(OBB), 분류 등 다양한 작업을 지원합니다.
- 훈련 효율성: 고급 증강 기능과 최적화된 데이터 로더를 통해 YOLO11 모델을 빠르고 효율적으로 훈련할 수 있습니다. 사전 학습된 광범위한 가중치를 사용할 수 있어 최소한의 데이터로 강력한 전이 학습 결과를 얻을 수 있습니다.
예시: Python YOLO11 실행하기
몇 줄의 코드만으로 사전 학습된 YOLO11 모델을 로드하고 추론을 실행할 수 있어, Ultralytics 워크플로우의 단순성을 보여줍니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
결론
PP-YOLOE+와 EfficientDet은 모두 컴퓨터 비전 분야에 크게 기여해 왔습니다. PP-YOLOE+는 높은 GPU 처리량을 필요로 하는 바이두 생태계에 깊숙이 통합된 사용자들을 위한 강력한 경쟁자입니다. EfficientDet은 파라미터 효율성과 확장 가능한 설계의 대표적인 예로 남아 있습니다.
하지만 다용도, 고성능, 개발자 친화적인 솔루션을 찾는 분들을 위한 솔루션입니다, Ultralytics YOLO11 을 추천합니다. 최첨단 정확도, 실시간 속도, 지원 에코시스템이 결합된 이 솔루션은 차세대 AI 애플리케이션을 구축하는 데 이상적인 플랫폼입니다.
더 자세한 비교를 원하시면 YOLO11 EfficientDet 또는 PP-YOLOE+와 YOLOv10 비교하여 이 모델들이 다른 최신 아키텍처와 어떻게 비교되는지 살펴보세요.