YOLO11 대 PP-YOLOE+: 실시간 탐지기에 대한 기술적 비교
컴퓨터 비전 애플리케이션을 프로덕션 환경에 배포할 때는 최적의 신경망 아키텍처를 선택하는 것이 매우 중요합니다. 이번 기술 비교에서는 실시간 객체 탐지 분야에서 두각을 나타내는 모델인 Ultralytics YOLO11과 Baidu의 PP-YOLOE+를 살펴봅니다. 두 아키텍처 모두 강력한 성능을 제공하지만, 정확도, 추론 속도, 개발자 생태계라는 과제에 접근하는 방식은 상당히 다릅니다.
아래는 하드웨어 제약 조건에 가장 적합한 모델을 식별할 수 있도록 지원하는, 이 모델들의 성능 경계를 보여주는 대화형 차트입니다.
모델의 기원 및 기술적 계보
이 모델들의 기원과 설계 철학을 이해하면 각 모델의 강점과 이상적인 활용 사례를 파악하는 데 귀중한 맥락을 얻을 수 있습니다.
YOLO11 세부 정보
Ultralytics에서 개발한 YOLO11은 YOLO 시리즈의 고도로 정제된 반복 버전으로, 고속 추론, 극도의 매개변수 효율성, 비교할 수 없는 사용 편의성의 균형을 최우선으로 합니다. 이 모델은 통합된 멀티태스킹 기능과 개발자 친화적인 Python API로 널리 인정받고 있습니다.
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: YOLO11 문서
PP-YOLOE+ 세부 정보
PP-YOLOE+는 PaddlePaddle 프레임워크를 기반으로 구축된 PP-YOLOv2의 진화된 버전입니다. 이 모델은 CSPRepResNet 백본 및 TAL(Task Alignment Learning)과 같은 아키텍처 변경 사항을 도입하여, 특히 고사양 GPU에서 정확도의 한계를 극대화합니다.
- 저자: PaddlePaddle 저자
- 조직: Baidu
- 날짜: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- 문서: PP-YOLOE+ 구성 문서
아키텍처 차이
YOLO11과 PP-YOLOE+의 근본적인 아키텍처 설계는 컴퓨터 비전 환경에서 서로 다른 우선순위를 반영합니다.
YOLO11은 고도로 최적화된 백본과 앵커 프리(anchor-free) 탐지 헤드를 기반으로 합니다. C3k2 블록과 SPPF(Spatial Pyramid Pooling - Fast)를 활용하여 최소한의 계산 오버헤드로 다중 스케일 특징을 캡처합니다. 이러한 설계는 엣지 NPU 및 모바일 CPU와 같이 리소스가 제한된 장치에서 추론 지연 시간을 줄이는 데 매우 유리합니다. 또한, YOLO11은 멀티태스킹 학습을 위해 기본적으로 설계되었으며, 인스턴스 분할, 자세 추정, 방향이 지정된 바운딩 박스(OBB) 탐지를 즉시 지원합니다.
**PP-YOLOE+**는 CSPRepResNet 백본과 ET-head(Efficient Task-aligned head)를 도입합니다. 학습 중 표현 능력을 높이기 위해 rep-parameterization 기법을 적극적으로 활용하며, 추론을 위해 해당 매개변수를 표준 컨볼루션으로 접습니다(folding). 이는 인상적인 평균 정밀도(mAP)를 제공하지만, 결과적으로 생성되는 모델은 매개변수와 메모리 점유율 측면에서 더 무거운 경향이 있어 경량 엣지 장치보다는 강력한 서버 GPU에서의 배포에 더 적합합니다.
표준 바운딩 박스를 넘어 프로젝트를 확장해야 하는 경우, Ultralytics YOLO11은 동일한 API 내에서 분할, 자세 추정, 분류를 위한 기본 지원을 제공하므로 여러 별도의 저장소를 통합하는 것보다 개발 오버헤드를 크게 줄여줍니다.
성능 및 벤치마크
성능을 평가할 때는 정확도(mAP), 다양한 하드웨어에서의 추론 속도, 모델 효율성(매개변수 및 FLOPs)을 살펴봅니다. 아래 표는 비교 지표를 강조하며, 가장 효율적이거나 높은 성능의 값은 굵게 표시되어 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
분석
YOLO11은 성능 균형과 매개변수 효율성에서 확실한 우위를 보여줍니다. 예를 들어 YOLO11m은 PP-YOLOE+m(49.8)보다 더 높은 mAP(51.5)를 달성하면서도 더 적은 매개변수(20.1M 대 23.43M)를 사용하고 TensorRT에서 훨씬 빠른 추론 속도(4.7ms 대 5.56ms)를 달성합니다. YOLO11 모델의 경량 특성은 모델 학습 및 배포 시 더 낮은 메모리 요구 사항으로 자연스럽게 이어집니다.
학습 생태계 및 사용 편의성
모델의 진정한 가치는 개발자가 사용자 정의 컴퓨터 비전 데이터셋으로 모델을 얼마나 쉽게 학습시키고 프로덕션에 배포할 수 있는지에 달려 있는 경우가 많습니다.
Ultralytics의 강점
Ultralytics는 간소화된 개발자 경험을 최우선으로 합니다. YOLO11 학습은 복잡한 상용구 코드를 추상화하는 간단한 Python API 또는 CLI를 통해 관리됩니다. Ultralytics Platform은 노코드(no-code) 학습, 자동화된 데이터셋 관리, ONNX, CoreML, TensorRT와 같은 형식으로의 원클릭 내보내기를 제공하여 이를 더욱 강화합니다.
또한, YOLO 모델은 학습 중에 매우 메모리 효율적이며, 트랜스포머 기반 아키텍처나 무거운 rep-parameterized 모델에서 흔히 발생하는 방대한 VRAM 오버헤드를 피하여 소비자용 하드웨어에서도 학습이 가능합니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()PP-YOLOE+ 생태계
PP-YOLOE+는 PaddleDetection 생태계 내에서 운영됩니다. 이 프레임워크는 강력하고 Baidu의 산업용 솔루션과 깊이 통합되어 있지만, 개발자가 특정 PaddlePaddle 딥러닝 프레임워크를 채택하도록 요구합니다. 이는 이미 PyTorch에 표준화된 팀에게는 더 높은 학습 곡선을 제시할 수 있습니다. 또한, 엣지 장치용 표준 범용 형식으로 PP-YOLOE+ 모델을 내보내는 작업은 Ultralytics 워크플로우에 있는 기본 내보내기 파이프라인에 비해 추가적인 변환 단계가 필요할 수 있습니다.
이상적인 활용 사례
이 모델들 중 선택은 특정 배포 환경에 따라 달라집니다.
- 민첩한 개발, 엣지 컴퓨팅, 모바일 애플리케이션을 위해서는 YOLO11을 선택하십시오. 높은 추론 속도, 낮은 메모리 점유율, 광범위한 내보내기 기능 덕분에 표준 CPU에서의 실시간 소매 재고 관리, 드론 기반 항공 이미지 분석, 복잡한 멀티태스킹 파이프라인과 같은 작업에 이상적입니다.
- 전체 프로덕션 파이프라인이 이미 PaddlePaddle 생태계에 크게 투자되어 있거나, 메모리 제약 및 하드웨어 호환성(Paddle의 최적화된 하드웨어 이외의 경우)이 주요 관심사가 아닌 고사양 전용 추론 서버에 배포하는 경우에는 PP-YOLOE+를 선택하십시오.
차세대 기술: YOLO26 소개
YOLO11은 여전히 매우 강력하지만, AI 분야는 빠르게 발전합니다. 객체 탐지의 최첨단 기술을 위해 Ultralytics는 새로운 **YOLO26**을 도입했습니다. 2026년 1월에 출시된 YOLO26은 이전 모델의 성공을 바탕으로 전례 없는 효율성과 정확성을 제공합니다.
주요 YOLO26 혁신 기술:
- 엔드투엔드 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 기본적으로 제거합니다. 이는 추론 속도를 크게 높이고 배포 로직을 단순화하는데, 이는 YOLOv10에서 처음 개척된 아키텍처적 도약입니다.
- 최대 43% 더 빠른 CPU 추론: GPU가 없는 엣지 장치를 위해 특별히 최적화되어, 저전력 하드웨어에서도 실시간 성능을 보장합니다.
- MuSGD 옵티마이저: LLM 학습 안정성에서 영감을 받은 SGD와 Muon의 이 하이브리드 조합은 더 빠른 수렴과 더욱 안정적인 학습을 보장합니다.
- ProgLoss + STAL: 향상된 손실 함수는 드론 애플리케이션 및 보안 감시에 필수적인 소형 객체 인식 성능을 획기적으로 개선합니다.
- DFL 제거: Distribution Focal Loss를 제거하여 모델 내보내기를 단순화하고 광범위한 엣지 장치 전반에서 호환성을 대폭 향상시킵니다.
속도, 원활한 내보내기, 최고의 정확도를 우선시하는 새로운 프로젝트의 경우, Ultralytics Platform을 통해 YOLO26의 기능을 활용할 것을 강력히 권장합니다.
다른 아키텍처를 평가 중이라면 YOLO11을 RT-DETR과 비교하거나 기존 YOLOv8이 최신 벤치마크에서 어떤 성능을 보이는지 살펴보는 것도 좋습니다.