YOLO11 PP-YOLOE+: 실시간 탐지기의 기술적 비교
컴퓨터 비전 애플리케이션을 실제 환경에 배포할 때 최적의 신경망 아키텍처를 선택하는 것은 매우 중요합니다. 본 기술 비교에서는 실시간 객체 탐지 분야에서 두드러진 두 모델을 살펴봅니다: Ultralytics YOLO11 과 바이두의 PP-YOLOE+. 두 아키텍처 모두 견고한 성능을 제공하지만 정확도, 추론 속도, 개발자 생태계라는 과제에 접근하는 방식은 상당히 다릅니다.
아래는 하드웨어 제약 조건에 가장 적합한 모델을 식별하는 데 도움이 되도록 해당 모델들의 성능 한계를 보여주는 대화형 차트입니다.
모델의 기원 및 기술적 계보
이러한 모델들의 기원과 설계 철학을 이해하는 것은 각각의 강점과 이상적인 사용 사례를 파악하는 데 유용한 맥락을 제공합니다.
YOLO11
Ultralytics가 개발한 YOLO11 YOLO 고도로 정제된 YOLO11 , 고속 추론, 극한의 매개변수 효율성, 그리고 타의 추종을 불허하는 사용 편의성의 균형을 최우선으로 YOLO11 . 통합된 다중 작업 처리 능력과 Python 친화적인 Python 널리 인정받고 있습니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜:27
- GitHub:https://github.com/ultralytics/ultralytics
- Docs:YOLO11 문서
PP-YOLOE+ 상세 정보
PP-YOLOE+는 PaddlePaddle 기반으로 구축된 PP-YOLOv2의 진화 버전입니다. CSPRepResNet 백본과 작업 정렬 학습(TAL)과 같은 아키텍처 변경을 도입하여, 특히 고성능 GPU에서 정확도의 한계를 뛰어넘도록 설계되었습니다.
- 작성자: PaddlePaddle 작성자
- 조직조직: Baidu
- 날짜:02
- Arxiv:2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- 문서:PP-YOLOE+ 구성 문서
아키텍처의 차이점
YOLO11 PP-YOLOE+의 근본적인 아키텍처 설계는 컴퓨터 비전 분야에서 서로 다른 우선순위를 반영한다.
YOLO11 고도로 최적화된 백본과 앵커 프리 탐지 헤드를 기반으로 구축되었습니다. C3k2 블록과 Spatial Pyramid Pooling - Fast(SPPF)를 활용하여 최소한의 계산 오버헤드로 다중 스케일 특징을 포착합니다. 이 설계는 에지 NPU 및 모바일 CPU와 같은 리소스 제약이 있는 장치에서 추론 지연 시간을 줄이는 데 매우 유리합니다. 또한 YOLO11 멀티태스크 학습을 위해 기본적으로 YOLO11 , 인스턴스 세그멘테이션, 포즈 추정, 방향성 바운딩 박스(OBB) 탐지를 즉시 지원합니다.
PP-YOLOE+는 CSPRepResNet 백본과 효율적인 작업 정렬 헤드(ET-head)를 도입합니다. 이 모델은 훈련 중 표현 능력을 높이기 위해 rep-매개변수화 기법을 적극 활용하는 동시에, 추론을 위해 해당 매개변수들을 표준 컨볼루션에 통합합니다. 이로 인해 인상적인 평균 정밀도(mAP)를 달성하지만, 결과 모델은 매개변수와 메모리 사용량이 더 많아져 경량 엣지 디바이스보다는 강력한 서버 GPU에 배포하기에 더 적합합니다.
다중 작업 유연성
프로젝트에서 표준 바운딩 박스 이상의 확장이 필요한 경우, Ultralytics YOLO11 동일한 API 내에서 세분화, 자세 추정 및 분류를 기본YOLO11 여러 별개의 저장소를 통합하는 것에 비해 개발 오버헤드를 획기적으로 줄여줍니다.
성능 및 벤치마크
성능 평가 시 정확도(mAP), 다양한 하드웨어에서의 추론 속도, 모델 효율성(매개변수 및 FLOPs)을 살펴봅니다. 아래 표는 비교 지표를 강조하며, 가장 효율적이거나 최고 성능의 값은 굵은 글씨로 표시합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
분석
YOLO11 명확한 우위를 YOLO11 . 성능 균형 매개변수 효율성. 예를 들어, YOLO11m 보다 높은 mAP 51.5)를 달성한다 PP-YOLOE+m (49.8) 더 적은 매개변수(20.1M vs 23.43M)를 활용하면서도 TensorRT 훨씬 빠른 추론 속도 TensorRT 4.7ms vs 5.56ms)를 달성합니다. YOLO11 경량 특성은 본질적으로 두 작업 모두에서 더 낮은 메모리 요구 사항으로 이어집니다. 모델 학습 배치 및 배포.
교육 생태계 및 사용 편의성
모델의 진정한 가치는 개발자가 맞춤형 컴퓨터 비전 데이터셋으로 모델을 얼마나 쉽게 훈련시키고 실제 환경에 배포할 수 있는지에 달려 있다.
Ultralytics 이점
Ultralytics 간소화된 개발자 경험을 Ultralytics . YOLO11 훈련은 간단한 Python 또는 CLI 통해 YOLO11 , 복잡한 보일러플레이트 코드를 추상화합니다. Ultralytics 코드 없이 훈련, 자동화된 데이터셋 관리, 단일 클릭으로 다음과 같은 형식으로 내보내기 기능을 제공하여 이를 더욱 강화합니다. ONNX, CoreML, TensorRT.
또한 YOLO 훈련 과정에서 메모리 효율성이 매우 높아, 트랜스포머 기반 아키텍처나 복잡한 반복 매개변수 모델에서 흔히 발생하는 막대한 VRAM 오버헤드를 피할 수 있어, 일반 소비자용 하드웨어에서도 훈련이 가능합니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
PP-YOLOE+ 생태계
PP-YOLOE+는 PaddleDetection 생태계 내에서 작동합니다. 이 프레임워크는 강력하고 Baidu의 산업용 솔루션과 깊이 통합되어 있지만, 개발자가 특정 PaddlePaddle 프레임워크를 채택해야 합니다. 이는 이미 PyTorch 표준으로 사용하는 팀에게 더 가파른 학습 곡선을 초래할 수 있습니다. 또한 PP-YOLOE+ 모델을 에지 디바이스용 표준 범용 형식으로 내보내려면 Ultralytics 기본 내보내기 파이프라인에 비해 추가 변환 단계가 필요할 수 있습니다.
이상적인 사용 사례
이러한 모델 중 선택하는 것은 특정 배포 환경에 따라 달라집니다.
- YOLO11 애자일 개발, 엣지 컴퓨팅 및 모바일 애플리케이션에 최적입니다. 높은 추론 속도, 낮은 메모리 사용량, 광범위한 내보내기 기능을 통해 표준 CPU 기반 실시간 소매 재고 관리, 드론 기반 항공 이미지 분석, 복잡한 다중 작업 파이프라인과 같은 작업에 이상적입니다.
- 전체 생산 파이프라인이 이미 PaddlePaddle 크게 투자되어 있거나, 메모리 제약과 하드웨어 호환성(Paddle의 최적화 하드웨어 외)이 주요 고려 사항이 아닌 고성능 전용 추론 서버에 배포하는 경우 PP-YOLOE+를 선택하십시오.
차세대: YOLO26 소개
YOLO11 매우 강력하지만, AI 분야는 빠르게 진화하고 Ultralytics . 객체 탐지의 최첨단을 위해 Ultralytics 새로운 YOLO26를 선보였습니다. 2026년 1월 출시된 YOLO26은 이전 버전의 성공을 바탕으로 전례 없는 효율성과 정확성을 제공합니다.
YOLO26의 주요 혁신 사항:
- 엔드투엔드 NMS 설계: YOLO26은 비최대 억제(NMS) 후처리 단계를 기본적으로 제거합니다. 이는 추론 속도를 크게 향상시키고 배포 로직을 단순화하는 아키텍처적 도약으로, 최초로 도입된 것은 YOLOv10에서 최초로 선보인 아키텍처적 도약입니다.
- 최대 43% 빠른 CPU : GPU가 없는 에지 디바이스에 특화하여 최적화되어 저전력 하드웨어에서도 실시간 성능을 보장합니다.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 안정성에서 영감을 받아, SGD 뮤온(Muon)의 하이브리드 방식으로 더 빠른 수렴과 안정적인 훈련을 보장합니다.
- ProgLoss + STAL: 개선된 손실 함수는 드론 응용 및 보안 감시에 중요한 소형 물체 인식 성능을 획기적으로 향상시킵니다.
- DFL 제거: 분산 초점 손실(DFL) 제거는 모델 내보내기를 단순화하고 다양한 에지 디바이스 간 호환성을 획기적으로 향상시킵니다.
신규 프로젝트에서 속도, 원활한 내보내기, 최대 정확도를 최우선으로 고려한다면, Ultralytics 통해 YOLO26의 기능을 활용하는 것을 적극 권장합니다.
다른 아키텍처를 평가 중이라면, YOLO11 비교하는 것도 관심 있을 수 있습니다. RT-DETR 과 비교하거나 기존 YOLOv8 가 현대적인 벤치마크에서 어떻게 평가되는지 살펴보는 것도 흥미로울 수 있습니다.