Link to this sectionYOLO11 대 PP-YOLOE+#
컴퓨터 비전 애플리케이션을 프로덕션 환경에 배포할 때는 최적의 신경망 아키텍처를 선택하는 것이 매우 중요합니다. 본 기술 비교에서는 실시간 객체 탐지 분야에서 두드러진 두 가지 모델인 Ultralytics YOLO11과 Baidu의 PP-YOLOE+를 검토합니다. 두 아키텍처 모두 강력한 성능을 제공하지만, 정확도, 추론 속도 및 개발자 생태계라는 과제에 접근하는 방식은 상당히 다릅니다.
다음은 하드웨어 제약 조건에 가장 적합한 모델을 식별할 수 있도록 돕는 이들 모델의 성능 경계를 보여주는 인터랙티브 차트입니다.
Link to this section모델의 기원 및 기술적 계보#
이들 모델의 기원과 설계 철학을 이해하면 각각의 강점과 이상적인 사용 사례를 파악하는 데 유용한 맥락을 얻을 수 있습니다.
Link to this sectionYOLO11 세부 정보#
Ultralytics에서 개발한 YOLO11은 YOLO 시리즈의 고도로 정제된 반복 모델로, 고속 추론, 극한의 파라미터 효율성, 독보적인 사용 편의성 간의 균형을 최우선으로 합니다. YOLO11은 통합된 멀티태스킹 기능과 개발자 친화적인 Python API로 널리 인정받고 있습니다.
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: YOLO11 문서
Link to this sectionPP-YOLOE+ 세부 정보#
PP-YOLOE+는 PaddlePaddle 프레임워크를 기반으로 구축된 PP-YOLOv2의 진화 버전입니다. CSPRepResNet 백본 및 TAL(Task Alignment Learning)과 같은 아키텍처 변경 사항을 도입하여 특히 고성능 GPU에서 정확도의 한계를 확장합니다.
- 저자: PaddlePaddle 저자진
- 조직: Baidu
- 날짜: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- 문서: PP-YOLOE+ 구성 문서
Link to this section아키텍처 차이점#
YOLO11과 PP-YOLOE+의 근본적인 아키텍처 설계는 컴퓨터 비전 환경에서의 서로 다른 우선순위를 반영합니다.
YOLO11은 고도로 최적화된 백본과 앵커 프리(anchor-free) 탐지 헤드를 기반으로 합니다. C3k2 블록과 SPPF(Spatial Pyramid Pooling - Fast)를 활용하여 최소한의 연산 오버헤드로 다중 스케일 특징을 포착합니다. 이러한 설계는 에지 NPU 및 모바일 CPU와 같은 리소스 제약이 있는 기기에서 추론 지연 시간을 줄이는 데 매우 유리합니다. 또한 YOLO11은 멀티태스킹 학습을 위해 기본적으로 설계되어 인스턴스 세그멘테이션, 포즈 추정 및 방향성 바운딩 박스(OBB) 탐지를 즉시 지원합니다.
**PP-YOLOE+**는 CSPRepResNet 백본과 ET-head(Efficient Task-aligned head)를 도입합니다. 학습 중 표현 능력을 높이기 위해 rep-parameterization(재파라미터화) 기술을 광범위하게 활용하며, 추론 시에는 해당 파라미터를 표준 컨볼루션으로 접습니다(folding). 이로 인해 인상적인 mAP(mean Average Precision) 성능을 달성하지만, 결과 모델은 파라미터와 메모리 사용량 측면에서 더 무거워지는 경향이 있어 경량 에지 기기보다는 강력한 서버 GPU 배포에 더 적합합니다.
표준 바운딩 박스를 넘어 프로젝트를 확장해야 하는 경우, Ultralytics YOLO11은 세그멘테이션, 포즈 추정 및 분류를 동일한 API 내에서 기본적으로 지원하므로 여러 개의 서로 다른 리포지토리를 통합하는 것과 비교하여 개발 오버헤드를 획기적으로 줄여줍니다.
Link to this section성능 및 벤치마크#
성능을 평가할 때는 정확도(mAP), 다양한 하드웨어에서의 추론 속도, 모델 효율성(파라미터 및 FLOPs)을 살펴봅니다. 아래 표는 비교 지표를 강조하며, 가장 효율적이거나 높은 성능을 보이는 값은 굵게 표시되어 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Link to this section분석#
YOLO11은 성능 균형과 파라미터 효율성에서 확실한 우위를 보여줍니다. 예를 들어, YOLO11m은 더 적은 파라미터(20.1M 대 23.43M)를 사용하면서도 PP-YOLOE+m(49.8)보다 높은 mAP(51.5)를 달성하며, TensorRT에서 훨씬 빠른 추론 속도(4.7ms 대 5.56ms)를 기록합니다. YOLO11 모델의 경량 특성은 모델 학습과 배포 모두에서 더 낮은 메모리 요구 사항으로 직결됩니다.
Link to this section학습 생태계 및 사용 편의성#
모델의 진정한 가치는 개발자가 사용자 지정 컴퓨터 비전 데이터셋으로 모델을 얼마나 쉽게 학습시키고 프로덕션 환경에 배포할 수 있는지에 달려 있는 경우가 많습니다.
Link to this sectionUltralytics의 장점#
Ultralytics는 간소화된 개발자 경험을 우선시합니다. YOLO11 학습은 복잡한 상용구 코드를 추상화하는 간단한 Python API 또는 CLI를 통해 관리됩니다. Ultralytics Platform은 노코드(no-code) 학습, 자동화된 데이터셋 관리, ONNX, CoreML, TensorRT와 같은 형식으로의 원클릭 내보내기를 제공하여 이를 더욱 향상합니다.
또한 YOLO 모델은 학습 중에 메모리 효율성이 매우 높아 Transformer 기반 아키텍처나 무거운 재파라미터화 모델에서 흔히 발생하는 방대한 VRAM 오버헤드를 방지하여 소비자용 하드웨어에서도 학습이 가능합니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()Link to this sectionPP-YOLOE+ 생태계#
PP-YOLOE+는 PaddleDetection 생태계 내에서 작동합니다. 이 프레임워크는 강력하고 Baidu의 산업 솔루션과 깊이 통합되어 있지만, 개발자가 특정 PaddlePaddle 딥러닝 프레임워크를 채택해야 합니다. 이는 이미 PyTorch에 표준화된 팀에게는 더 가파른 학습 곡선을 요구할 수 있습니다. 또한 PP-YOLOE+ 모델을 에지 기기를 위한 표준 범용 형식으로 내보내는 것은 Ultralytics 워크플로우에 있는 기본 내보내기 파이프라인에 비해 추가적인 변환 단계를 필요로 할 수 있습니다.
Link to this section이상적인 사용 사례#
이들 모델 중 무엇을 선택할지는 귀하의 구체적인 배포 환경에 따라 다릅니다.
- YOLO11 선택: 민첩한 개발, 에지 컴퓨팅 및 모바일 애플리케이션의 경우 YOLO11을 선택하십시오. 높은 추론 속도, 낮은 메모리 사용량, 광범위한 내보내기 기능 덕분에 표준 CPU에서의 실시간 소매 재고 관리, 드론 기반 항공 이미지 분석, 복잡한 멀티태스킹 파이프라인과 같은 작업에 이상적입니다.
- PP-YOLOE+ 선택: 전체 프로덕션 파이프라인이 이미 PaddlePaddle 생태계에 크게 투자되어 있거나, 메모리 제약 및 하드웨어 호환성(Paddle의 최적화된 하드웨어 이외)이 주요 관심사가 아닌 고성능 전용 추론 서버에 배포하는 경우 PP-YOLOE+를 선택하십시오.
Link to this section차세대 기술: YOLO26 소개#
YOLO11은 여전히 매우 강력하지만, AI 분야는 빠르게 발전합니다. 객체 탐지의 절대적인 최첨단 기술을 위해 Ultralytics는 새로운 **YOLO26**을 선보였습니다. 2026년 1월에 출시된 YOLO26은 전작의 성공을 바탕으로 전례 없는 효율성과 정확도를 제공합니다.
주요 YOLO26 혁신:
- 엔드투엔드 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 기본적으로 제거합니다. 이는 추론 속도를 크게 높이고 배포 로직을 단순화하며, 이는 YOLOv10에서 처음 개척된 아키텍처의 도약입니다.
- 최대 43% 더 빠른 CPU 추론: GPU가 없는 에지 기기에 최적화되어 저전력 하드웨어에서도 실시간 성능을 보장합니다.
- MuSGD 옵티마이저: LLM 학습 안정성에서 영감을 받은 SGD와 Muon의 이 하이브리드 조합은 더 빠른 수렴과 더욱 안정적인 학습을 보장합니다.
- ProgLoss + STAL: 향상된 손실 함수는 드론 애플리케이션 및 보안 감시에 중요한 소형 객체 인식 성능을 획기적으로 향상합니다.
- DFL 제거: DFL(Distribution Focal Loss)을 제거하여 모델 내보내기를 단순화하고 다양한 에지 기기 전반에서 호환성을 크게 향상시킵니다.
속도, 원활한 내보내기 및 최대 정확도를 우선시하는 새로운 프로젝트의 경우, Ultralytics Platform을 통해 YOLO26의 기능을 활용할 것을 강력히 권장합니다.
다른 아키텍처를 평가 중이라면, YOLO11과 RT-DETR을 비교하거나 기존 YOLOv8이 최신 벤치마크에서 어떻게 유지되는지 살펴보는 데 관심이 있을 수 있습니다.