PP-YOLOE+ 대 YOLO26: 최첨단 객체 탐지
급변하는 컴퓨터 비전 환경에서 정확도, 속도, 배포 용이성의 균형을 맞추기 위해서는 적절한 객체 탐지 아키텍처를 선택하는 것이 매우 중요합니다. 본 비교 분석에서는 PaddlePaddle PP-YOLOE를 개선한 버전인 PP-YOLOE+와 Ultralytics 최신 에지 최적화 혁신 기술인 YOLO26을 살펴봅니다. 두 모델 모두 실시간 탐지 분야에서 중요한 이정표를 제시하지만, 서로 다른 생태계와 배포 요구사항을 충족시킵니다.
시각적 성능 비교
다음 차트는 PP-YOLOE+와 YOLO26 간의 성능 상충 관계를 보여줌으로써, 새로운 아키텍처가 달성한 지연 시간과 정확도 측면의 발전을 강조합니다.
모델 개요
PP-YOLOE+
PP-YOLOE+는 바이두의 PaddlePaddle 개발한 PP-YOLOE의 업그레이드 버전입니다. 앵커 프리 패러다임을 기반으로 하며, 다양한 하드웨어 플랫폼에서 우수한 성능을 발휘하는 클라우드-엣지 통합 아키텍처를 도입했습니다. 특히 PaddlePaddle 내에서 정밀도와 추론 속도 간의 균형 최적화에 중점을 둡니다.
- 작성자: PaddlePaddle 작성자
- 조직조직: Baidu
- 날짜: 2022년 4월 2일
- Arxiv:2203.16250
- GitHub:패들디텍션
- 문서:PP-YOLOE+ 문서
YOLO26
YOLO26은 Ultralytics YOLO 최신 버전으로, 엣지 컴퓨팅의 효율성을 재정의하기 위해 설계되었습니다. 2026년 1월 출시된 이 모델은 NMS(Non-Maximum Suppression) 후처리 과정이 필요 없는 네이티브 엔드투엔드 NMS 아키텍처를 도입했습니다. 분포 초점 손실(DFL) 제거 및 MuSGD 최적화기 도입과 같은 주요 최적화를 통해 YOLO26은 CPU 및 저전력 장치에서의 고속 추론을 위해 특별히 설계되었습니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜: 2026년 1월 14일
- GitHub:Ultralytics 리포지토리
- 문서:YOLO26 문서
기술 아키텍처 및 혁신
이 두 모델 간의 구조적 차이는 특정 작업에 대한 적합성을 결정합니다.
PP-YOLOE+ 건축
PP-YOLOE+는 CSPRepResNet 백본과 경로 집계 네트워크(PAN)를 갖춘 피처 피라미드 네트워크(FPN)를 사용하여 다중 스케일 피처 융합을 수행합니다. 주요 혁신 사항은 다음과 같습니다:
- 앵커 프리 설계: 앵커 박스 하이퍼파라미터 조정을 제거하여 훈련 파이프라인을 단순화합니다.
- 작업 정렬 학습(TAL): 분류 및 위치 지정 작업을 명시적으로 정렬하여 양성 샘플 선택의 품질을 향상시킵니다.
- ET-Head: 정확도를 유지하면서 계산 오버헤드를 줄이는 효율적인 작업 정렬 헤드.
그러나 PP-YOLOE+는 기존의 NMS 기법에 의존하는데, 이는 장면에서 탐지된 객체 수에 따라 지연 시간 변동성을 유발할 수 있다.
YOLO26 혁신
YOLO26은 종단 간 탐지로의 패러다임 전환을 나타냅니다.
- NMS 설계: 객체당 단 하나의 예측만 생성함으로써 YOLO26은 NMS 완전히 제거합니다. 이는 후처리 로직이 병목 현상이 될 수 있는 에지 디바이스에 배포할 때 매우 중요합니다.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받은 이 SGD 뮤온(Moonshot AI의 기술)의 하이브리드 방식은 훈련을 안정화하고 수렴 속도를 가속화합니다.
- ProgLoss + STAL: 점진적 손실(Progressive Loss)과 소프트 작업 정렬 손실(Soft Task Alignment Loss)의 통합은 항공 이미지와 로봇 공학에서 흔히 발생하는 과제인 소형 물체 탐지 성능을 크게 향상시킵니다.
- DFL 제거: 분포 초점 손실(Distribution Focal Loss)을 제거하면 모델 그래프가 단순화되어 ONNX 및 TFLite 으로의 내보내기를 더 깔끔하게 하고 다양한 하드웨어 가속기와 호환성을 높입니다.
MuSGD를 통한 훈련 안정성
YOLO26의 MuSGD 최적화기는 컴퓨터 비전 분야에 대규모 언어 모델(LLM) 훈련의 안정성을 도입합니다. 모멘텀과 기울기를 적응적으로 관리함으로써 광범위한 하이퍼파라미터 조정의 필요성을 줄여, SGD AdamW 비해 더 적은 에포크 수로 최적의 정확도에 도달할 수 있게 합니다.
성능 지표
아래 표는 COCO PP-YOLOE+와 YOLO26의 성능을 비교합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
주요 요점:
- 효율성: YOLO26 모델은 더 높은 정확도를 달성하기 위해 지속적으로 더 적은 FLOPs와 매개변수를 필요로 합니다. 예를 들어, YOLO26x는 단 55.7M 매개변수로 57.5 mAP 엄청난 성능을 달성하는 반면, PP-YOLOX+는 54.7 mAP 도달하기 위해 98.42M 매개변수가 필요합니다.
- 추론 속도: YOLO26은 GPU(T4 TensorRT)에서 탁월한 속도를 보여주며, Nano 모델은 단 1.7ms에 불과합니다. CPU 눈에 띄는데, 이전 세대 대비 최대 43% 빠른 CPU 제공하여 전용 가속기가 없는 장치에 이상적입니다.
- 정확도: 모든 스케일(나노/타이니부터 엑스트라 라지까지)에서 YOLO26은 COCO mAP 측면에서 PP-YOLOE+보다 우수한 성능을 보입니다.
에코시스템 및 사용 편의성
모델을 선택할 때 주변 생태계는 원시 지표만큼 중요합니다.
Ultralytics 에코시스템의 이점
YOLO26을 포함한 Ultralytics 통합된 사용자 중심 플랫폼의 혜택을 누립니다.
- 간소화된 API: 일관된 Python 통해 감지, 분할, 자세 추정, 분류 및 OBB (OpenBoundingBox) 간 원활한 전환이 가능합니다.
- Ultralytics : Ultralytics 클라우드 환경에서 데이터셋 관리, 라벨링 및 원클릭 훈련을 위한 노코드 솔루션을 제공합니다.
- 문서: 포괄적이고 자주 업데이트되는 문서가 설치부터 라즈베리 파이와 같은 에지 디바이스에의 배포까지 모든 단계를 안내합니다.
- 메모리 효율성: YOLO26은 훈련 중 메모리 효율성을 고려하여 설계되어, 메모리 집약적인 대안들에 비해 소비자용 GPU에서 더 큰 배치 크기를 허용합니다.
PaddlePaddle 에코시스템
PP-YOLOE+는 PaddlePaddle 깊이 통합되어 있습니다. 강력하지만, PyTorch 익숙한 사용자에게는 학습 곡선이 가파를 수 있는 특정 툴체인(PaddleDetection)이 종종 필요합니다. 바이두 쿤룬(Kunlun) 칩과 같은 PaddlePaddle 통합이 우선순위인 환경에서 탁월한 성능을 발휘합니다.
사용 사례 및 응용 분야
실시간 엣지 분석
스마트 카메라나 드론과 같은 에지 디바이스에서 실행되는 애플리케이션의 경우 YOLO26이 확실한 승자입니다. 엔드투엔드 NMS 설계로 예측 가능한 지연 시간을 보장하며, 이는 안전 시스템에 매우 중요합니다. FLOPs 수가 줄어들어 배터리 구동 하드웨어에서도 효율적으로 실행될 수 있습니다.
산업 자동화
정밀도가 요구되는 제조 환경(예: 품질 검사)에서는 두 모델 모두 성능을 발휘합니다. 그러나 YOLO26의 ProgLoss 함수는 미세 결함 탐지 능력을 향상시켜 생산 라인에서 아주 작은 결함을 포착하는 데 우위를 점합니다.
복잡한 시각 작업
PP-YOLOE+는 주로 탐지에 초점을 맞추는 반면, YOLO26은 기본적으로 더 광범위한 작업을 지원합니다.
- 인스턴스 분할: 정밀한 객체 마스킹을 위해.
- 자세 추정: 인간 활동 인식에 있어 핵심 요소입니다.
- 방향성 경계 상자(OBB): 물체가 회전하는 항공 측량 및 해운 물류에 필수적입니다.
다중 작업 유연성
PP-YOLOE+는 작업마다 다른 모델 아키텍처가 필요한 반면, Ultralytics 단순히 작업 헤드를 변경하기만 Ultralytics . 예를 들어, yolo26n-pose.pt 동일한 익숙한 API로 즉시 키포인트 감지를 가능하게 합니다.
코드 예제: YOLO26 시작하기
Ultralytics Python 덕분에 YOLO26의 훈련 및 배포는 매우 간단합니다. 다음 코드 스니펫은 사전 훈련된 모델을 로드하고 이미지에 대해 추론을 실행하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")
# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
for result in results:
result.show() # Display predictions on screen
result.save("output.jpg") # Save annotated image to disk
결론
PP-YOLOE+와 YOLO26 모두 컴퓨터 비전 분야에 인상적인 기여를 했습니다. PP-YOLOE+는 이미 PaddlePaddle 투자한 팀들에게 여전히 확고한 선택지입니다.
그러나 대다수의 개발자와 연구자에게는 Ultralytics 우수한 패키지를 제공합니다. 엔드투엔드 아키텍처는 배포 파이프라인을 단순화하며, 최첨단 정확도와 기록적인 속도는 2026년 가장 다재다능한 모델로 자리매김합니다. Ultralytics 강력한 지원과 Ultralytics 같은 기능과 결합된 YOLO26은 개념에서 생산까지의 시간을 획기적으로 단축합니다.
다른 현대적 아키텍처에 관심이 있는 사용자를 위해, 문서에는 다음과 같은 훌륭한 대안들도 다루고 있습니다. YOLO11 와 트랜스포머 기반의 RT-DETR와 같은 훌륭한 대안들도 다루고 있습니다.