Ultralytics 대 PP-YOLOE+: 기술적 비교
실시간 객체 탐지 분야는 정확도, 속도, 배포 용이성 간의 최적 균형을 추구하는 연구자와 엔지니어들의 노력으로 끊임없이 진화하고 있습니다 . 이 분야에서 두드러진 두 모델은 Ultralytics YOLO26과 PP-YOLOE+입니다. 두 모델 모두 컴퓨터 비전 분야에서 상당한 발전을 보여주지만, 서로 다른 생태계 요구사항과 아키텍처 철학을 충족시킵니다 .
본 가이드는 아키텍처, 성능 지표 및 실제 적용 분야 적합성을 분석하여 포괄적인 기술적 비교를 제공합니다. YOLO26의 현대적 혁신이 기존 프레임워크인 PP-YOLOE+와 어떻게 대비되는지 살펴보겠습니다.
모델 개요 및 기원
이러한 모델들의 계보를 이해하는 것은 그들의 설계 목표와 대상 사용자층을 명확히 하는 데 도움이 됩니다.
Ultralytics YOLO26
2026년 1월 글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)가 Ultralytics에서 공개된 YOLO26은 유명한 YOLO 최신 진화 버전입니다. 이 모델은 특히 에지 및 저전력 장치를 위해 설계되었으며, 네이티브 엔드투엔드 효율성에 중점을 둡니다.
주요 혁신 사항으로는 추론 간소화를 위한 비최대 억제(NMS) 제거, Moonshot AI의 Kimi K2에서 영감을 받은 MuSGD 최적화기 도입, 분포 초점 손실(DFL) 제거와 같은 상당한 아키텍처 단순화가 포함됩니다. 이러한 변경 사항으로 정확도를 저하시키지 않으면서 속도와 단순성이 필요한 개발자에게 견고한 선택지가 되었습니다.
PP-YOLOE+
PP-YOLOE+는 바이두의 PaddlePaddle 개발한 PP-YOLOE의 업그레이드 버전입니다. 2022년 4월경 출시되었으며, PaddlePaddle 프레임워크를 기반으로 구축되었습니다. CSPRepResStage 백본을 개선하고 TAL(Task Alignment Learning)로 알려진 동적 레이블 할당 전략을 활용하는 데 중점을 둡니다. 뛰어난 성능을 지녔으나, PaddlePaddle 긴밀히 연동되어 있어 PyTorch 다른 프레임워크에 익숙한 사용자의 배포 선택에 영향을 미칠 수 있습니다.
건축 및 디자인 철학
이 두 모델의 핵심적인 차이는 레이블 할당, 후처리, 그리고 훈련 최적화를 처리하는 방식에 있습니다.
YOLO26: 종단간 혁명
YOLO26은 독특하게도 종단 간(end-to-end) 방식으로, 별도의 NMS 단계 없이 네트워크에서 직접 최종 예측을 생성합니다. 이 설계 선택은 YOLOv10에서 최초로 도입된 이 설계 선택은 NMS 조정에 따른 지연 시간과 복잡성을 제거합니다.
- DFL 제거: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 모델 그래프를 단순화하여 ONNX TensorRT 같은 내보내기 형식을 TensorRT 깔끔하게 만들고 엣지 하드웨어와의 호환성을 높입니다.
- MuSGD 최적화기: SGD 과 뮤온의 하이브리드인 이 최적화기는 대규모 언어 모델(LLM) 훈련에서 확인된 안정성 개선 사항을 컴퓨터 비전 분야에 적용하여 더 빠른 수렴을 보장합니다.
- 소형 물체 초점: ProgLoss 및 소형 대상 인식 라벨 할당(STAL) 과 같은 기능은 항공 촬영 및 드론 응용 분야에서 중요한 소형 물체 탐지 성능 향상을 특별히 목표로 합니다.
PP-YOLOE+: 정교한 앵커 프리 감지
PP-YOLOE+는 앵커 프리 패러다임을 따르지만, YOLO26의 엔드투엔드 접근 방식에 비해 보다 전통적인 후처리 파이프라인에 의존합니다.
- 백본: CSPRepResStage 백본을 활용하며, 이는 rep-vgg 스타일 블록과 CSP(Cross Stage Partial) 연결을 결합합니다.
- 라벨 할당: 분류 점수와 로컬라이제이션 품질을 동적으로 정렬하는 태스크 정렬 학습(TAL)을 활용합니다.
- 초점: "플러스" 버전은 더 나은 사전 훈련된 가중치(주로 Objects365 기반)로 초기화함으로써 훈련 속도와 수렴성 향상에 중점을 둡니다.
엔드투엔드가 중요한 이유
에지 배포에서는 1밀리초도 소중합니다. 엔드투엔드 NMS 설계는 모델 출력을 즉시 사용할 수 있음을 의미합니다. 라즈베리 파이와 같은 제한된 하드웨어에서 실행되는 기존 탐지기의 일반적인 병목 현상인 수천 개의 후보 박스에 대한 CPU 집약적인 정렬 및 필터링 작업이 필요하지 않습니다.
성능 지표 비교
다음 표는 COCO YOLO26과 PP-YOLOX+의 성능을 비교합니다. YOLO26은 특히 매개변수 수와 추론 속도 측면에서 우수한 효율성을 보여주며, 현대 하드웨어에 대한 최적화를 강조합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
주요 요점:
- 효율성: YOLO26n은 PP-YOLOE+t(39.9 mAP)보다 높은 정확도(40.9 mAP)를 달성하며, 약 절반 수준의 매개변수 (240만 vs 485만)와 1/4 수준의 FLOPs (54억 vs 191억 5천만) 를 사용합니다.
- 속도: YOLO26은 GPU (T4 TensorRT)에서 현저히 빠르며, 나노 모델은 1.7ms를 기록한 반면 동등한 PP-YOLOE+ 모델은 2.84ms를 기록했습니다.
- CPU : YOLO26은 CPU에 명시적으로 최적화되어 최대 43% 더 빠른 추론 성능을 제공하므로, 전용 가속기가 없는 장치에 이상적입니다.
학습 및 생태계
개발자 경험은 모델 아키텍처뿐만 아니라 이를 둘러싼 도구들에 의해 정의됩니다.
Ultralytics 사용 편의성
Ultralytics 원활한 사용자 경험을 Ultralytics . YOLO26은 탐지, 분할, 자세 추정, 분류 및 방향성 경계 상자(OBB)를 지원하는 통합된 Python 통합되어 있습니다.
개발자는 직관적인 CLI Python 통해 몇 초 만에 훈련을 시작할 수 있습니다:
from ultralytics import YOLO
# Load the YOLO26s model
model = YOLO("yolo26s.pt")
# Train on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
이 생태계는 손쉬운 배포까지 확장됩니다. export 모드는 다음과 같은 형식으로의 변환을 지원합니다: OpenVINO, CoreML및 TensorRT 단일 명령어로.
PP-YOLOE+ 및 PaddlePaddle
PP-YOLOE+는 PaddlePaddle 깊이 통합되어 있습니다. 강력하지만, 사용자가 이미 바이두 생태계 내에 있지 않은 경우 학습 곡선이 가파른 편입니다. 훈련 과정에는 일반적으로 복잡한 YAML 파일 구성과 특정 PaddleDetection 스크립트 활용이 포함됩니다. 모델을 Paddle 기반이 아닌 추론 엔진으로 이식할 때는 추가 변환 단계(예: Paddle → ONNX TensorRT)가 필요할 수 있습니다.
사용 사례 및 응용 분야
YOLO26의 이상적인 시나리오
- 엣지 AI와 IoT: 낮은 FLOPs와 제거된 DFL 덕분에 YOLO26은 라즈베리 파이(Raspberry Pi )나 NVIDIA ) 같은 장치에서 탁월한 성능을 발휘합니다.
- 실시간 영상 분석: 높은 추론 속도로 프레임 속도가 중요한 교통 모니터링이나 안전 감시에 이상적입니다.
- 항공 및 드론 영상: STAL 및 ProgLoss 함수는 고고도에서 소형 물체를 탐지하는 데 뚜렷한 이점을 제공합니다.
- 다중 작업 요구사항: 탐지와 함께 자세 추정 또는 인스턴스 분할이 필요한 프로젝트는 동일한 API 및 모델 계열을 사용할 수 있습니다.
PP-YOLOE+의 이상적인 시나리오
- 데이터 센터 배포: 대규모 GPU 사용 가능하고, 순수한 매개변수 효율성보다 특정 아키텍처 선호도가 더 중요한 시나리오를 위한 것입니다.
- PaddlePaddle 시스템: PaddlePaddle 이미 상당한 투자를 한 조직들은 프레임워크를 전환하는 것보다 PP-YOLOE+로 업그레이드하는 것이 더 쉬울 것입니다.
결론
PP-YOLOE+는 여전히 유능한 탐지 알고리즘이지만, Ultralytics 대부분의 컴퓨터 비전 애플리케이션에 더 현대적이고 효율적이며 사용자 친화적인 솔루션을 제공합니다. 최신 정확도와 최소한의 자원 사용을 결합한 엔드투엔드 NMS 프리 설계로, 2026년에 견고한 AI 솔루션을 배포하려는 개발자들에게 탁월한 선택지로 자리매김하고 있습니다.
Ultralytics 와의 원활한 통합을 통해 데이터 주석 작업부터 배포까지 워크플로가 매끄럽고 생산적으로 유지됩니다.
추가 자료
다른 옵션이나 이전 버전을 살펴보고 싶은 분들은 다음 문서들을 참고하십시오: