YOLO PP-YOLOE+: 상세한 기술적 비교
실시간 컴퓨터 비전 분야의 치열한 경쟁 환경에서 특정 배포 요구사항에 최적화된 아키텍처를 선택하는 것은 매우 중요합니다. 본 가이드는 YOLO PP-YOLOE+ 간의 포괄적인 기술적 비교를 제공하며, 두 모델의 아키텍처 설계, 훈련 방법론 및 성능 지표를 심층적으로 분석합니다. 또한 새롭게 출시된 Ultralytics 같은 최신 솔루션 대비 이들 모델의 성능을 비교 평가할 것입니다.
모델 개요
두 프레임워크 모두 2022년에 등장하여 정교한 기술을 활용해 정확도와 추론 속도의 한계를 뛰어넘는 산업용 애플리케이션을 위한 강력한 대안으로 부상했다.
DAMO-YOLO
알리바바 그룹이 개발한YOLO 지연 시간과 정확도 간의 균형을 최적화하기 위해 자동화된 검색 기술과 고급 특징 융합에 크게 의존하는 여러 혁신적인 기법을YOLO .
- 저자: 쉬셴저, 장이치, 천웨이화, 황이룬, 장위안, 쑨시위
- 조직: 알리바바 그룹
- 날짜: 2022-11-23
- 아카이브: YOLO: 실시간 객체 탐지 설계에 관한 보고서
- GitHub: YOLO
- 문서: YOLO
YOLO 하드웨어 효율성에 최적화된 백본을 자동 설계하기 위해 다중 스케일 아키텍처 검색(MAE-NAS)을YOLO . 또한 목 부분 특징 융합을 위한 효율적인 재매개변수화 일반화 특징 피라미드 네트워크(RepGFPN)와 경량 "ZeroHead" 설계를 특징으로 합니다. 더불어 훈련 과정에서 디스틸레이션 기법을 적극 활용하여 학생 모델의 표현력을 강화합니다.
PP-YOLOE+
바이두 PaddlePaddle PP-YOLOE+는 PP-YOLOE 아키텍처의 점진적 업그레이드 버전입니다. 대규모 사전 훈련과 정교한 손실 함수에 중점을 두어 높은 mAP 제공하며, 특히 자체 딥러닝 프레임워크 내에서 뛰어난 성능을 발휘합니다.
- 저자: PaddlePaddle Authors
- 조직: 바이두
- 날짜: 2022-04-02
- Arxiv: PP-YOLOE: YOLO의 진화 버전
- GitHub: PaddlePaddle
- 문서: PP-YOLOE+ 구성
PP-YOLOE+는 CSPRepResNet 백본과 ET-head(효율적 작업 정렬 헤드)를 활용합니다. "플러스" 버전은 Objects365 데이터셋에 대한 강력한 사전 훈련 전략을 도입하여 다양한 실제 환경에서의 일반화 능력을 크게 향상시킵니다.
아키텍처 비교
이 두 모델 간의 설계 철학 차이는 그들의 이상적인 사용 사례와 하드웨어 호환성에 큰 영향을 미칩니다.
특징 융합과 백본
YOLO MAE-NAS 기반 백본은 에지 디바이스에 최적화되어 있어 속도 대비 매개변수 효율성이 우수한 경우가 많습니다. 그러나 이러한 맞춤형 아키텍처는 인스턴스 분할과 같은 새로운 작업에 적용하기에는 경직되고 복잡할 수 있습니다. RepGFPN 목 구조는 다중 스케일 특징 융합을 개선하지만, 매개변수 재설정 단계에서 복잡성을 추가합니다.
PP-YOLOE+는 보다 전통적이면서도 매우 효과적인 CSPRepResNet을 기반으로 합니다. 이 백본은 유사한 정확도를YOLO 더 많은 매개변수 공간을 필요로 하지만, 훈련 안정성이 매우 높고 기존 파이프라인에 통합하기가 더 쉽습니다. 그 ET-헤드는 분류와 회귀를 효율적으로 처리하지만, 여전히 비최대 억제(NMS)와 같은 후처리 단계가 필요합니다.
후처리 지연 제거
YOLO -YOLOE+ 모두 바운딩 박스 NMS 필요합니다. 추론 지연 시간이 중요한 경우, 기본적으로 엔드투엔드 NMS 설계를 특징으로 하는 Ultralytics 사용을 고려하십시오. 이 혁신적인 접근 방식은 NMS 제거하여 더 빠르고 간단한 배포 파이프라인을 구현합니다.
성과 및 지표 분석
이러한 모델을 생산 환경에서 평가할 때 정확도(mAP), 추론 속도, 매개변수 크기 간의 균형이 매우 중요합니다. 아래는 주요 변형 모델들의 직접 비교입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
표에서 알 수 있듯이,YOLO NAS에 최적화된 백본 덕분에 소규모(s) 및 초소규모(t)에서YOLO 더 낮은 지연 TensorRT 달성합니다. 그러나 PP-YOLOe+는 중간 규모(m) 및 대규모(l) 계층으로 놀라울 정도로 잘 확장되며, T4 TensorRT 손실이 발생하더라도 훨씬 더 높은 mAP 자랑합니다.
메모리 요구 사항 및 교육 효율성
YOLO 증류(distillation)에 의존한다는 점은 더 작은 학생 모델을 훈련하기 전에 훨씬 더 큰 교사 모델을 훈련해야 한다는 것을 의미합니다. 이는 CUDA 요구 사항과 전체 계산 예산을 급격히 증가시킵니다. PP-YOLOE+는 표준 단일 단계 훈련으로 이를 단순화하지만 PaddlePaddle 여전히 밀접하게 결합되어 있어 PyTorch 익숙한 팀의 유연성을 제한할 수 있습니다.
반면 현대적인 Ultralytics 모델은 이러한 병목 현상을 해결합니다. LLM 훈련 혁신에서 영감을 받은 SGD 의 하이브리드인 새로운 MuSGD 최적화기를활용하여, YOLO26은 복잡한 증류 파이프라인 없이도 더 빠른 수렴과 매우 안정적인 훈련을 달성합니다. 또한 YOLO 일반적으로 Transformer 기반 탐지기와 비교해 훈련 중 훨씬 적은 CUDA 필요로 합니다. RT-DETR와 같은 트랜스포머 기반 탐지기에 비해 훨씬 적은 CUDA 메모리를 필요로 합니다.
실제 적용 사례와 이상적인 사용 사례
YOLO 언제 사용해야 하는가
YOLO 지연 시간이 궁극적인 병목 현상인 고처리량 에지 추론에YOLO . 소형 변종은 교통 관리 시스템이나 기본 드론 감시 같은 환경에서 탁월한 성능을 발휘합니다. 단, 엔지니어링 팀이 복잡한 증류 및 재매개변수화 프로세스를 관리할 여력이 있어야 합니다.
PP-YOLOE+ 사용 시기
PP-YOLOE+는 이미 바이두 생태계에 깊이 투자했거나 대규모 서버 배포를 운영 중인 경우에 빛을 발합니다. 인상적인 mAP 성능 mAP 복잡한 의료 영상 분석이나 밀집된 제조 결함 검출에 mAP .
Ultralytics 이점
YOLO PP-YOLOE+ 모두 특정 지역적 이점을 제공하지만, 최대의 다용도성, 속도 및 사용 편의성을 추구하는 개발자들은 꾸준히 Ultralytics 선택합니다.
컴퓨터 비전 파이프라인을 업그레이드할 때 Ultralytics 비교할 수 없는 개발자 경험을 제공합니다:
- 최대 43% 빠른 CPU : 분포 초점 손실(DFL)을 완전히 제거함으로써, YOLO26은 엣지 CPU 및 저전력 IoT 기기에서 놀라울 정도로 빠른 성능을 발휘합니다.
- 소형 물체 탐지 성능 향상: ProgLoss 및 STAL 손실 함수의 통합으로 항공 촬영에 필수적인 소형 물체 인식 성능이 획기적으로 개선되었습니다.
- 광범위한 다용도성: 탐지에만 집중하는 PP-YOLOE+와 달리, YOLO26은 작업별 아키텍처 개선을 통해 자세 추정, 방향성 바운딩 박스(OBB), 의미적 분할을 원활하게 처리합니다.
결론
YOLO PP-YOLOE+는 앵커 프리 객체 탐지 기술 발전의 중요한 이정표입니다.YOLO 에지 지연 시간 측면에서 신경망 아키텍처 탐색의 한계를YOLO , PP-YOLOE+는 대규모 사전 훈련의 힘을 입증했습니다.
그러나 속도, 정확도, 배포 편의성의 최적 균형을 추구하는 개발자에게는 Ultralytics 모델이 확실한 선택입니다. NMS 아키텍처, 강력한 Python , 그리고 다음과 같은 도구와의 원활한 통합을 통해 Weights & Biases , TensorRT 과의 원활한 통합은 프로젝트가 프로토타입에서 프로덕션 환경으로 원활하게 전환되도록 보장합니다.
시작할 준비가 되셨나요? Ultralytics 시작 가이드를 살펴보거나 YOLO11 YOLO 개요에서 더 많은 모델을 비교해 보세요.