Link to this sectionYOLOv9 대 PP-YOLOE+ 비교#
실시간 객체 탐지 분야는 빠르게 발전하고 있으며, 컴퓨터 비전 엔지니어들에게 엣지 및 클라우드 인프라에서 매우 정확한 모델을 배포할 수 있는 폭넓은 선택지를 제공합니다. 이 분야에서 주목받는 두 모델은 **YOLOv9**과 **PP-YOLOE+**입니다. 두 모델 모두 정확도와 속도의 한계를 뛰어넘고 있지만, 서로 다른 연구 계보와 소프트웨어 생태계에서 탄생했습니다.
이 포괄적인 기술 비교에서는 두 모델의 아키텍처, 학습 방법론, 성능 지표 및 이상적인 실제 적용 사례를 살펴봅니다. 또한 사용 편의성, 메모리 효율성, 다재다능한 배포를 우선시하는 개발자들에게 Ultralytics 생태계가 어떻게 상당한 이점을 제공하는지 알아봅니다.
Link to this section모델 기원 및 기술 사양#
이 모델들의 배경을 이해하면 아키텍처 결정 사항과 프레임워크 종속성을 파악하는 데 도움이 됩니다.
Link to this sectionYOLOv9: 정보 병목 현상 해결#
2024년 초에 소개된 YOLOv9은 심층 신경망을 통해 정보가 흐를 때 발생하는 데이터 손실 문제를 해결합니다. 이는 파라미터 효율성을 극대화하기 위해 설계된 매우 최적화된 합성곱 신경망입니다.
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직: 대만 중앙연구원 정보과학연구소
- 날짜: 2024년 2월 21일
- Arxiv: 2402.13616
- GitHub: WongKinYiu/yolov9
- 문서: Ultralytics YOLOv9 문서
Link to this sectionPP-YOLOE+: Paddle 생태계의 발전#
2022년 Baidu에서 출시한 PP-YOLOE+는 PP-YOLOv2를 반복적으로 개선한 모델입니다. 이 모델은 앵커 프리(anchor-free) 패러다임을 활용하고 동적 레이블 할당 전략을 도입하여 PaddlePaddle 프레임워크 내에서 수렴과 정확도를 향상시킵니다.
- 저자: PaddlePaddle 저자진
- 조직: Baidu
- 날짜: 2022년 4월 2일
- Arxiv: 2203.16250
- GitHub: PaddleDetection
- 문서: PP-YOLOE+ 구성
Link to this section아키텍처 비교#
Link to this sectionPGI(Programmable Gradient Information) 대 CSPRepResStage#
YOLOv9의 핵심 혁신은 **PGI(Programmable Gradient Information)**입니다. PGI는 보조 감독 프레임워크 역할을 하여 학습 중에 중요한 그래디언트 정보가 보존되고 얕은 레이어로 정확하게 전파되도록 합니다. 이는 CSPNet과 ELAN의 강점을 결합하여 계산 비용(FLOPs)을 대폭 줄이면서 높은 정확도를 제공하는 **GELAN(Generalized Efficient Layer Aggregation Network)**과 결합됩니다.
PP-YOLOE+는 CSPRepResStage라는 특수 백본에 의존합니다. 이 모델은 배포 시 합성곱 레이어를 병합하여 추론 속도를 높이기 위해(RepVGG와 유사한) 재파라미터화 기법을 활용합니다. 또한, 효율적인 작업 정렬 헤드(ET-head)를 사용하여 분류 및 회귀 작업 간의 균형을 맞춥니다.
PP-YOLOE+가 견고하지만, YOLOv9의 GELAN 아키텍처는 일반적으로 학습과 추론 모두에서 더 작은 메모리 점유율을 요구하므로 엣지 AI 디바이스에 매우 적합합니다.
Link to this section성능 비교#
프로덕션을 위해 모델을 평가할 때 mAP(평균 정밀도), 추론 속도 및 모델 크기 간의 균형은 매우 중요합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Link to this section분석#
- 파라미터 효율성: YOLOv9은 현저히 높은 효율성을 달성합니다. 예를 들어, YOLOv9c는 25.3M개의 파라미터만 사용하여 53.0%의 mAP를 달성하는 반면, PP-YOLOE+l은 52.9%의 다소 낮은 mAP를 달성하기 위해 두 배가 넘는 파라미터(52.2M)를 필요로 합니다. 이는 YOLOv9의 메모리 요구 사항을 크게 낮춰줍니다.
- 추론 속도: YOLOv9 모델은 TensorRT와 같은 하드웨어 가속기에 탁월한 최적화를 보여주며, 실시간 추론에 필수적인 NVIDIA T4 GPU에서 경쟁력 있는 추론 속도를 제공합니다.
Link to this section학습 방법론 및 생태계#
이들 모델 간의 선택은 종종 소프트웨어 생태계에 달려 있습니다.
Link to this sectionPP-YOLOE+ 및 PaddlePaddle#
PP-YOLOE+는 PaddleDetection 제품군과 긴밀하게 결합되어 있습니다. 강력하지만 사용자가 구성 중심의 명령줄 기반 환경을 탐색해야 합니다. PyTorch 또는 TensorFlow 생태계에 깊이 관여하는 팀에게는 PaddlePaddle로의 전환이 상당한 마찰과 가파른 학습 곡선을 야기합니다.
Link to this sectionUltralytics의 이점: 간소화된 워크플로#
반면, YOLOv9은 매우 세련된 Ultralytics 생태계 내에서 작동합니다. 개발자와 연구자를 위해 설계된 Ultralytics는 탁월한 사용 편의성을 우선시합니다. Python API는 복잡한 상용구 코드(boilerplate code)를 완전히 추상화합니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Run inference and visualize results
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for production deployment
model.export(format="onnx")이 워크플로는 Ultralytics 모델의 뛰어난 학습 효율성을 강조합니다. 데이터 증강, 분산 학습, Weights & Biases 또는 MLflow와 같은 플랫폼에 대한 자동 로깅에 대한 기본 지원이 포함되어 있습니다.
YOLOv9이 뛰어난 성능을 제공하지만, 새로운 프로젝트에는 새로 출시된 **Ultralytics YOLO26**을 고려할 것을 강력히 권장합니다. YOLO26은 네이티브 종단간(End-to-End) NMS-Free 설계를 특징으로 하여 배포를 획기적으로 단순화합니다. DFL 제거(간소화된 내보내기와 더 나은 엣지/저전력 장치 호환성을 위해 Distribution Focal Loss 제거)를 통해 엣지 컴퓨팅을 위한 최대 43% 더 빠른 CPU 추론을 제공합니다. MuSGD 옵티마이저로 구동되어 안정적인 학습과 빠른 수렴을 보장합니다. 또한 ProgLoss + STAL은 손실 함수를 개선하여 IoT, 로봇 공학 및 항공 이미지 분석에 필수적인 소형 객체 인식에서 괄목할 만한 향상을 제공합니다.
Link to this section다양성 및 작업 지원#
현대적인 컴퓨터 비전 프로젝트는 단순히 바운딩 박스에서 끝나지 않습니다.
PP-YOLOE+는 기본적으로 표준 객체 탐지를 위해 설계되었습니다. 다른 작업을 위해 아키텍처를 조정하려면 광범위한 맞춤형 엔지니어링이 필요합니다.
반대로, Ultralytics 프레임워크는 멀티태스킹 강자입니다. 통합된 API를 활용함으로써 개발자는 표준 객체 탐지에서 복잡한 인스턴스 분할, 매우 정확한 자세 추정, 항공 이미지를 위한 지향 바운딩 박스(OBB) 탐지 및 이미지 분류로 손쉽게 전환할 수 있습니다. 이러한 독보적인 다재다능함이 엔터프라이즈 팀이 YOLOv9, YOLO11, YOLO26과 같은 Ultralytics 모델을 지속적으로 선택하는 이유입니다.
Link to this section이상적인 사용 사례 및 응용 분야#
- 스마트 시티 분석 및 교통 관리: YOLOv9(및 후속 모델인 YOLO26)의 높은 파라미터 효율성과 낮은 지연 시간은 교통 흐름과 도시 보안을 모니터링하기 위해 제약이 있는 엣지 하드웨어(예: NVIDIA Jetson 장치)에 배포하기에 이상적입니다.
- 소매 재고 시스템: 선반에 있는 소형 품목의 밀집된 구성을 탐지하는 경우, YOLOv9의 PGI는 세밀한 공간 정보를 효과적으로 유지하여 소형 객체 탐지 작업에서 PP-YOLOE+보다 우수한 성능을 발휘합니다.
- 레거시 배포: **PP-YOLOE+**는 기존 레거시 인프라에서 Baidu/PaddlePaddle 소프트웨어 스택을 사용하도록 명시적으로 요구받은 팀에게만 실행 가능한 옵션으로 남아 있습니다.
Transformer 기반 아키텍처를 연구하는 연구자를 위해 Ultralytics는 동일하고 사용하기 쉬운 API 내에서 **RT-DETR**을 기본적으로 지원하여 특정 배포 요구 사항에 맞는 최적의 모델에 항상 액세스할 수 있도록 보장합니다.