YOLOv5 PP-YOLOE+: 실시간 객체 탐지기의 기술적 비교
객체 탐지를 위한 최적의 아키텍처 선택은 컴퓨터 비전 애플리케이션의 효율성, 정확성 및 확장성에 영향을 미치는 중요한 결정입니다. 본 가이드는 YOLOv5(전 세계적으로 채택된 접근성 높은 AI 표준)과 PaddlePaddle 진화 중인 아키텍처인 PP-YOLOE+ 간의 상세한 기술적 비교를 제공합니다.
PP-YOLOE+는 흥미로운 앵커 프리 개념을 도입하지만, YOLOv5 은 비교할 수 없는 생태계, 견고성, 속도와 정확도의 균형 덕분에 여전히 지배적인 위치를 차지하고 있습니다. 미래를 바라보는 개발자들을 위해, 우리는 NMS 추론을 통해 최첨단 성능을 재정의하는 YOLO26에 대해서도 다루고 있습니다.
성능 지표 및 벤치마크
평균 정밀도(mAP) 와 추론 지연 시간 간의 상충 관계는 모델의 유용성을 정의합니다. 아래 표는 COCO YOLOv5 성능을 비교합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Ultralytics YOLOv5
2020년 글렌 조커와 Ultralytics에 의해 출시된 YOLOv5 는 고성능 객체 탐지 기술을 누구나 접근할 수 있게 함으로써 해당 분야에 혁신을 가져왔습니다. PyTorch으로 구축되어 "시작부터 끝까지"의 사용성을 최우선으로 하여 개발자가 데이터셋에서 배포까지 기록적인 시간 내에 진행할 수 있도록 했습니다.
아키텍처 및 설계
YOLOv5 CSPDarknet 백본(Cross Stage Partial Network)을 YOLOv5 계산 비용을 최소화하면서 기울기 흐름을 극대화합니다. 사전 정의된 앵커 박스를 사용하여 객체 위치를 예측하는 앵커 기반 탐지 헤드를 채택합니다. 이 접근법은 실전에서 검증되었으며 항공 이미지부터 의료 스캔에 이르기까지 다양한 데이터셋에서 안정적인 수렴을 제공합니다.
주요 이점
- 생산 환경 적용 가능성: YOLOv5 전 세계 수백만 개의 애플리케이션에 YOLOv5 극도의 안정성을 보장합니다.
- 다용도성: 탐지 기능을 넘어, 인스턴스 분할 및 이미지 분류를 기본적으로 지원합니다.
- 수출 가능성: 본 모델은 다양한 하드웨어 대상 TFLite ONNX, TensorRT, CoreML 및 TFLite 원활한 수출을 제공합니다.
PP-YOLOE+ 개요
PP-YOLOE+는 바이두의 PaddlePaddle 개발한 PP-YOLOE의 진화 버전입니다. 2022년 4월 출시된 이 모델은 앵커 프리 메커니즘 개선과 고성능 컴퓨팅 환경을 위한 백본 아키텍처 정교화에 중점을 둡니다.
아키텍처 및 설계
PP-YOLOE+는 앵커 박스 하이퍼파라미터 튜닝이 필요 없는 앵커 프리 패러다임을 채택합니다. 이 모델은 잔차 연결과 재매개변수화 기법(RepVGG 스타일)을 결합한 CSPRepResStage 백본을 활용하여 추론 속도를 높이는 동시에 특징 추출 능력을 유지합니다. 또한 훈련 과정에서 분류 및 로컬라이제이션 작업을 더 잘 정렬하기 위해 작업 정렬 학습(TAL) 을 적용합니다.
사용 사례 고려 사항
PP-YOLOE+는 COCO 높은 mAP 달성하지만, PaddlePaddle 밀접하게 연동됩니다. 이는 표준 PyTorch TensorFlow 의존하는 인프라를 사용하는 팀에게 어려움을 초래할 수 있습니다. 이 모델의 주요 강점은 배포 유연성이나 훈련 용이성보다 최대 정확도를 우선시하는 시나리오에 있습니다.
자세한 기술 비교
1. 교육 방법론 및 사용 편의성
가장 큰 차이점 중 하나는 사용자 경험에 있습니다. YOLOv5 는 "제로 투 히어로(Zero to Hero)" 워크플로로 유명합니다. Ultralytics 데이터 증강 (모자이크, MixUp) 및 하이퍼파라미터 진화와 같은 복잡한 작업을 자동화합니다.
- YOLOv5: 직관적인 명령줄 인터페이스(CLI) 또는 Python 사용합니다. AutoAnchor를 통해 앵커 박스 계산을 자동으로 처리하여 수동 개입 없이도 모델이 사용자 정의 데이터셋에 적응하도록 보장합니다.
- PP-YOLOE+: PaddleDetection 구성 시스템에 의존합니다. 강력하지만, 특정 구성 파일과 PaddlePaddle 대한 깊은 이해가 필요한 경우가 많으며, 이는 많은 개발자에게 더 가파른 학습 곡선을 요구합니다.
2. 추론 속도와 배포
YOLOv5 CPU 속도에서YOLOv5 라즈베리 파이(Raspberry Pi)나 휴대폰과 같은 기기에서의 에지 AI 애플리케이션에 최적의 선택입니다. 표에서 볼 수 있듯이, YOLOv5n (나노) 모델은 실시간 추적에 필수적인 놀라운 속도를 달성합니다.
PP-YOLOE+는 TensorRT 활용한 GPU 중점을 둡니다. 서버급 하드웨어(T4 GPU 등)에서는 우수한 성능을 발휘하지만, 고도로 최적화된 Ultralytics 비해GPU 필요한 경량 최적화가 부족한 경우가 많습니다.
3. 메모리 효율성
Ultralytics 메모리 효율성을 고려해 설계되었습니다. YOLOv5 훈련 과정은 소비자용 GPU에서 실행되도록 최적화되어 AI 접근성을 대중화합니다. 반면, 최신 트랜스포머 기반 또는 복잡한 아키텍처 설계는 상당한 CUDA 요구하는 경우가 많아 진입 장벽을 높입니다. YOLOv5 균형 잡힌 아키텍처는 불필요한 매개변수 부풀림 없이도 특징 추출이 견고하게 유지되도록 보장합니다.
실제 응용 분야
- YOLOv5 원격지나 매장에서 전용 서버 없이도 에지 디바이스에서 실행 가능하다는 장점 덕분에 농업 기술 (예: 작물 질병 탐지) 및 소매 분석 분야에서 가장 선호되는 솔루션입니다.
- PP-YOLOE+는 강력한 GPU 활용해 약간 더 무거운 계산을 처리함으로써 한계적인 정확도 향상을 얻을 수 있는 통제된 환경에서의 산업용 검사에 적합합니다.
워크플로 팁: Ultralytics
Ultralytics 사용할 때 Ultralytics 접근할 수 있습니다. 이 통합 인터페이스를 통해 데이터셋 관리, 클라우드 기반 모델 훈련,ONNX, TFLite 등 모든 형식으로의 배포를 단 한 번의 클릭으로 수행할 수 있어, 원시 프레임워크 스크립트를 관리하는 것에 비해 MLOps 부담을 크게 줄여줍니다.
미래: YOLO26으로 업그레이드하기
YOLOv5 전설적인 YOLOv5 , 해당 분야는 발전해 왔습니다. 최고의 성능을 추구하는 개발자에게는 YOLO26을 권장합니다.
YOLO26은 엔드투엔드 NMS 설계로 패러다임 전환을 이루었습니다. 비최대 억제(NMS)를 제거함으로써 YOLO26은 추론 지연 시간과 배포 복잡성을 줄입니다. 또한 다음과 같은 특징을 갖추고 있습니다:
- MuSGD 최적화기: 대규모 언어 모델 수준의 훈련 안정성을 위한 SGD 뮤온의 하이브리드.
- 최대 43% 빠른 CPU : 에지 컴퓨팅을 위해 특별히 최적화되었습니다.
- ProgLoss + STAL: 드론 및 IoT 애플리케이션의 핵심 영역인 소형 물체 탐지 성능을 향상시키는 고급 손실 함수.
업그레이드 용이성
통합된 Python 덕분에 YOLOv5 최신 Ultralytics 마이그레이션은 손쉽게 이루어집니다.
from ultralytics import YOLO
# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")
# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
결론
두 아키텍처 모두 장점이 있습니다. PP-YOLOE+는 GPU 중심 워크로드에 대해 COCO 강력한 이론적 성능을 제공합니다. 그러나 YOLOv5 는 사용성, 배포 유연성, 에지 성능 측면에서 여전히 최고 자리를 지키고 있습니다.
대부분의 개발자와 연구원에게 Ultralytics 내에서 활동하는 것은 장기적인 유지 관리성과 최신 기술 혁신에 대한 접근을 보장합니다. 신뢰할 수 있는 YOLOv5 계속 사용하든 YOLOv5 최첨단 기술인 YOLO26으로 업그레이드하든으로 업그레이드하든, 실제 환경에서의 성공을 위해 설계된 커뮤니티 주도형 고도로 최적화된 플랫폼의 혜택을 누릴 수 있습니다.
다른 옵션을 살펴보려면 다음을 검토해 보세요 YOLO11 또는 RT-DETR 와 같은 전용 모델을 검토해 보십시오.