PP-YOLOE+ 대 YOLOv5: 객체 탐지 아키텍처 탐색
컴퓨터 비전을 위한 적합한 딥러닝 프레임워크를 선택할 때 개발자들은 종종 속도, 정확도, 배포 용이성 사이의 완벽한 균형을 찾기 위해 서로 다른 아키텍처의 성능을 비교하게 됩니다. 이 심층 분석에서는 PP-YOLOE+와 YOLOv5 간의 기술적 차이를 살펴봅니다. 두 프레임워크의 아키텍처, 성능 지표, 그리고 최적의 배포 시나리오를 분석함으로써 실시간 로봇공학, 엣지 컴퓨팅, 클라우드 기반 영상 분석 등 향후 프로젝트에 적합한 선택을 할 수 있습니다.
모델 기원 및 메타데이터
두 모델 모두 뛰어난 역량을 지닌 엔지니어링 팀에서 비롯되었으나, 약간 다른 생태계를 대상으로 합니다. 그들의 기원을 이해하는 것은 아키텍처 설계 선택에 대한 귀중한 맥락을 제공합니다.
PP-YOLOE+ 상세 정보:
- 저자: PaddlePaddle Authors
- 기관: Baidu
- 날짜: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: PaddlePaddle
- 문서: PaddleDetection README
YOLOv5 :
- 저자: 글렌 조커
- 조직: Ultralytics
- 날짜: 2020-06-26
- GitHub: yolov5
- 문서: yolov5
아키텍처 비교
PP-YOLOE+ 건축
PP-YOLOE+는 PP-YOLOv2와 같은 기존 모델을 기반으로 구축된 바이두 생태계 내의 진화형 모델입니다. 이 모델은 고도로 최적화된 CSPRepResNet 백본은 크로스 스테이지 부분(CSP) 네트워크의 원리와 재매개변수화 기법을 결합하여 특징 추출을 강화합니다. 이를 통해 모델은 훈련 중 높은 정확도를 유지하면서도 더 간소화된 아키텍처로 축소되어 더 빠른 추론이 가능해집니다.
또한 PP-YOLOE+는 작업 정렬 학습(TAL)과 효율적인 작업 정렬 헤드(ET-head)를 활용합니다. 이 조합은 밀집 객체 탐지기의 일반적인 병목 현상인 분류 및 위치 지정 작업 간의 정렬 불일치 문제를 해결하기 위한 것입니다. 구조적으로 인상적이지만, 이 아키텍처는 PaddlePaddle 긴밀하게 결합되어 있어 다른 주류 머신러닝 라이브러리를 표준으로 사용하는 팀에게는 통합에 어려움이 있을 수 있습니다.
YOLOv5 아키텍처
반면, YOLOv5 는 PyTorch으로 설계되었습니다. 이는 학계 연구와 기업 생산 모두에서 업계 표준으로 인정받는 프레임워크입니다. YOLOv5는 수정된 CSPDarknet53 백본을 활용하는데, 이 백본은 탁월한 기울기 흐름과 매개변수 효율성으로 잘 알려져 있습니다.
YOLOv5 AutoAnchor YOLOv5 , 훈련 전 사용자 지정 데이터셋에 기반해 앵커 박스 크기를 동적으로 확인하고 조정합니다. 이를 통해 바운딩 박스에 대한 수동 하이퍼파라미터 튜닝이 불필요해집니다. 모델의 경로 집계 네트워크(PANet) 목 부분은 강력한 다중 스케일 특징 융합을 보장하여 다양한 크기의 물체를 탐지하는 데 매우 효과적입니다.
간소화된 PyTorch
YOLOv5 PyTorch 위에 직접 구축 YOLOv5 때문에, 최적화된 형식(예: ONNX)으로 내보내기 ONNX 및 TensorRT 같은 최적화된 형식으로 내보내려면 로컬화된 프레임워크에 바인딩된 모델보다 중간 소프트웨어 구성이 훨씬 덜 TensorRT .
성능 분석
이러한 모델을 평가하려면 평균 정밀도(mAP)와 지연 시간 간의 균형을 살펴봐야 합니다. 다음 표는 다양한 모델 크기에 걸친 지표를 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
PP-YOLOE+는 더 큰 규모(예: X 변형)에서 매우 경쟁력 있는 mAP 달성하지만, YOLOv5 우수한 속도와 더 적은 매개변수 수를 YOLOv5 스펙트럼의 작은 쪽 끝에서. YOLOv5 (YOLOv5n단 260만 개의 매개변수만 필요로 하여 메모리 요구사항이 엄격한 제약된 에지 디바이스에 매우 적합합니다. 또한 YOLO 훈련은 일반적으로 트랜스포머 기반의 무거운 대안들에 비해 CUDA 소비량이 적습니다. RT-DETR.
Ultralytics 이점
아키텍처를 선택할 때, 단순한 지표는 고려 사항의 일부에 불과합니다. 개발자 경험, 생태계 지원, 배포 파이프라인이 종종 프로젝트의 실제 성공을 좌우합니다. 바로 이 점에서 Ultralytics 빛을 발합니다.
타의 추종을 불허하는 사용 편의성
Ultralytics Python 복잡한 반복 코드를 Ultralytics . 개발자는 모델 훈련을 시작하고, 성능을 검증하며, 모델을 원활하게 배포할 수 있습니다. 문서화는 방대하고 철저히 관리되며, 대규모 글로벌 오픈소스 커뮤니티의 지원을 받습니다.
작업 전반에 걸친 다양한 활용성
PP-YOLOE+는 전용 객체 탐지 도구이지만, Ultralytics 통해 사용자는 단일 통합 API로 다양한 컴퓨터 비전 작업을 처리할 수 있습니다. YOLOv5 및 그 후속 모델을 활용하면 표준 바운딩 박스에서 이미지 분할 및 분류 워크플로로 손쉽게 전환할 수 있습니다.
코드 예시: YOLOv5 훈련
시작하는 데는 몇 줄의 코드만 필요합니다. 이러한 단순성은 연구 개발 주기를 크게 가속화합니다.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
실제 사용 사례
PP-YOLOE+를 선택해야 할 때: 조직이 바이두 소프트웨어 스택에 깊이 통합되어 있거나 PaddlePaddle 필수로 하는 특수 하드웨어에 크게 의존하는 경우, PP-YOLOE+는 안정적인 성능을 발휘합니다. 아시아 전역의 특수 제조 파이프라인에서 기존 Paddle 통합 환경이 존재할 때 자주 활용됩니다.
YOLOv5 선택해야 할 때: 대다수의 글로벌 개발자, 연구자 및 기업에게 YOLOv5 강력한 YOLOv5 . PyTorch 다음과 같은 도구들과 즉시 호환된다는 것을 의미합니다. Weights & Biases 와 같은 추적 도구와 즉시 호환되며, TensorRT 로 NVIDIA GPU 위해 또는 Apple CoreML 깔끔하게 내보낼 수 있습니다. 농업 작물 모니터링부터 고속 드론 항법까지 다양한 분야에서 탁월한 성능을 발휘합니다.
탐지의 미래: Ultralytics
YOLOv5 상징적인 YOLOv5 , 컴퓨터 비전의 최전선은 진화해 왔습니다. 모든 신규 개발에는 2026년 1월 출시된 YOLO26로의 전환을 강력히 권장합니다. Ultralytics 통해 원활하게 이용 가능한 YOLO26은 효율성을 완전히 재정의합니다.
YOLO26의 주요 혁신 사항:
- 엔드투엔드 NMS 설계: YOLO26은 비최대 억제(NMS) 후처리 단계를 완전히 제거합니다. 이를 통해 지연 시간 변동성을 줄이고 배포 파이프라인을 획기적으로 간소화합니다.
- 최대 43% 빠른 CPU : 전략적으로 분포 초점 손실(DFL)을 제거함으로써, YOLO26은 GPU 없이도 엣지 디바이스에서 속도를 획기적으로 향상시킵니다.
- MuSGD 최적화기: 선도적인 대규모 언어 모델에서 영감을 받은 이 하이브리드 최적화기는 훈련 역학을 안정화하고 맞춤형 데이터셋에서 훨씬 빠른 수렴을 가능하게 합니다.
- 작업 특화 개선 사항: ProgLoss 및 STAL과 같은 고급 손실 함수를 지원하여 초소형 물체에 대한 전례 없는 정확도를 제공합니다. 항공 이미지에 대한 방향성 경계 상자(OBB) 탐지를 기본적으로 지원합니다.
최첨단 비전 모델을 탐구 중이라면, 이전 세대 모델인 YOLO11 이나 RT-DETR과 같은 접근법을 비교해 보는 것도 흥미로울 것입니다. 궁극적으로, 견고한 생태계와 첨단 아키텍처 발전이 결합되어 Ultralytics 현대 컴퓨터 비전 작업에 있어 최고의 Ultralytics 자리매김합니다.