PP-YOLOE+ 대 YOLOv5: 실시간 객체 탐지 기술 비교

컴퓨터 비전 분야의 경쟁 환경에서 적절한 객체 탐지 아키텍처를 선택하는 것은 개발자와 연구자에게 중요한 결정입니다. 바이두의 PaddlePaddle 개발한 PP-YOLOE+와YOLOv5Ultralytics 실시간 탐지 과제를 해결하는 두 가지 독특한 접근법으로 두각을 나타내고 있습니다. PP-YOLOE+가 PaddlePaddle 내에서 앵커 프리(anchor-free) 메커니즘을 강조하는 반면, YOLOv5 PyTorch 내에서 사용 편의성, 배포 유연성 및 커뮤니티 지원 측면에서 업계 표준을 YOLOv5 .

이 가이드는 제조 자동화 및 엣지 컴퓨팅과 같은 실제 응용 분야에 대한 적합성을 비교하며, 두 영향력 있는 모델의 아키텍처와 성능 지표를 심층적으로 기술 분석합니다.

모델 개요

PP-YOLOE+

PP-YOLOE+는 PP-YOLOE의 진화형으로, 훈련 수렴성과 다운스트림 작업 성능 향상을 목표로 설계되었습니다. PaddlePaddle 작동하며, 앵커 프리 패러다임을 활용해 탐지 헤드를 단순화합니다. 강화된 백본과 정교한 훈련 전략을 통합함으로써, 클라우드 기반 추론이 일반적인 산업용 애플리케이션에서 높은 정밀도를 제공하고자 합니다.

작성자: PaddlePaddle 작성자
조직조직: Baidu
날짜:02
Arxiv:2203.16250
GitHub:PaddleDetection 저장소

Ultralytics YOLOv5

YOLOv5 물체 탐지 분야의 사용자 경험을 혁신했습니다. Ultralytics 출시한 Ultralytics 모델은 "배포 우선" 엔지니어링을 최우선으로 하여 모델이 정확할 뿐만 아니라 다양한 하드웨어에서 훈련, 내보내기, 실행이 매우 용이하도록 보장합니다. 앵커 기반 아키텍처는 속도 최적화가 뛰어나 에지 디바이스에서의 실시간 추론에 최적화된 솔루션으로 자리매김했습니다.

작성자: Glenn Jocher
조직:Ultralytics
날짜:26
GitHub:Ultralytics YOLOv5

5에 대해 자세히 알아보기

기술 아키텍처 비교

YOLOv5 YOLOv5의 건축 철학은 크게 YOLOv5 , 이는 훈련 행동과 배포 특성에 영향을 미칩니다.

백본 및 특징 추출

YOLOv5 CSPDarknet(Cross Stage Partial Network) 백본을 활용합니다. 이 설계는 성능 저하 없이 기울기 흐름을 개선하고 매개변수 수를 줄입니다. 이 아키텍처는 높은 모듈성을 지녀 다양한 모델 깊이와 너비(Nano부터 X-Large까지)로 신속한 실험이 가능합니다. 이러한 모듈성은 라즈베리 파이(Raspberry Pi )나 모바일 기기와 같은 리소스 제약 환경에 배포하는 개발자에게 핵심적입니다.

반면 PP-YOLOE+는 일반적으로 잔차 연결과 재매개변수화 기법을 결합한 CSPRepResStage 백본을 사용합니다. 풍부한 특징 추출에는 효과적이지만, 이 구조는 YOLOv5 구현의 간소화된 효율성에 비해 훈련 단계에서 종종 더 높은 복잡성을 초래합니다.

탐지 헤드: 앵커 기반 vs. 앵커 프리

근본적인 차이는 검출 헤드에 있습니다:

YOLOv5 앵커 기반): 사전 정의된 앵커 박스를 사용하여 객체 위치를 예측합니다. 초기 설정( Ultralytics AutoAnchor로 Ultralytics )이 필요하지만, 안정적인 훈련 기울기를 제공하고 다음과 같은 표준 데이터셋에서 역사적으로 견고한 성능을 보여줍니다. COCO와 같은 표준 데이터셋에서 역사적으로 견고한 성능을 보여줍니다.
PP-YOLOE+ (앵커 프리): 객체 중심점과 크기를 직접 예측하여 앵커 박스 하이퍼파라미터 튜닝이 필요하지 않습니다. 이 접근법은 극단적인 종횡비를 가진 객체를 잘 처리하지만, 훈련 데이터의 품질과 초기 손실 수렴에 더 민감할 수 있습니다.

앵커 없는 진화

YOLOv5 앵커를 YOLOv5 사용하지만, Ultralytics 최신 Ultralytics 인 YOLOv8 과 최첨단 YOLO26 는 앵커 없는 설계로 전환하여 사용 편의성과 우수한 기하학적 일반화라는 두 가지 장점을 모두 결합했습니다.

성능 지표

성능을 평가할 때는 평균 정밀도(mAP) 와 지연 시간 간의 균형을 고려하는 것이 중요합니다. 아래 표에서 알 수 있듯이, PP-YOLOE+는 높은 정확도를 달성하지만, YOLOv5 CPU 배포 유연성 측면에서 경쟁 우위를 YOLOv5 신규 사용자의 진입 장벽이 현저히 낮습니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

속도와 효율성 분석

Ultralytics YOLOv5 특히 "Nano" 및 "Small" 변형에서 탁월한 효율성을YOLOv5 . YOLOv5n 모델은 단 190만 개의 매개변수로 구성되어 모바일 앱이나 IoT 센서와 같이 극도로 제한된 환경을 위해 특별히 설계되었습니다. PP-YOLOe+는 높은 mAP 제공하지만, 설정 복잡성과 PaddlePaddle 대한 의존성은 표준 PyTorch ONNX 사용하는 생산 파이프라인에서 마찰을 유발할 수 있습니다.

또한 메모리 요구 사항 측면에서도 YOLOv5 유리합니다. 훈련 과정에서 YOLOv5 최적화된 데이터 로더와 메모리 관리 기능은 소비자용 GPU에서 경쟁사 대비 더 큰 배치 크기를 허용하여 AI 엔지니어의 하드웨어 진입 장벽을 낮춥니다.

학습 및 생태계

모델을 둘러싼 생태계는 종종 모델 자체만큼 중요합니다. 바로 이 점에서 Ultralytics 뚜렷한 우위를 Ultralytics .

사용 편의성과 문서화

YOLOv5 "초보자도 쉽게 전문가처럼"이라는 경험으로 YOLOv5 . 개발자는 라이브러리 설치부터 VisDrone 같은 데이터셋으로 맞춤형 모델을 훈련시키는 데까지 단 몇 분이면 충분합니다.

from ultralytics import YOLO

# Load a pretrained YOLO model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5s.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

이에 비해 PP-YOLOE+는 PaddlePaddle PaddleDetection 저장소 복제가 필요합니다. 설정 과정은 여러 YAML 파일 수정과 복잡한 디렉터리 구조 탐색을 수반하는 경우가 많아, Ultralytics 파이썬식 단순함에 익숙한 사용자에게는 더 가파른 학습 곡선을 요구할 수 있습니다.

다용도성과 작업 지원

PP-YOLOE+는 주로 탐지에 초점을 맞추고 있지만, Ultralytics 단일 API 내에서 더 광범위한 비전 작업을 위한 네이티브 지원을 제공합니다:

인스턴스 분할: 객체의 정밀한 마스킹.
자세 추정: 인간 또는 동물 골격의 키포인트 탐지.
방향성 경계 상자(OBB): 회전된 물체 탐지, 항공 촬영에 필수적.
분류: 전체 이미지 분류.

이러한 다용도성 덕분에 개발자는 새로운 프레임워크를 배우거나 데이터 파이프라인을 재작성하지 않고도 작업 간 전환이 가능합니다.

실제 응용 분야

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 인프라가 이미 바이두 기술 스택과 깊이 통합된 경우 강력한 후보입니다. PaddlePaddle 주류 PaddlePaddle 지역 사용자나, 배포 용이성보다 mAP 유일한 mAP 특정 서버 측 배포 환경에서는 PP-YOLOE+가 여전히 유효한 선택지입니다.

Ultralytics YOLO 선택해야 할 때

전 세계 개발자, 스타트업, 기업 팀의 대다수에게 Ultralytics YOLOv5 (및 후속 버전)이 권장되는 선택입니다. 그 이유는 다음과 같습니다:

엣지 배포: TFLite, CoreML 및 OpenVINO 로 원활하게 내보내 모델이 최종 사용자 기기에서 효율적으로 실행되도록 보장합니다.
커뮤니티 지원: 방대하고 활발한 커뮤니티가 자주 업데이트되는 데 기여하여 버그를 신속히 수정하고 자동 주석 추가 같은 새로운 기능이 정기적으로 추가됩니다.
통합 플랫폼: Ultralytics 데이터셋 관리부터 모델 훈련 및 클라우드 배포에 이르기까지 전체 라이프사이클을 간소화합니다.

미래: YOLO26의 등장

YOLOv5 강력하고 신뢰할 수 있는 도구이지만, 컴퓨터 비전 분야는 빠르게 발전하고 Ultralytics 최근 YOLO26를 출시했으며, 이는 효율성과 성능 측면에서 절대적인 최첨단을 대표합니다.

YOLO26은 YOLOv5 PP-YOLOE+ 모두에 비해 여러 획기적인 개선점을 제공합니다:

엔드투엔드 NMS 프리: YOLO26은 추론을 느리게 하는 후처리 단계인 비최대 억제(NMS)를 제거합니다. 이로 인해 배포 로직이 단순화되고 지연 시간이 감소합니다.
MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받아 개발된 이 하이브리드 최적화기는 안정적인 수렴성과 더 빠른 훈련 시간을 보장합니다.
향상된 소형 물체 탐지: ProgLoss 및 STAL (작업 정렬 손실)을 통해 YOLO26은 소형 물체 탐지에 탁월한 성능을 발휘하며, 이는 드론 검사 및 정밀 농업에 필수적인 기능입니다.
43% 더 빠른 CPU : 분포 초점 손실(DFL) 제거로 YOLO26은 CPU에 특화되어 최적화되었으며, 비용 효율적인 엣지 컴퓨팅에 탁월한 선택입니다.

2026년에 신규 프로젝트를 시작하는 개발자분들께서는 최신 신경망 아키텍처 발전을 통해 애플리케이션의 미래 대비를 위해 YOLO26을 적극 검토해 보시길 권장합니다.

YOLO26에 대해 더 알아보기