PP-YOLOE+ 대 YOLOv5: 객체 탐지 아키텍처 탐색

컴퓨터 비전을 위한 적합한 딥러닝 프레임워크를 선택할 때 개발자들은 종종 속도, 정확도, 배포 용이성 사이의 완벽한 균형을 찾기 위해 서로 다른 아키텍처의 성능을 비교하게 됩니다. 이 심층 분석에서는 PP-YOLOE+와 YOLOv5 간의 기술적 차이를 살펴봅니다. 두 프레임워크의 아키텍처, 성능 지표, 그리고 최적의 배포 시나리오를 분석함으로써 실시간 로봇공학, 엣지 컴퓨팅, 클라우드 기반 영상 분석 등 향후 프로젝트에 적합한 선택을 할 수 있습니다.

모델 기원 및 메타데이터

두 모델 모두 매우 유능한 엔지니어링 팀에서 비롯되었지만 약간 다른 생태계를 목표로 합니다. 그들의 기원을 이해하는 것은 아키텍처 설계 선택에 대한 귀중한 맥락을 제공합니다.

PP-YOLOE+ 상세 정보:

저자: PaddlePaddle Authors
기관: Baidu
날짜: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: PaddlePaddle
문서: PaddleDetection README

PP-YOLOE+에 대해 자세히 알아보세요.

YOLOv5 :

저자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: yolov5
문서: https://docs.ultralytics.com/models/YOLOv5/

5에 대해 자세히 알아보기

아키텍처 비교

PP-YOLOE+ 건축

PP-YOLOE+는 PP-YOLOv2와 같은 기존 모델을 기반으로 구축된 바이두 생태계 내의 진화형 모델입니다. 이 모델은 고도로 최적화된 CSPRepResNet 백본은 CSP(Cross Stage Partial) 네트워크의 원리와 재매개변수화(re-parameterization) 기술을 결합하여 특징 추출을 향상시킵니다. 이를 통해 모델은 학습 중 높은 정확도를 유지하면서도 더 간소화된 아키텍처로 축소되어 더 빠른 추론이 가능합니다.

또한, PP-YOLOE+는 TAL(Task Alignment Learning)과 ET-head(Efficient Task-aligned head)를 사용합니다. 이 조합은 밀집 객체 detect기에서 흔히 발생하는 분류 및 지역화 작업 간의 불일치를 해결하는 것을 목표로 합니다. 구조적으로 인상적이지만, 이 아키텍처는 PaddlePaddle 프레임워크와 밀접하게 결합되어 있어 다른 주류 ML 라이브러리를 표준화하는 팀에게 통합 문제를 야기할 수 있습니다.

YOLOv5 아키텍처

반면, YOLOv5 는 PyTorch으로 설계되었습니다. 이는 학계 연구와 기업 생산 모두에서 업계 표준으로 인정받는 프레임워크입니다. YOLOv5는 수정된 CSPDarknet53 백본을 활용하는데, 이 백본은 탁월한 기울기 흐름과 매개변수 효율성으로 잘 알려져 있습니다.

YOLOv5의 특징은 AutoAnchor 알고리즘으로, 훈련 전에 특정 사용자 정의 데이터셋을 기반으로 앵커 박스 크기를 동적으로 확인하고 조정합니다. 이를 통해 바운딩 박스에 대한 수동 하이퍼파라미터 튜닝이 필요 없습니다. 모델의 PANet(Path Aggregation Network) 넥은 강력한 다중 스케일 특징 융합을 보장하여 다양한 크기의 객체를 detect하는 데 매우 효과적입니다.

간소화된 PyTorch

YOLOv5는 PyTorch를 기반으로 직접 구축되었기 때문에, ONNX 및 TensorRT와 같은 최적화된 형식으로 내보내려면 로컬 프레임워크에 종속된 모델보다 훨씬 적은 미들웨어 구성이 필요합니다.

성능 분석

이러한 모델을 평가하려면 평균 정밀도(mAP)와 지연 시간 간의 균형을 살펴봐야 합니다. 다음 표는 다양한 모델 크기에 걸친 지표를 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

PP-YOLOE+는 더 큰 규모(예: X 변형)에서 매우 경쟁력 있는 mAP 달성하지만, YOLOv5 우수한 속도와 더 적은 매개변수 수를 YOLOv5 스펙트럼의 더 작은 끝에서. YOLOv5 Nano (YOLOv5n)는 단 260만 개의 파라미터만 필요로 하여 메모리 요구 사항이 엄격한 제한된 엣지 장치에 매우 적합합니다. 또한, YOLO 모델 훈련은 일반적으로 다음과 같은 무거운 트랜스포머 기반 대안에 비해 적은 CUDA 메모리를 소비합니다. RT-DETR.

Ultralytics 이점

아키텍처를 선택할 때, 단순한 지표는 고려 사항의 일부에 불과합니다. 개발자 경험, 생태계 지원, 배포 파이프라인이 종종 프로젝트의 실제 성공을 좌우합니다. 바로 이 점에서 Ultralytics 빛을 발합니다.

타의 추종을 불허하는 사용 편의성

Ultralytics Python 복잡한 반복 코드를 Ultralytics . 개발자는 모델 훈련을 시작하고, 성능을 검증하며, 모델을 원활하게 배포할 수 있습니다. 문서화는 방대하고 철저히 관리되며, 대규모 글로벌 오픈소스 커뮤니티의 지원을 받습니다.

작업 전반에 걸친 다양한 활용성

PP-YOLOE+는 전용 객체 탐지 도구이지만, Ultralytics 통해 사용자는 단일 통합 API로 다양한 컴퓨터 비전 작업을 처리할 수 있습니다. YOLOv5 및 그 후속 모델을 활용하면 표준 바운딩 박스에서 이미지 분할 및 분류 워크플로로 손쉽게 전환할 수 있습니다.

코드 예시: YOLOv5 훈련

시작하는 데는 몇 줄의 코드만 필요합니다. 이러한 단순성은 연구 개발 주기를 크게 가속화합니다.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

실제 사용 사례

PP-YOLOE+를 선택해야 할 때: 조직이 Baidu 소프트웨어 스택에 깊이 통합되어 있거나 PaddlePaddle 프레임워크를 필수로 하는 특수 하드웨어에 크게 의존하는 경우, PP-YOLOE+는 견고한 성능을 발휘합니다. Paddle과의 레거시 통합이 존재하는 아시아 전역의 특수 제조 파이프라인에서 자주 활용됩니다.

YOLOv5를 선택해야 할 때: 대다수의 국제 개발자, 연구원 및 기업에게 YOLOv5는 여전히 강력한 도구입니다. PyTorch 기반이라는 점은 Weights & Biases와 같은 track 도구와 즉시 호환되며, NVIDIA GPU 가속을 위한 TensorRT 또는 Apple 장치를 위한 CoreML로 깔끔하게 내보낼 수 있음을 의미합니다. 농작물 모니터링부터 고속 드론 내비게이션에 이르는 다양한 분야에서 뛰어난 성능을 발휘합니다.

탐지의 미래: Ultralytics

YOLOv5 상징적인 YOLOv5 , 컴퓨터 비전의 최전선은 진화해 왔습니다. 모든 신규 개발에는 2026년 1월 출시된 YOLO26로의 전환을 강력히 권장합니다. Ultralytics 통해 원활하게 이용 가능한 YOLO26은 효율성을 완전히 재정의합니다.

YOLO26에 대해 더 알아보기

YOLO26의 주요 혁신 사항:

종단 간 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 완전히 제거합니다. 이는 지연 시간 가변성을 줄이고 배포 파이프라인을 극적으로 단순화합니다.
최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써, YOLO26은 GPU가 없는 엣지 장치에서 속도를 극적으로 향상시킵니다.
MuSGD Optimizer: 선도적인 대규모 언어 모델에서 영감을 받은 이 하이브리드 옵티마이저는 훈련 역학을 안정화하고 사용자 정의 데이터셋에서 훨씬 빠른 수렴을 가능하게 합니다.
태스크별 향상: ProgLoss 및 STAL과 같은 고급 손실 함수를 특징으로 하며, 작은 객체에 대해 전례 없는 정확도를 제공합니다. 항공 이미지에 대한 Oriented Bounding Box (OBB) detect를 기본적으로 지원합니다.

최첨단 비전 모델을 탐구 중이라면, 이전 세대 모델인 YOLO11 이나 RT-DETR과 같은 접근법을 비교해 보는 것도 흥미로울 것입니다. 궁극적으로, 견고한 생태계와 첨단 아키텍처 발전이 결합되어 Ultralytics 현대 컴퓨터 비전 작업에 있어 최고의 Ultralytics 자리매김합니다.