YOLOv5 vs. PP-YOLOE+: 현대 객체 탐지에 대한 기술적 심층 분석

현대 컴퓨터 비전 프로젝트에서 적절한 신경망 아키텍처를 선택하는 것은 매우 중요합니다. 개발자와 연구자가 실시간 객체 탐지를 위해 모델을 평가할 때, 흔히 정확도, 추론 속도, 배포 용이성 사이의 균형을 고려하게 됩니다. 본 기술 비교에서는 YOLOv5와 **PP-YOLOE+**를 검토하며, 각 모델의 아키텍처, 성능 지표, 학습 방법론을 살펴보고 프로젝트에 최적인 솔루션을 선택할 수 있도록 돕습니다.

아키텍처 이해하기

두 모델 모두 비전 AI 분야에 큰 영향을 미쳤지만, 객체 탐지의 과제를 해결하는 구조적 방법론과 프레임워크 의존성 측면에서 차이를 보입니다.

Ultralytics YOLOv5: 업계 표준

2020년 중반에 출시된 Ultralytics YOLOv5는 최첨단 비전 모델에 대한 접근성을 혁신적으로 높였습니다. YOLO 제품군 중 최초로 PyTorch를 기본으로 구현되어, 전 세계 Python 개발자와 ML 엔지니어들의 진입 장벽을 크게 낮췄습니다.

YOLOv5 세부 정보:

YOLOv5는 수정된 CSPDarknet 백본을 사용하여 가벼운 파라미터 수를 유지하면서도 풍부한 특징 표현을 효율적으로 포착합니다. 또한, 학습 시작 전 사용자 정의 데이터셋에 최적화된 앵커 박스 크기를 자동으로 계산하는 자동 학습 앵커 박스 기능을 도입했습니다. 더불어, 모자이크 데이터 증강을 통합하여 작은 객체를 탐지하고 복잡한 공간적 맥락에 걸쳐 일반화하는 모델의 능력을 크게 향상시켰습니다.

One of the greatest strengths of YOLOv5 is its incredible versatility. Unlike standard object detectors, the YOLOv5 family seamlessly supports image classification, instance segmentation, and bounding box detection within a unified API. Its highly optimized architecture also translates to substantially lower memory usage during training and inference compared to heavy transformer-based networks.

YOLOv5에 대해 더 알아보기

PP-YOLOE+: PaddlePaddle의 경쟁자

약 2년 뒤에 출시된 PP-YOLOE+는 이전 PP-YOLO 버전의 기반 위에서 구축되었습니다. Baidu의 딥러닝 프레임워크 기능을 선보이기 위해 개발되었으며, 평균 정밀도(mAP)를 높이기 위해 여러 아키텍처 개선 사항을 도입했습니다.

PP-YOLOE+ 세부 정보:

PP-YOLOE+는 앵커 프리(anchor-free) 패러다임에 의존하며 CSPRepResNet 백본을 사용합니다. 정밀도를 향상시키기 위해 강력한 Task Alignment Learning 기법과 효율적인 Task-aligned Head를 통합했습니다. PP-YOLOE+는 인상적인 정확도 점수를 달성하지만, 주요 약점은 PaddlePaddle 프레임워크에 대한 강한 의존성입니다. 이는 PyTorch나 TensorFlow 환경에 깊이 투자한 연구 팀과 기업에게 종종 높은 학습 곡선과 생태계 마찰을 유발합니다.

PP-YOLOE+에 대해 더 알아보기

성능 및 벤치마크

프로덕션 환경을 위해 이러한 모델을 평가할 때는 정밀도, 추론 속도, 파라미터 점유율 사이의 절충안을 이해하는 것이 중요합니다. 아래 표는 다양한 크기 변형 모델에 걸친 핵심 성능 지표를 요약한 것입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

PP-YOLOE+가 높은 정확도 한계에 도달하는 반면, YOLOv5는 제약이 있는 하드웨어에서 일관되게 우수한 파라미터 효율성과 더 빠른 추론 속도를 보여줍니다. 메모리가 부족한 엣지 배포 환경의 경우, YOLOv5n은 타의 추종을 불허하는 속도와 극도로 작은 점유율을 제공합니다.

메모리 효율성

Ultralytics 모델은 학습 효율성을 위해 특별히 설계되었습니다. RT-DETR과 같은 무거운 비전 Transformer와 비교하여, YOLOv5는 훨씬 적은 CUDA 메모리를 사용하여 더 큰 배치 크기나 소비자 등급의 하드웨어에서도 학습을 가능하게 합니다.

Ultralytics의 강점: 생태계와 사용 편의성

머신러닝 아키텍처의 진정한 가치는 단순한 수치를 넘어 전체 개발자 경험을 포괄합니다. Ultralytics Platform과 그에 상응하는 오픈 소스 도구들은 개발 주기를 획기적으로 가속화하는 매우 정교하고 잘 관리된 생태계를 제공합니다.

  • 사용 용이성: Ultralytics는 복잡한 상용구 코드를 추상화합니다. 직관적인 Python API 또는 CLI를 통해 모델을 학습, 검증, 테스트할 수 있습니다.
  • 배포 유연성: 모델 내보내기가 매우 간단합니다. 단일 명령으로 학습된 YOLOv5 가중치를 ONNX, TensorRT 또는 OpenVINO와 같은 형식으로 변환할 수 있어 엣지 및 클라우드 환경 전반에서 광범위한 호환성을 보장합니다.
  • 활발한 커뮤니티: 활기찬 커뮤니티는 빈번한 업데이트, 방대한 문서, 그리고 일반적인 컴퓨터 비전 문제에 대한 강력한 솔루션을 보장합니다.

반면, PP-YOLOE+는 PaddleDetection에 특화된 복잡한 설정 파일에 크게 의존하므로 신속한 프로토타이핑 속도가 떨어질 수 있고 현대적인 MLOps 파이프라인 통합이 복잡해질 수 있습니다.

실용적인 구현 및 코드 예제

Ultralytics를 시작하는 것은 매우 간단합니다. 사전 학습된 YOLOv5 모델을 로드하고, 사용자 정의 데이터셋으로 학습시키며, 결과를 내보내는 방법에 대한 완전하고 실행 가능한 예제입니다:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

사용 사례 및 권장 사항

YOLOv5와 PP-YOLOE+ 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건, 그리고 생태계 선호도에 따라 달라집니다.

YOLOv5를 선택해야 할 때

YOLOv5는 다음과 같은 경우에 강력한 선택입니다:

  • 검증된 프로덕션 시스템: YOLOv5의 오랜 안정성 기록, 광범위한 문서화 및 방대한 커뮤니티 지원이 가치 있게 평가되는 기존 배포 환경.
  • 자원 제약이 있는 학습 환경: GPU 자원이 제한적인 환경에서 YOLOv5의 효율적인 학습 파이프라인과 낮은 메모리 요구사항이 유리한 경우.
  • 광범위한 내보내기 형식 지원: ONNX, TensorRT, CoreML, TFLite를 포함한 다양한 형식으로 배포해야 하는 프로젝트.

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 다음과 같은 경우에 권장됩니다:

  • PaddlePaddle 생태계 통합: Baidu의 PaddlePaddle 프레임워크 및 도구를 기반으로 구축된 기존 인프라를 보유한 조직.
  • Paddle Lite 엣지 배포: Paddle Lite 또는 Paddle 추론 엔진에 최적화된 추론 커널이 있는 하드웨어에 배포하는 경우.
  • 고정밀 서버 측 탐지: 프레임워크 종속성이 문제가 되지 않는 강력한 GPU 서버에서 최대 탐지 정확도를 우선시하는 시나리오.

Ultralytics(YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최적의 조합을 제공합니다:

  • NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.

고려해야 할 대체 최첨단 모델

YOLOv5는 강력하고 검증된 표준이지만, 컴퓨터 비전 분야는 빠르게 움직입니다. 새로운 프로젝트를 시작하는 팀에게는 저희의 최신 아키텍처를 탐색해 보시기를 적극 권장합니다.

Ultralytics YOLO26

2026년 1월에 출시된 YOLO26은 저희 연구의 절대적인 정점을 나타냅니다. 정확도와 속도 모두에서 거대한 개선을 제공합니다. 주요 혁신 사항은 다음과 같습니다:

  • 종단간(End-to-End) NMS 프리 설계: YOLOv10의 개념을 바탕으로 YOLO26은 NMS(Non-Maximum Suppression) 후처리를 기본적으로 제거하여 지연 시간을 줄이고 배포 로직을 단순화합니다.
  • DFL 제거: Distribution Focal Loss를 제거함으로써 YOLO26은 최대 43% 더 빠른 CPU 추론 속도를 달성하여 저전력 엣지 장치에 매우 강력한 성능을 제공합니다.
  • MuSGD 옵티마이저: 고급 LLM 학습 기술에서 영감을 받은 이 SGD와 Muon의 하이브리드는 매우 안정적인 학습 실행과 더 빠른 수렴을 보장합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 소형 객체 인식에서 눈에 띄는 개선을 제공하며, 이는 드론 영상 분석 및 스마트 농업에 매우 중요합니다.

또한, 우수한 성능을 제공하며 기존 시스템과 YOLO26의 최첨단 기능 사이의 매우 신뢰할 수 있는 가교 역할을 하는 YOLO11을 고려해 보실 수 있습니다.

실제 사용 사례

YOLOv5와 PP-YOLOE+ 사이의 선택은 궁극적으로 귀하의 배포 환경과 프로젝트 제약 사항에 따라 결정됩니다.

이상적인 YOLOv5 애플리케이션: YOLOv5의 최소한의 리소스 요구 사항과 놀라운 사용 편의성은 엣지 AI를 위한 최고의 선택으로 만듭니다. 실시간 로봇 공학, 모바일 애플리케이션 통합, 다중 카메라 교통 모니터링 시스템과 같이 제한된 하드웨어에서 높은 프레임 속도를 요구하는 애플리케이션에서 탁월합니다. 동일한 프레임워크 내에서 자세 추정회전된 경계 상자(OBB) 작업을 동시에 처리하는 능력은 높은 적응성을 제공합니다.

이상적인 PP-YOLOE+ 애플리케이션: PP-YOLOE+는 실시간 처리 제약보다 정적 이미지에서의 절대적인 최대 정확도가 우선시되는 시나리오에 가장 적합합니다. 산업용 검사 파이프라인, 특히 Baidu 및 PaddlePaddle 생태계에 깊이 투자된 기존 기술 스택을 보유한 아시아 제조 분야에서 틈새 활용 사례를 찾습니다.

요약하자면, PP-YOLOE+는 강력한 정밀도 벤치마크를 제공하지만, Ultralytics YOLO 모델은 개념부터 프로덕션까지 성공적인 컴퓨터 비전 프로젝트를 이끄는 성능 균형, 원활한 배포, 개발자 친화적인 디자인의 독보적인 조합을 제공합니다.

댓글