콘텐츠로 건너뛰기

YOLOv5 PP-YOLOE+: 현대 객체 탐지 기술에 대한 심층 분석

적절한 신경망 아키텍처를 선택하는 것은 현대적인 컴퓨터 비전 프로젝트에 필수적입니다. 개발자와 연구자가 실시간 객체 탐지를 위한 모델을 평가할 때, 결정은 종종 정확도, 추론 속도, 배포 용이성 사이의 균형을 맞추는 문제로 귀결됩니다. 이 기술적 비교는 YOLOv5PP-YOLOE+를 비교 분석합니다. 두 모델의 아키텍처, 성능 지표, 훈련 방법론을 탐구하여 여러분의 애플리케이션에 최적의 솔루션을 선택하는 데 도움을 드립니다.

아키텍처 이해하기

두 모델 모두 비전 AI 분야에 상당한 영향을 미쳤으나, 객체 탐지라는 과제에 접근하는 방식은 서로 다른 구조적 방법론과 프레임워크 의존성을 통해 이루어집니다.

Ultralytics YOLOv5: 업계 표준

2020년 중반 출시된 Ultralytics YOLOv5 는 최첨단 비전 모델의 접근성을 혁신적으로 변화시켰습니다. 최초의 네이티브 PyTorch 구현 YOLO 로서 전 세계 Python 머신러닝 엔지니어들의 진입 장벽을 획기적으로 낮췄습니다.

YOLOv5 :

YOLOv5 수정된 CSPDarknet 백본을 YOLOv5 풍부한 특징 표현을 효율적으로 포착하면서도 가벼운 매개변수 수를 유지합니다. 이 모델은 자동 학습 앵커 박스를 도입하여 훈련 시작 전에도 사용자 정의 데이터셋에 대한 최적의 앵커 크기를 자동으로 계산합니다. 또한 모자이크 데이터 증강을 통합함으로써 detect 물체 detect 능력과 복잡한 공간적 맥락에서의 일반화 능력을 크게 향상시킵니다.

YOLOv5 가장 큰 장점 중 하나는 놀라운 YOLOv5 . 표준 객체 탐지기와 달리 YOLOv5 통합된 API 내에서 이미지 분류, 인스턴스 분할, 바운딩 박스 탐지를 원활하게 지원합니다. 또한 고도로 최적화된 아키텍처 덕분에 무거운 트랜스포머 기반 네트워크에 비해 훈련 및 추론 시 메모리 사용량이 현저히 낮습니다.

5에 대해 자세히 알아보기

PP-YOLOE+: PaddlePaddle

약 2년 후 출시된 PP-YOLOE+는 기존YOLO 기반을 확장한YOLO . 바이두의 딥러닝 프레임워크 성능을 입증하기 위해 개발된 이 모델은 평균 정밀도(MAP) 향상을 위해 여러 구조적 개선 사항을 도입했습니다.

PP-YOLOE+ 상세 정보:

PP-YOLOE+는 앵커 프리 패러다임을 기반으로 하며 CSPRepResNet 백본을 활용합니다. 정밀도 향상을 위해 강력한 작업 정렬 학습 기법과 효율적인 작업 정렬 헤드를 통합했습니다. PP-YOLOE+는 인상적인 정확도 점수를 달성하지만, 주요 약점은 PaddlePaddle 프레임워크에 대한 엄격한 의존성에 있습니다. 이는 PyTorch TensorFlow 이미 깊이 투자한 연구팀과 기업에게 가파른 학습 곡선과 생태계 마찰을 초래하는 경우가 많습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

성능 및 벤치마크

이러한 모델을 생산 환경에서 평가할 때 정확도, 추론 속도, 매개변수 크기 간의 균형을 이해하는 것이 매우 중요합니다. 아래 표는 다양한 크기 변형에 걸친 주요 성능 지표를 요약합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

PP-YOLOE+가 높은 정확도 한계를 달성하는 반면, YOLOv5 제한된 하드웨어에서 YOLOv5 우수한 매개변수 효율성과 더 빠른 추론을 보여줍니다. 메모리가 부족한 에지 배포 환경에서는 YOLOv5n이 타의 추종을 불허하는 속도와 극히 작은 메모리 사용량을 제공합니다.

메모리 효율성

Ultralytics 훈련 효율성을 위해 특별히 설계되었습니다. RT-DETR와 같은 무거운 비전 트랜스포머에 비해 YOLOv5 CUDA 훨씬 적게 YOLOv5 더 큰 배치 크기나 소비자용 하드웨어에서 훈련할 수 있습니다.

Ultralytics : 생태계와 사용 편의성

머신러닝 아키텍처의 진정한 가치는 단순한 수치를 넘어 개발자 경험 전반을 아우릅니다. Ultralytics 이에 대응하는 오픈소스 도구는 정교하게 다듬어지고 잘 관리되는 생태계를 제공하여 개발 주기를 획기적으로 가속화합니다.

  • 사용 편의성: Ultralytics 복잡한 상용구 코드를 Ultralytics . 직관적인 Python 또는 CLI 통해 모델을 훈련, 검증 및 테스트할 수 있습니다.
  • 배포 유연성: 모델 내보내기는 매우 간단합니다. 단일 명령어로 훈련된 YOLOv5 다음과 같은 형식으로 변환할 수 있습니다. ONNX, TensorRT, OpenVINO 등의 형식으로 변환할 수 있어 에지 및 클라우드 환경 전반에 걸쳐 폭넓은 호환성을 보장합니다.
  • 활발한 커뮤니티: 활기찬 커뮤니티는 빈번한 업데이트, 방대한 문서화, 그리고 일반적인 컴퓨터 비전 과제들에 대한 강력한 해결책을 보장합니다.

반면 PP-YOLOE+는 PaddleDetection에 특화된 복잡한 구성 파일에 크게 의존하는데, 이는 신속한 프로토타이핑을 지연시키고 현대적인 MLOps 파이프라인 통합을 복잡하게 만들 수 있습니다.

실용적인 구현 및 코드 예시

Ultralytics 시작은 놀라울 정도로 Ultralytics . 사전 훈련된 YOLOv5 로드하고, 사용자 정의 데이터셋으로 훈련한 후 결과를 내보내는 방법에 대한 완전하고 실행 가능한 예시는 다음과 같습니다:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

사용 사례 및 권장 사항

YOLOv5 PP-YOLOE+ 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

5 선택해야 할 때

YOLOv5 다음과 같은 경우에 강력한 YOLOv5 :

  • 검증된 생산 시스템: YOLOv5 오랜 안정성 track , 방대한 문서화, 그리고 대규모 커뮤니티 지원이 가치 있게 여겨지는 기존 배포 환경.
  • 자원 제약 훈련: GPU 제한된 환경에서 YOLOv5 효율적인 훈련 파이프라인과 낮은 메모리 요구사항이 유리합니다.
  • 다양한 내보내기 형식 지원: ONNX, TensorRT, CoreML, 그리고 TFLite.

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 다음에 권장됩니다:

  • PaddlePaddle 통합: 기존 인프라가 바이두의 PaddlePaddle 프레임워크 및 툴링을 기반으로 구축된 조직.
  • 패들 라이트 에지 배포: 패들 라이트 또는 패들 추론 엔진 전용으로 고도로 최적화된 추론 커널을 갖춘 하드웨어에 배포합니다.
  • 고정밀 서버 측 탐지: 프레임워크 의존성이 문제가 되지 않는 강력한 GPU 최대 탐지 정확도를 우선시하는 시나리오.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

고려할 만한 대체 최첨단 모델들

YOLOv5 견고하고 검증된 YOLOv5 , 컴퓨터 비전 분야는 빠르게 발전하고 YOLOv5 . 새로운 프로젝트를 시작하는 팀에게는 저희의 최신 아키텍처를 적극 검토해 보시길 권장합니다.

Ultralytics YOLO26

2026년 1월 출시된 YOLO26은 저희 연구의 절대적인 정점을 보여줍니다. 정확도와 속도 모두에서 획기적인 개선을 제공합니다. 주요 혁신 사항은 다음과 같습니다:

  • 엔드투엔드 NMS 설계: YOLOv10의 개념을 기반으로, YOLO26은 비최대 억제(NMS) 후처리 단계를 원활하게 제거하여 지연 시간을 줄이고 배포 로직을 단순화합니다.
  • DFL 제거: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 최대 43% 더 빠른 CPU 달성하여 저전력 에지 장치에 매우 강력한 성능을 제공합니다.
  • MuSGD 최적화기: 고급 LLM 훈련 기법에서 영감을 받은 이 SGD 뮤온의 하이브리드 방식은 매우 안정적인 훈련 실행과 더 빠른 수렴을 보장합니다.
  • ProgLoss + STAL: 이 고급 손실 함수들은 드론 영상 및 스마트 농업에 중요한 소형 물체 인식 성능에서 현저한 개선을 제공합니다.

추가로 고려해 볼 수 있는 것은 YOLO11를 고려해 볼 수 있습니다. 이 솔루션은 탁월한 성능을 제공하며, 기존 시스템과 YOLO26의 최첨단 기능 사이에서 매우 신뢰할 수 있는 가교 역할을 합니다.

실제 사용 사례

YOLOv5 PP-YOLOE+ 사이의 선택은 궁극적으로 배포 환경과 프로젝트 제약 조건에 달려 있습니다.

YOLOv5 이상적인 YOLOv5 : YOLOv5 최소한의 리소스 요구사항과 놀라운 사용 편의성으로 엣지 AI의 최우선 선택지입니다. 제한된 하드웨어에서 높은 프레임 속도가 필요한 실시간 로봇공학, 모바일 애플리케이션 통합, 다중 카메라 교통 모니터링 시스템 등에 탁월합니다. 동일한 프레임워크 내에서 자세 추정과 방향성 바운딩 박스(OBB) 작업을 동시에 처리할 수 있는 능력 덕분에 높은 적응성을 자랑합니다.

PP-YOLOE+의 이상적인 적용 분야: PP-YOLOE+는 실시간 처리 제약보다 정적 영상에 대한 절대적 최대 정확도가 우선시되는 시나리오에 가장 적합합니다. 특히 PaddlePaddle ( PaddlePaddle ) 및 PaddlePaddle 상당한 투자를 한 기존 기술 스택을 보유한 아시아 제조업 부문을 중심으로 산업용 검사 파이프라인 분야에서 틈새 시장을 개척하고 있습니다.

요약하자면, PP-YOLOE+가 높은 정밀도 벤치마크를 제공하는 반면, Ultralytics YOLO 성능 균형, 원활한 배포, 개발자 친화적 설계라는 탁월한 조합을 제공하여 컴퓨터 비전 프로젝트를 개념 단계부터 생산 단계까지 성공적으로 이끌어 줍니다.


댓글