PP-YOLOE+ vs YOLOv5: 상세 기술 비교
정확도, 속도 및 구현 용이성 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 Baidu의 효율적인 모델인 PP-YOLOE+와 널리 채택되고 업계에서 검증된 모델인 Ultralytics YOLOv5 간의 심층적인 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 대한 정보에 입각한 선택을 내리는 데 도움이 되도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 살펴보겠습니다.
PP-YOLOE+: PaddlePaddle 생태계에서 높은 정확도 제공
PP-YOLOE+는 Baidu에서 개발한 단일 스테이지, 앵커 프리 감지기입니다. 2022년에 출시되었으며, 특히 PaddlePaddle 딥 러닝 프레임워크 내에서 정확도와 속도 간의 우수한 균형을 달성하는 데 중점을 두고 PP-YOLOE 모델을 기반으로 합니다.
기술 세부 사항:
- 작성자: PaddlePaddle 작성자
- Organization: Baidu
- 날짜: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- 문서: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 주요 기능
PP-YOLOE+는 성능을 개선하기 위해 몇 가지 아키텍처 개선 사항을 도입합니다.
- Anchor-Free Design: 사전 정의된 앵커 박스를 제거함으로써 PP-YOLOE+는 감지 파이프라인을 간소화하고 튜닝해야 하는 하이퍼파라미터의 수를 줄입니다.
- 효율적인 백본 및 Neck: CSPRepResNet과 같은 효율적인 백본과 여러 스케일에서 효과적인 특징 융합을 위해 PAN(Path Aggregation Network)을 활용합니다.
- Decoupled Head: 이 모델은 분류 및 회귀 작업을 분리하는 분리된 헤드(ET-Head)를 사용하며, 이는 종종 정확도 향상으로 이어집니다.
- 고급 손실 함수: Task Alignment Learning(TAL) 및 VariFocal Loss를 사용하여 분류 점수와 현지화 정확도를 더 잘 정렬하여 더 정확한 감지를 제공합니다. Ultralytics 문서에서 다른 손실 함수를 탐색할 수 있습니다.
강점과 약점
- 강점:
- 높은 정확도 잠재력으로, 벤치마크 데이터 세트에서 mAP가 다른 모델보다 뛰어난 성능을 보이는 경우가 많습니다.
- 특히 GPU에서 TensorRT로 최적화된 경우 효율적인 추론 속도를 제공합니다.
- 앵커 프리 방식은 특정 시나리오에서 학습 파이프라인을 단순화할 수 있습니다.
- 약점:
- 생태계 고정: 주로 PaddlePaddle 프레임워크 내에서 설계 및 최적화되었으므로 PyTorch 또는 다른 생태계에 익숙한 개발자에게는 상당한 장벽이 될 수 있습니다.
- 더 작은 커뮤니티: 커뮤니티와 사용 가능한 리소스는 Ultralytics YOLO 모델을 둘러싼 광대한 생태계에 비해 덜 광범위합니다.
- 복잡성: PaddlePaddle이 아닌 워크플로우로 통합하는 것은 복잡하고 시간이 많이 소요될 수 있습니다.
사용 사례
PP-YOLOE+는 특히 PaddlePaddle 생태계 내에서 이미 운영 중인 팀의 경우 가능한 한 가장 높은 정확도를 달성하는 것이 우선 순위인 애플리케이션에 적합한 선택입니다.
- 산업 품질 검사: 높은 정확도는 제조 시 미묘한 결함을 감지하는 데 유용합니다.
- 스마트 리테일: 정밀한 재고 관리 및 고객 분석에 사용될 수 있습니다.
- 연구: 앵커 프리 아키텍처와 고급 손실 함수를 탐구하는 연구자들에게 유용한 모델입니다.
Ultralytics YOLOv5: 확고한 산업 표준
2020년 Glenn Jocher가 출시한 Ultralytics YOLOv5는 빠른 속도, 정확성 및 개발자 친화적인 특성으로 인해 빠르게 업계 표준이 되었습니다. PyTorch에서 구축되어 간단한 학습 및 배포 프로세스로 유명하여 초보자와 전문가 모두가 쉽게 접근할 수 있습니다.
기술 세부 사항:
- 작성자: Glenn Jocher
- 조직: Ultralytics
- 날짜: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- 문서: https://docs.ultralytics.com/models/yolov5/
아키텍처 및 주요 기능
YOLOv5의 아키텍처는 효율성과 성능에 매우 최적화되어 있습니다.
- Backbone: 계산 부하와 특징 추출 기능의 균형을 효과적으로 유지하는 CSPDarknet53 백본을 사용합니다.
- Neck: PANet 특징 통합기는 다양한 스케일에서 객체를 탐지하는 모델의 능력을 향상시킵니다.
- 헤드: 앵커 기반 감지 헤드를 사용하며, 이는 강력하고 광범위한 객체 감지 작업에서 효과적인 것으로 입증되었습니다.
- 확장성: YOLOv5는 다양한 크기(n, s, m, l, x)로 제공되므로 개발자는 경량 에지 장치에서 강력한 클라우드 서버에 이르기까지 특정 요구 사항에 맞는 속도와 정확도 간의 완벽한 균형을 선택할 수 있습니다.
강점과 약점
- 강점:
- 사용 편의성: YOLOv5는 간단한 Python API, 사용하기 쉬운 CLI 및 광범위한 documentation을 통해 간소화된 사용자 경험으로 유명합니다.
- 잘 관리되는 에코시스템: 활발한 개발, 크고 도움이 되는 커뮤니티, 잦은 업데이트, 노코드 학습 및 배포를 위한 Ultralytics HUB와 같은 도구를 포함하는 포괄적인 Ultralytics 에코시스템에 의해 지원됩니다.
- 성능 균형: 추론 속도와 정확도 간의 뛰어난 균형을 제공하므로 실시간 애플리케이션에 이상적입니다.
- 학습 효율성: YOLOv5는 즉시 사용 가능한 사전 학습된 가중치를 통해 효율적인 학습 프로세스를 특징으로 하여 더 빠른 수렴을 가능하게 하고 개발 시간을 단축합니다.
- 다양성: 객체 탐지 외에도 YOLOv5는 인스턴스 분할 및 이미지 분류를 지원하여 여러 비전 작업을 위한 유연한 솔루션을 제공합니다.
- 약점:
- 매우 정확하지만, 가장 큰 PP-YOLOE+ 모델은 특정 벤치마크에서 약간 더 높은 mAP를 달성할 수 있습니다.
- 앵커 기반 접근 방식은 일반적이지 않은 객체 종횡비를 가진 데이터 세트에 대해 약간의 조정이 필요할 수 있습니다.
사용 사례
YOLOv5는 빠른 속도, 효율성, 간편한 배포 덕분에 광범위한 애플리케이션 분야에서 최고의 선택으로 꼽힙니다.
- 실시간 비디오 분석: 보안 시스템, 교통 모니터링 및 감시에 적합합니다.
- Edge 배포: 더 작은 모델(YOLOv5n, YOLOv5s)은 Raspberry Pi 및 NVIDIA Jetson과 같이 리소스가 제한된 장치에 고도로 최적화되어 있습니다.
- 산업 자동화: 자동화된 환경에서 품질 관리, 결함 감지 및 로봇 공학에 널리 사용됩니다.
성능 분석: PP-YOLOE+ vs. YOLOv5
PP-YOLOE+와 YOLOv5의 성능은 각 모델의 서로 다른 설계 철학을 강조합니다. PP-YOLOE+ 모델은 일반적으로 더 높은 mAP 점수를 달성하여 정확도 면에서 강점을 드러냅니다. 예를 들어 PP-YOLOE+l은 52.9 mAP에 도달하여 YOLOv5l의 49.0 mAP를 능가합니다. 그러나 이러한 정확도는 비용이 따릅니다.
반면에 YOLOv5는 추론 속도와 효율성 면에서 확실한 선두 주자입니다. 더 작은 모델은 매우 빨라서 CPU와 GPU 모두에서 실시간 애플리케이션에 이상적입니다. 아래 표에서 PP-YOLOE+는 TensorRT를 사용하는 GPU에서 매우 빠르지만, YOLOv5는 광범위한 최적화 없이 다양한 하드웨어에 배포해야 하는 개발자에게 더 쉽고 종종 더 빠른 솔루션을 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
결론: 어떤 모델을 선택해야 할까요?
PP-YOLOE+와 YOLOv5 중에서 선택하는 것은 프로젝트의 우선 순위와 기존 기술 스택에 크게 좌우됩니다.
-
PP-YOLOE+는 탐지 정확도를 최대화하는 것이 주요 목표이고 Baidu PaddlePaddle 생태계 내에서 이미 작업하고 있거나 채택할 의향이 있는 경우에 탁월한 옵션입니다. 최신 앵커 프리 설계와 고급 손실 함수는 성능의 경계를 넓힙니다.
-
Ultralytics YOLOv5는 대다수의 개발자와 애플리케이션에 권장되는 선택입니다. 타의 추종을 불허하는 사용 편의성, 뛰어난 성능 균형, 그리고 놀라운 배포 유연성은 더욱 실용적이고 효율적인 솔루션을 제공합니다. 강력하고 잘 관리되는 Ultralytics 생태계는 학습에서 프로덕션에 이르기까지 탁월한 지원을 제공하여 더욱 원활하고 빠른 개발 주기를 보장합니다. 실시간 속도, 간단한 구현, 그리고 강력한 커뮤니티 지원을 요구하는 프로젝트에 YOLOv5는 여전히 최고의 선택입니다.
다른 모델 살펴보기
YOLOv5는 강력하고 성숙한 모델이지만, Ultralytics는 계속 혁신하고 있습니다. 최신 발전을 찾고 있다면 YOLOv8, YOLOv10 및 최첨단 YOLO11과 같은 최신 모델을 살펴보십시오. 이러한 모델은 YOLOv5의 강점을 기반으로 더욱 향상된 성능과 더 많은 기능을 제공합니다. 자세한 분석은 Ultralytics 모델 비교 페이지를 방문하십시오.