YOLOv5 PP-YOLOE+: 객체 감지를 위한 기술 비교
최적의 객체 감지 모델을 선택하는 것은 컴퓨터 비전 프로젝트의 효율성, 정확성 및 확장성에 영향을 미치는 중요한 결정입니다. 이 종합 가이드에서는 다음을 비교합니다. Ultralytics YOLOv5와 바이두 PaddlePaddle 에코시스템의 정확도가 높은 모델인 PP-YOLOE+를 비교하고, 사용성과 속도로 유명한 전설적인 모델입니다. 아키텍처, 성능 메트릭, 배포 워크플로우를 분석하여 개발자와 연구자가 특정 요구사항에 가장 적합한 솔루션을 선택할 수 있도록 돕고자 합니다.
Ultralytics YOLOv5: 사용성 및 속도의 표준
2020년 Ultralytics 출시한 YOLOv5 모든 사람이 최첨단 물체 감지를 이용할 수 있게 함으로써 비전 AI의 환경을 근본적으로 변화시켰습니다. 이전 버전과 달리, 이 모델은 다음에서 기본적으로 구현된 최초의 YOLO 모델입니다. PyTorch로 구현되어 전 세계 데이터 과학 커뮤니티의 훈련 및 배포 프로세스를 간소화합니다. 설계 철학은 실시간 추론 속도와 높은 정확도 사이의 균형을 우선시하며, 놀랍도록 사용자 친화적인 에코시스템에 패키징되어 있습니다.
저자 작성자: Glenn Jocher
조직:Ultralytics
날짜: 2020-06-26
깃허브yolov5
문서yolov5
주요 강점
- 사용 편의성: YOLOv5 "바로 사용할 수 있는" 환경으로 유명합니다. 간소화된 Python API와 직관적인 CLI 명령어를 통해 개발자는 몇 분 안에 맞춤형 데이터 세트에 대한 교육을 시작할 수 있습니다.
- 잘 관리된 에코시스템: Ultralytics 지원을 받아 잦은 업데이트와 방대하고 활발한 커뮤니티를 자랑합니다. 따라서 장기적인 지원과 GitHub 이슈와 같은 플랫폼에서 풍부한 공유 지식이 보장됩니다.
- 성능 균형: 특히 라즈베리 파이와 같은 엣지 디바이스에서 정확도를 크게 떨어뜨리지 않으면서도 뛰어난 실시간 추론 속도를 제공합니다.
- 다목적성: 표준 감지 외에도 YOLOv5 인스턴스 분할과 이미지 분류를 지원하여 다양한 비전 작업에 유연한 툴입니다.
PP-YOLOE+: 패들 에코시스템의 높은 정확도
PP-YOLOE+는 바이두의 연구원들이 개발한 YOLO 시리즈의 진화 버전입니다. 2022년에 출시된 이 제품은 패들디텍션 툴킷의 플래그십 모델입니다. 이 제품은 앵커 프리 아키텍처와 고급 훈련 전략을 채택하여 다음과 같은 벤치마크 데이터 세트에서 정밀도의 한계를 뛰어넘습니다. COCO.
저자들: PaddlePaddle 저자
조직:바이두
날짜: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
문서PaddlePaddle
아키텍처 및 기능
PP-YOLOE+는 CSPRepResNet 백본과 고유한 프로토타입이 없는 감지 헤드를 활용합니다. 앵커가 없는 검출기이기 때문에 앵커 박스와 관련된 하이퍼파라미터 튜닝의 복잡성을 줄여줍니다. 평균 정밀도(mAP)를 극대화하는 것이 주요 목표인 시나리오에서 탁월하며, 계산 복잡성이 증가하는 대신 비슷한 앵커 기반 모델보다 약간 더 높은 점수를 달성하는 경우가 많습니다. 그러나 PaddlePaddle 프레임워크에 대한 의존성으로 인해 PyTorch 또는 TensorFlow 표준화된 팀에게는 학습 곡선이 나타날 수 있습니다.
성과 분석: 메트릭 및 효율성
YOLOv5 PP-YOLOE+를 비교할 때, 일반적으로 원시 정확도와 운영 효율성(속도 및 배포 용이성) 사이에서 절충점을 찾아야 합니다.
속도 대 정확도
PP-YOLOE+ 모델은 일반적으로 더 높은 mAP 게시합니다.val 점수를 획득하여 순수 탐지 기능에 강점을 가지고 있음을 입증했습니다. 예를 들어 PP-YOLOE+l 는 놀라운 52. mAP 달성합니다. 하지만 표준 하드웨어에서는 YOLOv5 비해 지연 시간이 더 길어지는 경우가 많습니다.
Ultralytics YOLOv5 다음과 같은 분야에서 빛을 발합니다. 추론 속도. 다음 YOLOv5n (나노) 모델은 놀랍도록 가벼우며, T4 GPU 1.12ms의 초고속 추론 시간으로 28. mAP 달성합니다. TensorRT. 따라서 YOLOv5 다음과 같은 경우에 탁월한 선택입니다. 엣지 AI 애플리케이션 밀리초 단위의 지연 시간이 중요한 경우.
컴퓨팅 효율성
YOLOv5 모델은 메모리 제약을 염두에 두고 설계되었습니다. 일반적으로 복잡한 앵커 프리 아키텍처나 트랜스포머 기반 모델에 비해 훈련 및 추론 중에 더 적은 CUDA 메모리를 필요로 합니다. 이러한 효율성 덕분에 광범위한 최적화 작업 없이도 NVIDIA Jetson 모듈과 같이 리소스가 제한된 하드웨어에 보다 원활하게 배포할 수 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
교육 에코시스템 및 사용성
개발자 경험의 '소프트' 지표가 프로젝트의 성공을 좌우하는 경우가 많습니다. 여기서 두 모델 간의 차이가 가장 두드러집니다.
Ultralytics 에코시스템
YOLOv5 전체 MLOps 파이프라인을 간소화하는 통합된 Ultralytics 에코시스템의 이점을 활용합니다.
- PyTorch 네이티브: PyTorch 기반으로 구축되어 대부분의 오픈 소스 도구 및 라이브러리와의 호환성을 보장합니다.
- 원활한 통합: 다음에 대한 기본 지원 Weights & Biases, Comet및 ClearML 을 사용하면 실험 추적이 쉬워집니다.
- 훈련 효율성: 사전 훈련된 가중치를 쉽게 사용할 수 있고 자동으로 다운로드할 수 있어 빠른 전이 학습이 가능합니다.
- 배포: 내보내기 모드는 원클릭 변환을 지원합니다. ONNX, CoreML, TFLite등.
Ultralytics HUB로 워크플로우 간소화
Ultralytics HUB를 사용하면 코드를 한 줄도 작성하지 않고도 YOLOv5 모델을 훈련, 미리 보기, 배포할 수 있습니다. 이 웹 기반 플랫폼은 데이터 세트와 트레이닝 실행을 관리하므로 모든 기술 수준의 팀이 비전 AI에 액세스할 수 있습니다.
PaddlePaddle 에코시스템
PP-YOLOE+는 바이두의 딥 러닝 프레임워크인 PaddlePaddle 사용합니다. 아시아에서는 강력하고 인기 있는 프레임워크이지만, 서양 연구 커뮤니티에서는 PyTorch 비해 그 입지가 작습니다. PP-YOLOE+를 채택하려면 별도의 환경을 설정하고 패들 전용 구문을 학습해야 하는 경우가 많습니다(paddle.io, paddle.nn). 동안 문서 는 포괄적이지만 타사 도구와 커뮤니티 지원의 생태계는 YOLOv5 비해 덜 광범위합니다.
코드 예시: YOLOv5 단순성
다음 Python 코드는 사전 학습된 YOLOv5 모델을 로드하고 PyTorch Hub를 사용하여 추론을 수행하는 것이 얼마나 쉬운지 보여줍니다.
import torch
# Load a YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image source
img = "https://ultralytics.com/images/zidane.jpg"
# Run inference
results = model(img)
# Print results to console
results.print()
# Show the image with bounding boxes
results.show()
실제 사용 사례
YOLOv5 장점
- 산업 자동화: 빠른 속도로 빠르게 움직이는 조립 라인에서 실시간으로 결함을 감지할 수 있습니다.
- 자율 로봇 공학: 메모리 오버헤드가 적어 물류에 사용되는 로봇과 같이 온보드 컴퓨팅이 제한된 로봇에 이상적입니다.
- 스마트 시티 애플리케이션: 효율적인 CPU 성능으로 기존 인프라에서 트래픽 모니터링을 위한 대규모 배포가 가능합니다.
PP-YOLOE+가 적합한 경우
- 고정밀 연구: 추론 속도보다 마지막 1%의 mAP 짜내는 것이 더 중요한 학술 프로젝트.
- 패들 중심 환경: 엔터프라이즈 환경은 이미 Baidu 에코시스템 인프라에 많은 투자를 하고 있습니다.
결론: 어떤 모델이 적합할까요?
대다수의 개발자와 상용 애플리케이션에 적합합니다, Ultralytics YOLOv5 가 여전히 권장되는 선택입니다. 탁월한 사용 편의성, 강력한 커뮤니티 지원, 배포 유연성 덕분에 위험은 낮고 보상은 높은 솔루션입니다. 모바일에서 클라우드 서버에 이르기까지 거의 모든 플랫폼에 최소한의 마찰로 배포할 수 있는 기능 덕분에 프로덕션 환경에서 결정적인 우위를 점할 수 있습니다.
PP-YOLOE+는 특히 앵커 없는 아키텍처가 필요한 사용자나 이미 PaddlePaddle 워크플로에 통합된 사용자에게 강력한 대안이 될 수 있습니다. 높은 정확도는 칭찬할 만하지만 에코시스템의 파편화로 인해 표준 PyTorch 워크플로에 익숙한 사용자에게는 개발 속도가 느려질 수 있습니다.
다른 모델 살펴보기
컴퓨터 비전은 빠르게 변화합니다. 이러한 기존 모델을 비교하는 것도 중요하지만, 훨씬 더 뛰어난 성능과 기능을 제공하는 Ultralytics YOLO 제품군의 최신 발전 사항을 살펴볼 것을 권장합니다.
- YOLO11: 감지, 세분화, 포즈 추정에서 탁월한 정확도와 효율성을 제공하는 최신 최신 모델입니다.
- YOLOv8: OBB 및 분류 작업을 지원하는 매우 인기 있는 통합 프레임워크입니다.
- RT-DETR: 실시간 성능에 최적화된 트랜스포머 기반 검출기입니다.
보다 폭넓게 보려면 주요 모델 비교 페이지에서 다양한 아키텍처를 특정 요구 사항에 맞게 벤치마킹하세요.