PP-YOLOE+와 YOLOv5: 높은 정확도의 탐지 및 생산 준비성 탐색
최적의 물체 탐지 모델을 선택하려면 원시 학술 지표와 실제 배포 기능 간의 절충이 필요한 경우가 많습니다. 이 기술 비교에서는 PaddlePaddle 에코시스템의 진화된 앵커 프리 디텍터인 PP-YOLOE+를 살펴봅니다. Ultralytics YOLOv5와 속도, 정확성, 사용 편의성의 균형으로 유명한 업계 표준 모델입니다. PP-YOLOE+가 평균 평균 정밀도mAP의 한계를 뛰어넘는 반면, YOLOv5 독보적인 개발자 경험과 배포의 다양성으로 인해 실시간 추론 애플리케이션에서 여전히 지배적인 위치를 차지하고 있습니다.
PP-YOLOE+: PaddlePaddle 정밀 엔지니어링
PP-YOLOE+는 패들디텍션 제품군의 일부로 바이두의 연구원들이 개발한 PP-YOLOE의 업그레이드 버전입니다. 고정밀 작업에 중점을 둔 효율적인 최첨단 산업용 물체 감지기로 설계되었습니다. 앵커가 없는 아키텍처를 활용하여 훈련 파이프라인을 간소화하고 앵커 기반 방법에서 흔히 발생하는 하이퍼파라미터 튜닝을 줄입니다.
저자들: PaddlePaddle 저자
조직: Baidu
날짜: 2022-04-02
아카이브: https://arxiv.org/abs/2203.16250
깃허브: PaddlePaddle
문서: https:PaddlePaddle
아키텍처 및 혁신
PP-YOLOE+의 아키텍처는 기능 표현과 현지화를 개선하기 위해 몇 가지 고급 메커니즘을 도입했습니다:
- 백본: 백본: 크로스 스테이지 부분(CSP) 네트워크의 그라데이션 흐름 이점과 RepVGG의 재매개변수화 기술을 결합한 백본인 CSPRepResNet을 활용합니다.
- 앵커 프리 헤드: 효율적인 작업 정렬 헤드(ET-Head)는 분류 작업과 회귀 작업을 분리하여 수렴 속도와 정확도를 개선하는 데 사용됩니다.
- 훈련 전략: 작업 정렬 학습(TAL)을 통합하여 양성 샘플을 동적으로 할당함으로써 학습 중에 최고 품질의 예측이 우선시되도록 합니다.
- 손실 함수: 클래스 불균형을 처리하고 바운딩 박스 정밀도를 개선하기 위해 가변 초점 손실(VFL) 및 분포 초점 손실(DFL)을 사용합니다.
강점과 약점
PP-YOLOE+는 최대 정확도가 중요한 시나리오에서 탁월한 성능을 발휘합니다. 앵커가 없는 설계로 앵커 박스를 클러스터링할 필요가 없으므로 다양한 개체 형태의 데이터 세트에 적용할 수 있습니다. 하지만 PaddlePaddle 프레임워크에 대한 의존도가 높기 때문에, 표준화된 PyTorch 에 표준화된 팀에게는 장애물이 될 수 있습니다. 모델을 변환하는 도구는 존재하지만, 기본 에코시스템 지원은 보다 보편적으로 채택된 프레임워크에 비해 덜 광범위합니다.
에코시스템 고려 사항
PP-YOLOE+는 인상적인 이론적 성능을 제공하지만, 이를 채택하려면 표준 PyTorch 워크플로와 크게 다를 수 있는 PaddlePaddle 특정 구문 및 배포 도구에 익숙해야 하는 경우가 많습니다.
Ultralytics YOLOv5: 비전 AI의 글로벌 표준
Glenn Jocher가 2020년에 출시했습니다, Ultralytics YOLOv5 는 모든 기술 수준의 개발자가 최첨단 물체 감지에 액세스할 수 있게 함으로써 컴퓨터 비전의 환경을 근본적으로 변화시켰습니다. PyTorch 기본적으로 구축된 YOLOv5 '훈련 효율성'과 '사용 편의성'에 중점을 두고 데이터 세트 큐레이션부터 프로덕션 배포까지 원활한 경로를 제공합니다.
저자 작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: yolov5
문서: https:yolov5
아키텍처 및 주요 기능
YOLOv5 처리량을 최대화하기 위해 깊이와 폭의 균형을 맞추는 고도로 최적화된 앵커 기반 아키텍처를 사용합니다:
- CSPDarknet 백본: 크로스 스테이지 부분 네트워크 설계는 중복된 그라데이션 정보를 최소화하여 학습 기능을 향상시키는 동시에 매개변수를 줄입니다.
- PANet Neck: PANet(경로 집계 네트워크)은 정보 흐름을 개선하여 모델이 다양한 축척에서 오브젝트를 정확하게 위치 파악할 수 있도록 도와줍니다.
- 모자이크 증강: 4개의 훈련 이미지를 하나로 결합하여 작은 물체를 detect 새로운 환경에 일반화하는 모델의 능력을 크게 향상시키는 고급 데이터 증강 기법입니다.
- 유전 알고리즘: 자동화된 하이퍼파라미터 진화를 통해 모델이 사용자 지정 데이터 세트에서 최적의 성능을 발휘하도록 스스로 조정할 수 있습니다.
강점 및 에코시스템
YOLOv5 사용 편의성으로 유명합니다. API는 직관적이어서 사용자가 단 몇 줄의 Python 코드만으로 모델을 로드하고 추론을 실행할 수 있습니다.
import torch
# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Print results
results.print()
코드 외에도 잘 관리된 에코시스템은 YOLOv5 차별화합니다. 사용자는 빈번한 업데이트, 대규모 커뮤니티 포럼, Comet 및 ClearML 같은 MLOps 도구와의 원활한 통합을 통해 혜택을 누릴 수 있습니다. 이 모델의 다목적성은 단순한 탐지를 넘어 동일한 프레임워크 내에서 인스턴스 분할 및 이미지 분류 작업을 지원합니다. 또한, YOLOv5 모델은 일반적으로 트랜스포머 기반 아키텍처에 비해 훈련 시 메모리 요구량이 낮기 때문에 일반 소비자용 GPU에서도 사용할 수 있습니다.
기술 성능 비교
두 모델을 비교할 때는 mAP 같은 표준 정확도 지표와 함께 추론 속도, 매개변수 수 등 실제 활용도에 영향을 미치는 지표를 살펴보는 것이 중요합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
결과 분석
- 정확도 대 속도: PP-YOLOE+는 특히 더 큰 변형(l 및 x)에서 더 높은 mAP 점수를 보여 주며, 앵커가 없는 헤드와 TAL 전략의 이점을 누리고 있습니다. 그러나 YOLOv5 훨씬 더 낮은 지연 시간으로 매우 경쟁력 있는 정확도를 제공하면서 우수한 성능 균형을 제공합니다( TensorRT 속도 참조). 따라서 YOLOv5 밀리초 단위가 중요한 엣지 AI 애플리케이션에 특히 적합합니다.
- 리소스 효율성: YOLOv5n(Nano)은 매개변수가 260만 개에 불과해 매우 가볍기 때문에 모바일 및 IoT 기기에 이상적입니다. PP-YOLOE+는 효율적인 백본을 가지고 있지만, 아키텍처가 복잡하기 때문에 간소화된 YOLOv5 설계에 비해 훈련 중에 메모리 사용량이 높아질 수 있습니다.
- 훈련 효율성: YOLOv5 자동 앵커와 하이퍼파라미터 진화를 활용하여 처음부터 성능을 극대화합니다. 고품질의 사전 학습된 가중치를 사용할 수 있어 신속한 전이 학습이 가능하므로 개발 시간을 크게 단축할 수 있습니다.
실제 사용 사례
이러한 모델 간의 선택은 종종 특정 배포 환경에 따라 달라집니다.
PP-YOLOE+ 애플리케이션
특히 Baidu의 인프라가 널리 퍼져 있는 아시아 시장에서는 학술 연구 및 산업 시나리오에서 PP-YOLOE+가 선호되는 경우가 많습니다.
- 자동 결함 감지: 높은 정밀도로 제조 라인의 미세한 스크래치를 식별하는 데 도움이 됩니다.
- 교통 감시: 밀집된 교통 흐름에서 유사한 차량 유형을 구분할 수 있습니다.
YOLOv5 애플리케이션
YOLOv5 다재다능한 기능 덕분에 다양한 글로벌 산업 분야에서 널리 사용되는 솔루션입니다.
- 스마트 농업: 엣지 디바이스의 빠른 속도 덕분에 실시간 작물 상태 모니터링 및 과일 수확 로봇에 사용됩니다.
- 리테일 분석: 매장 서버 하드웨어에서 효율적으로 실행되는 객체 계산 및 재고 관리 시스템을 지원합니다.
- 자율 로봇 공학: 지연 시간이 짧아 드론과 로봇이 복잡한 환경을 안전하게 탐색할 수 있습니다.
- 보안 시스템: 침입 탐지를 위한 보안 경보 시스템에 쉽게 통합됩니다.
배포 유연성
YOLOv5 ONNX, TensorRT, CoreML, TFLite 포함한 다양한 포맷으로 원활하게 내보낼 수 있습니다. export 모드로 설정합니다. 이렇게 하면 모델이 학습되면 iPhone에서 클라우드 서버에 이르기까지 거의 모든 곳에 배포할 수 있습니다.
결론
PP-YOLOE+는 COCO 같은 벤치마크에서 인상적인 정확도를 보이며 앵커 없는 탐지 분야에서 상당한 성과를 거두었습니다, Ultralytics YOLOv5 는 여전히 대부분의 개발자와 상용 애플리케이션을 위한 탁월한 선택입니다. 사용 편의성, 강력하고 잘 관리된 에코시스템, 뛰어난 성능 균형의 조합을 통해 프로젝트가 개념에서 생산 단계로 빠르고 안정적으로 이동할 수 있도록 보장합니다.
최신 컴퓨터 비전 기술을 원하는 사용자를 위해 Ultralytics 다음과 같은 기능도 제공합니다. YOLO11을 제공하며, 이는 기존 YOLOv5 기반으로 탐지, 세분화 및 포즈 추정 작업 전반에서 훨씬 더 뛰어난 효율성과 기능을 제공합니다.
자세히 알아보기
향상된 성능 기능을 제공하는 최신 대안을 살펴보려면 다음을 검토해 보세요:
- Ultralytics YOLO11: 최첨단 정확도와 속도를 제공하는 최신 최신 모델입니다.
- Ultralytics YOLOv8: 탐지, 세분화 및 분류를 위한 통합 프레임워크를 도입한 다목적 모델입니다.
- RT-DETR: 높은 정확도 요구 사항을 위한 실시간 변압기 기반 검출기입니다.
모델 페이지를 방문하여 다음 프로젝트에 사용할 수 있는 비전 AI 솔루션의 전체 범위를 확인하세요.