콘텐츠로 건너뛰기

PP-YOLOE+와 YOLOv5: 높은 정확도의 탐지 및 생산 준비성 탐색

최적의 물체 탐지 모델을 선택하려면 원시 학술 지표와 실제 배포 기능 간의 절충이 필요한 경우가 많습니다. 이 기술 비교에서는 PaddlePaddle 에코시스템의 진화된 앵커 프리 디텍터인 PP-YOLOE+를 살펴봅니다. Ultralytics YOLOv5와 속도, 정확성, 사용 편의성의 균형으로 유명한 업계 표준 모델입니다. PP-YOLOE+가 평균 평균 정밀도mAP의 한계를 뛰어넘는 반면, YOLOv5 독보적인 개발자 경험과 배포의 다양성으로 인해 실시간 추론 애플리케이션에서 여전히 지배적인 위치를 차지하고 있습니다.

PP-YOLOE+: PaddlePaddle 정밀 엔지니어링

PP-YOLOE+는 패들디텍션 제품군의 일부로 바이두의 연구원들이 개발한 PP-YOLOE의 업그레이드 버전입니다. 고정밀 작업에 중점을 둔 효율적인 최첨단 산업용 물체 감지기로 설계되었습니다. 앵커가 없는 아키텍처를 활용하여 훈련 파이프라인을 간소화하고 앵커 기반 방법에서 흔히 발생하는 하이퍼파라미터 튜닝을 줄입니다.

저자들: PaddlePaddle 저자
조직: Baidu
날짜: 2022-04-02
아카이브: https://arxiv.org/abs/2203.16250
깃허브: PaddlePaddle
문서: https:PaddlePaddle

아키텍처 및 혁신

PP-YOLOE+의 아키텍처는 기능 표현과 현지화를 개선하기 위해 몇 가지 고급 메커니즘을 도입했습니다:

  • 백본: 백본: 크로스 스테이지 부분(CSP) 네트워크의 그라데이션 흐름 이점과 RepVGG의 재매개변수화 기술을 결합한 백본인 CSPRepResNet을 활용합니다.
  • 앵커 프리 헤드: 효율적인 작업 정렬 헤드(ET-Head)는 분류 작업과 회귀 작업을 분리하여 수렴 속도와 정확도를 개선하는 데 사용됩니다.
  • 훈련 전략: 작업 정렬 학습(TAL)을 통합하여 양성 샘플을 동적으로 할당함으로써 학습 중에 최고 품질의 예측이 우선시되도록 합니다.
  • 손실 함수: 클래스 불균형을 처리하고 바운딩 박스 정밀도를 개선하기 위해 가변 초점 손실(VFL) 및 분포 초점 손실(DFL)을 사용합니다.

강점과 약점

PP-YOLOE+는 최대 정확도가 중요한 시나리오에서 탁월한 성능을 발휘합니다. 앵커가 없는 설계로 앵커 박스를 클러스터링할 필요가 없으므로 다양한 개체 형태의 데이터 세트에 적용할 수 있습니다. 하지만 PaddlePaddle 프레임워크에 대한 의존도가 높기 때문에, 표준화된 PyTorch 에 표준화된 팀에게는 장애물이 될 수 있습니다. 모델을 변환하는 도구는 존재하지만, 기본 에코시스템 지원은 보다 보편적으로 채택된 프레임워크에 비해 덜 광범위합니다.

에코시스템 고려 사항

PP-YOLOE+는 인상적인 이론적 성능을 제공하지만, 이를 채택하려면 표준 PyTorch 워크플로와 크게 다를 수 있는 PaddlePaddle 특정 구문 및 배포 도구에 익숙해야 하는 경우가 많습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

Ultralytics YOLOv5: 비전 AI의 글로벌 표준

Glenn Jocher가 2020년에 출시했습니다, Ultralytics YOLOv5 는 모든 기술 수준의 개발자가 최첨단 물체 감지에 액세스할 수 있게 함으로써 컴퓨터 비전의 환경을 근본적으로 변화시켰습니다. PyTorch 기본적으로 구축된 YOLOv5 '훈련 효율성'과 '사용 편의성'에 중점을 두고 데이터 세트 큐레이션부터 프로덕션 배포까지 원활한 경로를 제공합니다.

저자 작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: yolov5
문서: https:yolov5

아키텍처 및 주요 기능

YOLOv5 처리량을 최대화하기 위해 깊이와 폭의 균형을 맞추는 고도로 최적화된 앵커 기반 아키텍처를 사용합니다:

  • CSPDarknet 백본: 크로스 스테이지 부분 네트워크 설계는 중복된 그라데이션 정보를 최소화하여 학습 기능을 향상시키는 동시에 매개변수를 줄입니다.
  • PANet Neck: PANet(경로 집계 네트워크)은 정보 흐름을 개선하여 모델이 다양한 축척에서 오브젝트를 정확하게 위치 파악할 수 있도록 도와줍니다.
  • 모자이크 증강: 4개의 훈련 이미지를 하나로 결합하여 작은 물체를 detect 새로운 환경에 일반화하는 모델의 능력을 크게 향상시키는 고급 데이터 증강 기법입니다.
  • 유전 알고리즘: 자동화된 하이퍼파라미터 진화를 통해 모델이 사용자 지정 데이터 세트에서 최적의 성능을 발휘하도록 스스로 조정할 수 있습니다.

강점 및 에코시스템

YOLOv5 사용 편의성으로 유명합니다. API는 직관적이어서 사용자가 단 몇 줄의 Python 코드만으로 모델을 로드하고 추론을 실행할 수 있습니다.

import torch

# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Print results
results.print()

코드 외에도 잘 관리된 에코시스템은 YOLOv5 차별화합니다. 사용자는 빈번한 업데이트, 대규모 커뮤니티 포럼, Comet 및 ClearML 같은 MLOps 도구와의 원활한 통합을 통해 혜택을 누릴 수 있습니다. 이 모델의 다목적성은 단순한 탐지를 넘어 동일한 프레임워크 내에서 인스턴스 분할이미지 분류 작업을 지원합니다. 또한, YOLOv5 모델은 일반적으로 트랜스포머 기반 아키텍처에 비해 훈련 시 메모리 요구량이 낮기 때문에 일반 소비자용 GPU에서도 사용할 수 있습니다.

YOLOv5에 대해 자세히 알아보세요

기술 성능 비교

두 모델을 비교할 때는 mAP 같은 표준 정확도 지표와 함께 추론 속도, 매개변수 수 등 실제 활용도에 영향을 미치는 지표를 살펴보는 것이 중요합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

결과 분석

  • 정확도 대 속도: PP-YOLOE+는 특히 더 큰 변형(l 및 x)에서 더 높은 mAP 점수를 보여 주며, 앵커가 없는 헤드와 TAL 전략의 이점을 누리고 있습니다. 그러나 YOLOv5 훨씬 더 낮은 지연 시간으로 매우 경쟁력 있는 정확도를 제공하면서 우수한 성능 균형을 제공합니다( TensorRT 속도 참조). 따라서 YOLOv5 밀리초 단위가 중요한 엣지 AI 애플리케이션에 특히 적합합니다.
  • 리소스 효율성: YOLOv5n(Nano)은 매개변수가 260만 개에 불과해 매우 가볍기 때문에 모바일 및 IoT 기기에 이상적입니다. PP-YOLOE+는 효율적인 백본을 가지고 있지만, 아키텍처가 복잡하기 때문에 간소화된 YOLOv5 설계에 비해 훈련 중에 메모리 사용량이 높아질 수 있습니다.
  • 훈련 효율성: YOLOv5 자동 앵커와 하이퍼파라미터 진화를 활용하여 처음부터 성능을 극대화합니다. 고품질의 사전 학습된 가중치를 사용할 수 있어 신속한 전이 학습이 가능하므로 개발 시간을 크게 단축할 수 있습니다.

실제 사용 사례

이러한 모델 간의 선택은 종종 특정 배포 환경에 따라 달라집니다.

PP-YOLOE+ 애플리케이션

특히 Baidu의 인프라가 널리 퍼져 있는 아시아 시장에서는 학술 연구 및 산업 시나리오에서 PP-YOLOE+가 선호되는 경우가 많습니다.

  • 자동 결함 감지: 높은 정밀도로 제조 라인의 미세한 스크래치를 식별하는 데 도움이 됩니다.
  • 교통 감시: 밀집된 교통 흐름에서 유사한 차량 유형을 구분할 수 있습니다.

YOLOv5 애플리케이션

YOLOv5 다재다능한 기능 덕분에 다양한 글로벌 산업 분야에서 널리 사용되는 솔루션입니다.

  • 스마트 농업: 엣지 디바이스의 빠른 속도 덕분에 실시간 작물 상태 모니터링 및 과일 수확 로봇에 사용됩니다.
  • 리테일 분석: 매장 서버 하드웨어에서 효율적으로 실행되는 객체 계산 및 재고 관리 시스템을 지원합니다.
  • 자율 로봇 공학: 지연 시간이 짧아 드론과 로봇이 복잡한 환경을 안전하게 탐색할 수 있습니다.
  • 보안 시스템: 침입 탐지를 위한 보안 경보 시스템에 쉽게 통합됩니다.

배포 유연성

YOLOv5 ONNX, TensorRT, CoreML, TFLite 포함한 다양한 포맷으로 원활하게 내보낼 수 있습니다. export 모드로 설정합니다. 이렇게 하면 모델이 학습되면 iPhone에서 클라우드 서버에 이르기까지 거의 모든 곳에 배포할 수 있습니다.

결론

PP-YOLOE+는 COCO 같은 벤치마크에서 인상적인 정확도를 보이며 앵커 없는 탐지 분야에서 상당한 성과를 거두었습니다, Ultralytics YOLOv5 는 여전히 대부분의 개발자와 상용 애플리케이션을 위한 탁월한 선택입니다. 사용 편의성, 강력하고 잘 관리된 에코시스템, 뛰어난 성능 균형의 조합을 통해 프로젝트가 개념에서 생산 단계로 빠르고 안정적으로 이동할 수 있도록 보장합니다.

최신 컴퓨터 비전 기술을 원하는 사용자를 위해 Ultralytics 다음과 같은 기능도 제공합니다. YOLO11을 제공하며, 이는 기존 YOLOv5 기반으로 탐지, 세분화 및 포즈 추정 작업 전반에서 훨씬 더 뛰어난 효율성과 기능을 제공합니다.

자세히 알아보기

향상된 성능 기능을 제공하는 최신 대안을 살펴보려면 다음을 검토해 보세요:

  • Ultralytics YOLO11: 최첨단 정확도와 속도를 제공하는 최신 최신 모델입니다.
  • Ultralytics YOLOv8: 탐지, 세분화 및 분류를 위한 통합 프레임워크를 도입한 다목적 모델입니다.
  • RT-DETR: 높은 정확도 요구 사항을 위한 실시간 변압기 기반 검출기입니다.

모델 페이지를 방문하여 다음 프로젝트에 사용할 수 있는 비전 AI 솔루션의 전체 범위를 확인하세요.


댓글