콘텐츠로 건너뛰기

PP-YOLOE+와 YOLOv5: 높은 정확도의 탐지 및 생산 준비성 탐색

최적의 물체 탐지 모델을 선택하려면 원시 학술 지표와 실제 배포 기능 간의 절충이 필요한 경우가 많습니다. 이 기술 비교에서는 PaddlePaddle 에코시스템의 진화된 앵커 프리 디텍터인 PP-YOLOE+를 살펴봅니다. Ultralytics YOLOv5와 속도, 정확성, 사용 편의성의 균형으로 유명한 업계 표준 모델입니다. PP-YOLOE+가 평균 평균 정밀도mAP의 한계를 뛰어넘는 반면, YOLOv5 독보적인 개발자 경험과 배포의 다양성으로 인해 실시간 추론 애플리케이션에서 여전히 지배적인 위치를 차지하고 있습니다.

PP-YOLOE+: PaddlePaddle 정밀 엔지니어링

PP-YOLOE+는 패들디텍션 제품군의 일부로 바이두의 연구원들이 개발한 PP-YOLOE의 업그레이드 버전입니다. 고정밀 작업에 중점을 둔 효율적인 최첨단 산업용 물체 감지기로 설계되었습니다. 앵커가 없는 아키텍처를 활용하여 훈련 파이프라인을 간소화하고 앵커 기반 방법에서 흔히 발생하는 하이퍼파라미터 튜닝을 줄입니다.

저자들: PaddlePaddle 저자
조직: Baidu
날짜: 2022-04-02
아카이브: https://arxiv.org/abs/2203.16250
깃허브: PaddlePaddle
문서: https:PaddlePaddle

아키텍처 및 혁신

PP-YOLOE+의 아키텍처는 기능 표현과 현지화를 개선하기 위해 몇 가지 고급 메커니즘을 도입했습니다:

  • 백본: 백본: 크로스 스테이지 부분(CSP) 네트워크의 그라데이션 흐름 이점과 RepVGG의 재매개변수화 기술을 결합한 백본인 CSPRepResNet을 활용합니다.
  • Anchor-Free Head: ET-Head(Efficient Task-aligned Head)를 사용하여 분류 및 회귀 작업을 분리함으로써 수렴 속도와 정확도를 향상시킵니다.
  • 훈련 전략: 작업 정렬 학습(TAL)을 통합하여 양성 샘플을 동적으로 할당함으로써 학습 중에 최고 품질의 예측이 우선시되도록 합니다.
  • 손실 함수: 클래스 불균형을 처리하고 바운딩 박스 정밀도를 개선하기 위해 가변 초점 손실(VFL) 및 분포 초점 손실(DFL)을 사용합니다.

강점과 약점

PP-YOLOE+는 최대 정확도가 중요한 시나리오에서 탁월한 성능을 발휘합니다. 앵커가 없는 설계로 앵커 박스를 클러스터링할 필요가 없으므로 다양한 개체 형태의 데이터 세트에 적용할 수 있습니다. 하지만 PaddlePaddle 프레임워크에 대한 의존도가 높기 때문에, 표준화된 PyTorch 에 표준화된 팀에게는 장애물이 될 수 있습니다. 모델을 변환하는 도구는 존재하지만, 기본 에코시스템 지원은 보다 보편적으로 채택된 프레임워크에 비해 덜 광범위합니다.

에코시스템 고려 사항

PP-YOLOE+는 인상적인 이론적 성능을 제공하지만, 이를 채택하려면 표준 PyTorch 워크플로와 크게 다를 수 있는 PaddlePaddle 특정 구문 및 배포 도구에 익숙해야 하는 경우가 많습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

Ultralytics YOLOv5: 비전 AI의 글로벌 표준

Glenn Jocher가 2020년에 출시했습니다, Ultralytics YOLOv5 는 모든 기술 수준의 개발자가 최첨단 물체 감지에 액세스할 수 있게 함으로써 컴퓨터 비전의 환경을 근본적으로 변화시켰습니다. PyTorch 기본적으로 구축된 YOLOv5 '훈련 효율성'과 '사용 편의성'에 중점을 두고 데이터 세트 큐레이션부터 프로덕션 배포까지 원활한 경로를 제공합니다.

저자 작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: yolov5
문서: https:yolov5

아키텍처 및 주요 기능

YOLOv5 처리량을 최대화하기 위해 깊이와 폭의 균형을 맞추는 고도로 최적화된 앵커 기반 아키텍처를 사용합니다:

  • CSPDarknet 백본: 크로스 스테이지 부분 네트워크 설계는 중복된 그라데이션 정보를 최소화하여 학습 기능을 향상시키는 동시에 매개변수를 줄입니다.
  • PANet Neck: PANet(경로 집계 네트워크)은 정보 흐름을 개선하여 모델이 다양한 축척에서 오브젝트를 정확하게 위치 파악할 수 있도록 도와줍니다.
  • 모자이크 증강: 4개의 훈련 이미지를 하나로 결합하여 작은 물체를 detect 새로운 환경에 일반화하는 모델의 능력을 크게 향상시키는 고급 데이터 증강 기법입니다.
  • 유전 알고리즘: 자동화된 하이퍼파라미터 진화를 통해 모델이 사용자 지정 데이터 세트에서 최적의 성능을 발휘하도록 스스로 조정할 수 있습니다.

강점 및 에코시스템

YOLOv5 사용 편의성으로 유명합니다. API는 직관적이어서 사용자가 단 몇 줄의 Python 코드만으로 모델을 로드하고 추론을 실행할 수 있습니다.

import torch

# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Print results
results.print()

코드 외에도 잘 관리된 에코시스템은 YOLOv5 차별화합니다. 사용자는 빈번한 업데이트, 대규모 커뮤니티 포럼, Comet 및 ClearML 같은 MLOps 도구와의 원활한 통합을 통해 혜택을 누릴 수 있습니다. 이 모델의 다목적성은 단순한 탐지를 넘어 동일한 프레임워크 내에서 인스턴스 분할이미지 분류 작업을 지원합니다. 또한, YOLOv5 모델은 일반적으로 트랜스포머 기반 아키텍처에 비해 훈련 시 메모리 요구량이 낮기 때문에 일반 소비자용 GPU에서도 사용할 수 있습니다.

YOLOv5에 대해 자세히 알아보세요

기술 성능 비교

두 모델을 비교할 때는 mAP 같은 표준 정확도 지표와 함께 추론 속도, 매개변수 수 등 실제 활용도에 영향을 미치는 지표를 살펴보는 것이 중요합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

결과 분석

  • 정확도 대 속도: PP-YOLOE+는 특히 더 큰 변형(l 및 x)에서 더 높은 mAP 점수를 보여주며 앵커 프리 헤드와 TAL 전략의 이점을 누립니다. 그러나 YOLOv5는 훨씬 낮은 대기 시간으로 매우 경쟁력 있는 정확도를 제공하여 우수한 성능 균형을 제공합니다(TensorRT 속도 참조). 이를 통해 YOLOv5는 모든 밀리초가 중요한 에지 AI 애플리케이션에 특히 적합합니다.
  • 리소스 효율성: YOLOv5n(Nano)은 매개변수가 260만 개에 불과해 매우 가볍기 때문에 모바일 및 IoT 기기에 이상적입니다. PP-YOLOE+는 효율적인 백본을 가지고 있지만, 아키텍처가 복잡하기 때문에 간소화된 YOLOv5 설계에 비해 훈련 중에 메모리 사용량이 높아질 수 있습니다.
  • 훈련 효율성: YOLOv5 자동 앵커와 하이퍼파라미터 진화를 활용하여 처음부터 성능을 극대화합니다. 고품질의 사전 학습된 가중치를 사용할 수 있어 신속한 전이 학습이 가능하므로 개발 시간을 크게 단축할 수 있습니다.

실제 사용 사례

이러한 모델 간의 선택은 종종 특정 배포 환경에 따라 달라집니다.

PP-YOLOE+ 애플리케이션

특히 Baidu의 인프라가 널리 퍼져 있는 아시아 시장에서는 학술 연구 및 산업 시나리오에서 PP-YOLOE+가 선호되는 경우가 많습니다.

  • 자동 결함 감지: 높은 정밀도로 제조 라인의 미세한 스크래치를 식별하는 데 도움이 됩니다.
  • 교통 감시: 밀집된 교통 흐름에서 유사한 차량 유형을 구분할 수 있습니다.

YOLOv5 애플리케이션

YOLOv5 다재다능한 기능 덕분에 다양한 글로벌 산업 분야에서 널리 사용되는 솔루션입니다.

  • 스마트 농업: 엣지 디바이스의 빠른 속도 덕분에 실시간 작물 상태 모니터링 및 과일 수확 로봇에 사용됩니다.
  • 리테일 분석: 매장 서버 하드웨어에서 효율적으로 실행되는 객체 계산 및 재고 관리 시스템을 지원합니다.
  • 자율 로봇 공학: 지연 시간이 짧아 드론과 로봇이 복잡한 환경을 안전하게 탐색할 수 있습니다.
  • 보안 시스템: 침입 탐지를 위한 보안 경보 시스템에 쉽게 통합됩니다.

배포 유연성

YOLOv5 ONNX, TensorRT, CoreML, TFLite 포함한 다양한 포맷으로 원활하게 내보낼 수 있습니다. export 모드로 설정합니다. 이렇게 하면 모델이 학습되면 iPhone에서 클라우드 서버에 이르기까지 거의 모든 곳에 배포할 수 있습니다.

결론

PP-YOLOE+는 COCO 같은 벤치마크에서 인상적인 정확도를 보이며 앵커 없는 탐지 분야에서 상당한 성과를 거두었습니다, Ultralytics YOLOv5 는 여전히 대부분의 개발자와 상용 애플리케이션을 위한 탁월한 선택입니다. 사용 편의성, 강력하고 잘 관리된 에코시스템, 뛰어난 성능 균형의 조합을 통해 프로젝트가 개념에서 생산 단계로 빠르고 안정적으로 이동할 수 있도록 보장합니다.

최신 컴퓨터 비전 기술을 원하는 사용자를 위해 Ultralytics 다음과 같은 기능도 제공합니다. YOLO11을 제공하며, 이는 기존 YOLOv5 기반으로 탐지, 세분화 및 포즈 추정 작업 전반에서 훨씬 더 뛰어난 효율성과 기능을 제공합니다.

자세히 알아보기

향상된 성능 기능을 제공하는 최신 대안을 살펴보려면 다음을 검토해 보세요:

  • Ultralytics YOLO11: 최첨단 정확도와 속도를 제공하는 최신 모델입니다.
  • Ultralytics YOLOv8: detection, segmentation 및 분류를 위한 통합 프레임워크를 도입한 다재다능한 모델입니다.
  • RT-DETR: 높은 정확도를 요구하는 실시간 트랜스포머 기반 detector입니다.

모델 페이지를 방문하여 다음 프로젝트에 사용할 수 있는 비전 AI 솔루션의 전체 범위를 확인하세요.


댓글