콘텐츠로 건너뛰기

PP-YOLOE+와 YOLO: 기술적인 비교

최적의 물체 감지 모델을 선택하는 것은 효율적인 컴퓨터 비전 애플리케이션을 개발하는 데 있어 중요한 단계입니다. 여기에는 정밀도, 추론 지연 시간, 하드웨어 제약 사이의 복잡한 절충점을 탐색하는 것이 포함됩니다. 이 기술 비교에서는 아시아 기술 대기업의 대표적인 두 가지 모델을 살펴봅니다: 바이두의 PaddlePaddle 팀이 개발한 PP-YOLOE+와 알리바바 그룹이 설계한 다모욜로(YOLO)가 바로 그것입니다. 두 모델 모두 실시간 감지기의 진화에 있어 중요한 진전을 이루었으며, 고유한 아키텍처 혁신과 성능 프로필을 제공합니다.

이러한 모델을 분석할 때는 비전 AI의 더 넓은 환경을 고려하는 것이 좋습니다. 다음과 같은 솔루션 Ultralytics YOLO11 와 같은 솔루션은 사용성과 프레임워크에 구애받지 않는 강력한 에코시스템에 중점을 두고 최첨단 성능을 제공하는 강력한 대안을 제공합니다.

성능 지표 비교

다음 표는 평균 평균 정밀도(mAP)를 포함한 주요 성능 메트릭, T4 GPU에서 다음을 사용하는 추론 속도를 직접 비교한 것입니다. TensorRT, 매개변수 수, 계산 복잡성(FLOPs)을 직접 비교한 것입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

PP-YOLOE+: 패들 에코시스템의 정제된 정확성

PP-YOLOE+는 Baidu의 대표적인 단일 단계 앵커 프리 디텍터인 PP-YOLOE의 발전된 버전입니다. 패들디텍션 제품군의 일부로 2022년에 출시된 이 제품은 고정밀 탐지를 강조하며 PaddlePaddle 딥러닝 프레임워크에 매우 최적화되어 있습니다.

기술 세부 사항:

아키텍처 및 핵심 기술

PP-YOLOE+는 여러 고급 구성 요소를 통합하여 탐지 파이프라인을 간소화하는 동시에 정확도를 높입니다.

  • 앵커 프리 메커니즘: 이 모델은 사전 정의된 앵커 박스를 제거함으로써 하이퍼파라미터 튜닝의 복잡성을 줄이고 많은 최신 아키텍처에서 볼 수 있는 추세인 훈련 수렴을 가속화합니다.
  • CSPRepResNet 백본: 이 모델은 CSP(Cross Stage Partial) 네트워크의 기울기 흐름 이점과 재파라미터화된 ResNet 블록의 추론 효율성을 결합한 CSPRepResNet 백본을 사용합니다.
  • 작업 정렬 학습(TAL): 분류 신뢰도와 로컬라이제이션 품질 간의 불일치를 해결하기 위해 PP-YOLOE+는 TAL을 활용합니다. 이 동적 라벨 할당 전략은 학습 중에 최고 품질의 예측이 우선순위를 갖도록 보장합니다.
  • 효율적인 작업 정렬 헤드(ET-Head): 분리된 감지 헤드는 분류와 회귀 기능을 분리하여 각 작업을 간섭 없이 독립적으로 최적화할 수 있습니다.

에코시스템 종속성

PP-YOLOE+는 PaddlePaddle 기본 제공됩니다. 해당 환경에서는 매우 효과적이지만 PyTorch 익숙한 사용자는 전환 및 도구( paddle2onnx 내보내기용)는 네이티브 PyTorch 모델에 비해 추가 학습이 필요합니다.

강점과 약점

강점: PP-YOLOE+는 원시 정확도를 우선시하는 시나리오에서 빛을 발합니다. '중형', '대형', '초대형' 변형은 COCO 데이터 세트에서 강력한 mAP 점수를 보여 주므로 산업 품질 관리와 같은 세부 검사 작업에 적합합니다.

약점: 가장 큰 한계는 프레임워크 결합입니다. 도구, 배포 경로 및 커뮤니티 리소스는 주로 PaddlePaddle 중심으로 제공되며, 이는 PyTorch 또는 TensorFlow 에코시스템에서 구축된 팀에게는 마찰점이 될 수 있습니다. 또한 더 작은 모델의 매개변수 수(예 s)은 매우 효율적이지만 큰 모델은 계산량이 많을 수 있습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

YOLO: 속도 지향적 혁신, 알리바바의 사례

2022년 말 알리바바 그룹이 도입한 YOLO 짧은 지연 시간과 고성능 사이의 최적점을 목표로 합니다. 광범위한 신경망 아키텍처 검색(NAS) 을 활용하여 효율적인 구조를 자동으로 발견합니다.

기술 세부 사항:

아키텍처 및 주요 기능

YOLO 추론 속도를 위해 적극적으로 최적화한 것이 특징입니다.

  • MAE-NAS 백본: 저자는 피처 추출기를 직접 제작하는 대신 메서드 인식 효율적인 NAS를 사용하여 다양한 깊이와 너비의 백본을 생성하여 특정 계산 예산에 맞게 최적화했습니다.
  • 효율적인 RepGFPN: 일반화된 피처 피라미드 네트워크(GFPN)인 넥 아키텍처는 재파라미터화를 활용하여 피처 융합 효율성을 극대화하는 동시에 하드웨어의 지연 시간을 최소화합니다.
  • 제로헤드 기술: 눈에 띄는 기능은 '제로헤드'로, 최종 예측 레이어를 단순화하여 FLOP을 크게 줄이고 무거운 작업은 백본과 넥에 맡기는 기술입니다.
  • AlignedOTA: 이 라벨 할당 전략은 분류 및 회귀 목표를 정렬하여 훈련 중에 선택된 "양성" 샘플이 최종 손실에 가장 효과적으로 기여하도록 합니다.

강점과 약점

강점: YOLO 매우 빠릅니다. '소형' 및 '소형' 모델은 속도에 비해 인상적인 mAP 제공하며, 실시간 추론 시나리오에서 많은 경쟁사보다 뛰어난 성능을 발휘합니다. 따라서 자율 드론이나 교통 모니터링과 같이 밀리초 단위의 지연 시간이 중요한 엣지 AI 애플리케이션에 이상적입니다.

약점: 연구 중심 릴리스인 YOLO 보다 성숙한 프로젝트에서 볼 수 있는 세련된 배포 도구와 광범위한 설명서가 부족할 수 있습니다. 또한 특정 NAS 구조에 의존하기 때문에 아키텍처를 수정하려는 사용자에게는 사용자 지정 및 미세 조정이 더 복잡해질 수 있습니다.

DAMO-YOLO에 대해 자세히 알아보세요.

Ultralytics 이점: YOLO11 탁월한 선택인 이유

PP-YOLOE+와 YOLO 각자의 틈새 시장에서 경쟁력 있는 기능을 제공합니다, Ultralytics YOLO11 은 최신 컴퓨터 비전을 위한 가장 균형 잡히고 다재다능하며 개발자 친화적인 솔루션으로 돋보입니다.

탁월한 사용 편의성 및 에코시스템

Ultralytics 사용자 경험을 우선시하여 AI를 대중화했습니다. 복잡한 설정이 필요할 수 있는 리서치 리포지토리와 달리, YOLO11 간단한 pip 설치와 직관적인 Python API를 통해 액세스할 수 있습니다. Ultralytics 에코시스템은 활발하게 유지 관리되어 최신 하드웨어(예: NVIDIA Jetson, Apple M 시리즈 칩) 및 소프트웨어 라이브러리와의 호환성을 보장합니다.

최적의 성능 균형

YOLO11 속도 저하 없이 최첨단 정확도를 제공하도록 설계되었습니다. 실시간 애플리케이션에 필요한 추론 효율을 유지하면서 PP-YOLOE+와 같은 모델의 정확도와 일치하거나 이를 능가하는 경우가 많습니다. 이러한 균형은 정확도와 처리량 모두 타협할 수 없는 실제 배포에 매우 중요합니다.

효율성 및 다용도성

Ultralytics 모델의 주요 장점 중 하나는 다용도성입니다. YOLO PP-YOLOE+는 주로 객체 감지에 초점을 맞추고 있지만, 단일 YOLO11 모델 아키텍처는 이를 지원합니다:

또한, YOLO11 많은 트랜스포머 기반 대안이나 이전 YOLO 버전에 비해 훈련과 추론 모두에서 메모리 요구량을 낮추도록 최적화되어 있습니다. 이러한 효율성 덕분에 개발자는 표준 GPU에서 더 큰 배치 크기를 훈련하고 보다 제약이 많은 엣지 디바이스에 배포할 수 있습니다.

교육 효율성

즉시 사용 가능한 사전 학습된 가중치와 최적화된 학습 파이프라인을 통해 사용자는 최소한의 학습 시간으로 사용자 지정 데이터 세트에서 높은 성능을 달성할 수 있습니다.

예시: YOLO11 실행

고급 비전 기능을 배포하는 것은 Ultralytics 사용하면 간단합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Perform object detection on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

YOLO11에 대해 자세히 알아보세요

결론

PP-YOLOE+와 YOLO 모두 컴퓨터 비전 분야에 큰 공헌을 하고 있습니다. PP-YOLOE+는 컴퓨터 비전 분야에 깊이 매료된 사용자를 위한 강력한 후보입니다. PaddlePaddle 생태계에 깊숙이 자리 잡은 사용자에게 강력한 후보입니다. YOLO 엣지 디바이스에서 속도를 극대화하기 위한 혁신적인 아키텍처를 제공합니다.

하지만 대다수의 개발자와 기업에게는 그렇지 않습니다, Ultralytics YOLO11 이 여전히 권장되는 선택입니다. 이 솔루션의 조합은 PyTorch 기본 지원, 멀티태스크 다용도성, 우수한 문서화, 활발한 커뮤니티 지원의 조합으로 AI 솔루션의 시장 출시 기간을 크게 단축할 수 있습니다. 보안 경보 시스템을 구축하든 제조 품질 관리 파이프라인을 구축하든 YOLO11 성공에 필요한 안정성과 성능을 제공합니다.


댓글