PP-YOLOE+ 대 YOLOv10: 최신 객체 탐지기 비교

실시간 객체 탐지 분야는 높은 정확도와 낮은 지연 시간을 동시에 달성하는 모델에 대한 요구로 인해 급속히 발전해 왔습니다. 이 분야에 기여한 두 가지 중요한 성과는 바이두가 PaddleDetection 제품군의 일환으로 개발한 PP-YOLOE+와YOLOv10가 있다. 후자는 NMS 학습이 가능하도록 하는 방식을 도입한 학술 연구 결과물이다.

이 가이드는 해당 아키텍처들의 성능 지표, 훈련 방법론, 다양한 컴퓨터 비전 애플리케이션에 대한 적합성을 검토하며 상세한 기술적 비교를 제공합니다. 두 모델 모두 인상적인 기능을 제공하지만, Ultralytics YOLO26과 같은 최신 모델이 배포를 위한 보다 통합적이고 효율적인 경로를 제공하는 방식도 강조합니다.

모델 개요 및 기술 사양

각 모델의 유래와 설계 철학을 이해하는 것은 특정 엔지니어링 제약 조건에 맞는 적절한 도구를 선택하는 데 도움이 됩니다.

PP-YOLOE+

PP-YOLOE+는 PP-YOLOE의 업그레이드 버전으로, 앵커 프리 메커니즘과 훈련 효율성 개선에 중점을 둡니다. PaddlePaddle 깊이 통합되어 있습니다.

저자:PaddlePaddle
조직조직: Baidu
날짜: 2022년 4월
참고문헌:arXiv:2203.16250
핵심 아키텍처: CSPRepResNet 백본을 사용하며, 작업 정렬 학습(TAL) 라벨 할당 전략을 적용합니다. 표준 앵커 프리 헤드 설계를 기반으로 합니다.

PP-YOLOE+에 대해 자세히 알아보세요.

10

YOLOv10YOLO 에서 중요한 전환점을 마련했는데, 이는 추론 과정에서 비최대 억제(NMS) 의 필요성을 제거하는 종단간 설계를 도입했기 때문이다.

저자: 왕아오, 천후이 외
조직:조직: 칭화 대학교
날짜: 2024년 5월
참고문헌:arXiv:2405.14458
핵심 아키텍처: NMS 없는 학습을 위한 일관된 이중 할당과 효율성-정확도 중심의 통합적 모델 설계를 특징으로 한다.

10에 대해 자세히 알아보기

성능 벤치마크

다음 표는 COCO 모델들을 비교합니다. 주요 지표로는 평균 정밀도(mAP)와 다양한 하드웨어 구성에서의 추론 속도가 포함됩니다. 특히 매개변수 수 측면에서 YOLOv10 상당한 효율성 향상에 주목하십시오.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

성능 분석

YOLOv10 우수한 효율성을 YOLOv10 , 훨씬 적은 매개변수로도 유사하거나 더 나은 정확도를 달성하는 경우가 많습니다. 예를 들어, YOLOv10x는 mAP 거의 동일한 mAP 달성하지만 약 42% 적은 매개변수를 사용하므로 메모리 제약이 있는 에지 배포에 훨씬 더 적합합니다.

아키텍처 심층 분석

PP-YOLOE+ 디자인

PP-YOLOE+는 PP-YOLOv2의 강력한 기반 위에 구축되었습니다. 이 모델은 잔차 연결과 단계 간 부분 네트워크를 결합하여 기울기 흐름을 개선하는 확장 가능한 백본인 CSPRepResNet을 활용합니다. 헤드는 앵커 프리(anchor-free) 방식으로, YOLOv4와 같은 앵커 기반 선행 모델들에 비해 하이퍼파라미터 탐색 공간을 단순화합니다.

그러나 PP-YOLOE+는 복잡한 후처리 단계를 필요로 합니다. 정확도는 높지만, NMS 대한 의존성은 경계 상자가 많이 겹치는 혼잡한 장면에서 지연 병목 현상을 유발할 NMS .

YOLOv10 : 종단간 처리

YOLOv10 NMS 제거함으로써 패러다임 전환을 YOLOv10 . 이는 일관된 이중 할당을 통해 달성됩니다:

일대다 할당: 훈련 중 풍부한 지도 신호를 제공하기 위해 사용됩니다.
일대일 할당: 추론을 위해 사용되며, 개체별로 고유한 예측을 보장합니다.

이러한 정렬 방식은 박스 정렬 및 필터링에 따른 계산 오버헤드 없이 모델을 배포할 수 있게 하여 실시간 애플리케이션에 있어 주요 이점을 제공합니다.

에코시스템 및 사용 편의성

모델을 둘러싼 생태계는 종종 아키텍처 자체만큼 중요합니다. 바로 여기서 PaddlePaddle 기반 모델과 Ultralytics 지원 모델 간의 차이가 가장 두드러지게 나타납니다.

Ultralytics 이점

Ultralytics Python 내에서 YOLOv10 최신 버전인 YOLOv26 모두 지원되어 개발자에게 원활한 경험을 제공합니다.

통합 API: 단일 문자열 인수를 변경하여 모델 간 전환(예: YOLOv8 YOLOv10 YOLOv8 )이 가능합니다.
플랫폼 통합: 사용자는 Ultralytics 활용하여 데이터셋을 관리하고, 훈련 실행을 시각화하며, 몇 번의 클릭만으로 웹 및 에지 엔드포인트에 모델을 배포할 수 있습니다.
광범위한 내보내기 지원: PP-YOLOE+는 Paddle 추론에 최적화되어 있지만, Ultralytics 기본적으로 ONNX, TensorRT, CoreML, 그리고 OpenVINO를 지원하여 더 넓은 범위의 배포 하드웨어를 커버합니다.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
path = model.export(format="onnx")

PP-YOLOE+ 워크플로

PP-YOLOE+는 일반적으로 PaddlePaddle PaddleDetection 저장소 복제를 요구합니다. 이 생태계는 강력하지만 표준 PyTorch 익숙한 사용자에게는 접근성이 떨어질 수 있습니다. 내보내기 과정은 종종 Paddle 추론 엔진을 우선시하여 일반적인 배포를 위해 추가 변환 단계가 필요할 수 있습니다.

미래: YOLO26

YOLOv10 NMS 개념을 YOLOv10 반면, 최근 출시된 YOLO26은 이 혁신들을 정교화하고 확장합니다.

YOLO26은 기본적으로 엔드투엔드 NMS( NMS)로, 후처리 지연 없이 가능한 가장 빠른 추론 속도를 보장합니다. SGD (Muon, 대규모 언어 모델 훈련에서 영감을 얻음)의 하이브리드인 MuSGD 최적화기를 특징으로 하여 안정적인 수렴을 보장합니다. 또한 분포 초점 손실(DFL)을 제거함으로써, YOLO26은 저전력 에지 디바이스에서 훨씬 쉽게 내보내고 실행할 수 있습니다.

속도와 정확도에서 최고의 성능을 추구하는 개발자, 특히 ProgLoss 및 STAL을통한 소형 객체 탐지를 원하는 경우 YOLO26이 권장되는 업그레이드 경로입니다.

YOLO26에 대해 더 알아보기

실제 사용 사례

PP-YOLOE+를 선택해야 하는 경우

바이두 클라우드 배포: 인프라가 이미 바이두 클라우드에 구축되었거나 패들 서빙을 사용하는 경우, PP-YOLOE+는 네이티브 최적화를 제공합니다.
특정 하드웨어: 일부 아시아 시장용 AI 칩은 PaddlePaddle 모델에 대한 전용 지원을 제공합니다.

Ultralytics YOLOv10 YOLOv26)를 선택해야 할 때

엣지 컴퓨팅: YOLO26에서 최대 43% 더 빠른 CPU 제공하는 이 모델들은 라즈베리 파이, 제트슨 나노 또는 모바일 배포에 이상적입니다.
복잡한 작업: 탐지 기능을 넘어, Ultralytics 자세 추정, 인스턴스 분할 및 방향 객체 탐지(OBB)를 지원하여 하나의 도구로 다양한 문제를 해결할 수 있게 합니다.
신속한 프로토타이핑: 교육 및 검증의 용이성으로 팀이 신속하게 반복할 수 있으며, 이는 애자일 개발 환경에서 핵심 요소입니다.

메모리 효율성

Ultralytics YOLO 낮은 메모리 사용량으로 유명합니다. 방대한 양의 CUDA 소모하는 트랜스포머 중심 아키텍처와 달리, YOLO26과 같은 효율적인 YOLO 소비자용 GPU에서 더 큰 배치 크기를 허용하여 고급 AI 훈련에 대한 접근성을 확대합니다.

결론

PP-YOLOE+와 YOLOv10 모두 유능한 YOLOv10 . PP-YOLOE+는 PaddlePaddle 강력한 선택지인 반면, YOLOv10 NMS( NMS 설계로 효율성의 한계를 YOLOv10 . 그러나 가장 간소화된 개발 경험, 가장 광범위한 하드웨어 지원, MuSGD 최적화기 및 ProgLoss와 같은 최첨단 기능을 고려할 때, Ultralytics 현대 컴퓨터 비전 엔지니어에게 탁월한 선택으로 두각을 나타냅니다.

다른 옵션을 탐색하려면 다음을 살펴보십시오 YOLOv8 또는 트랜스포머 기반의 RT-DETR 를 검토해 보시기 바랍니다.