콘텐츠로 건너뛰기

DAMO-YOLO vs PP-YOLOE+: 상세 기술 비교

실시간 컴퓨터 비전 분야의 치열한 경쟁 환경에서 특정 배포 요구사항에 최적화된 아키텍처를 선택하는 것은 매우 중요합니다. 본 가이드는 YOLO PP-YOLOE+ 간의 포괄적인 기술적 비교를 제공하며, 두 모델의 아키텍처 설계, 훈련 방법론 및 성능 지표를 심층적으로 분석합니다. 또한 새롭게 출시된 Ultralytics 같은 최신 솔루션 대비 이들 모델의 성능을 비교 평가할 것입니다.

모델 개요

두 프레임워크는 2022년에 산업 애플리케이션을 위한 강력한 대안으로 등장했으며, 정교한 기술을 활용하여 정확도와 추론 속도의 한계를 확장했습니다.

DAMO-YOLO

Alibaba Group이 개발한 DAMO-YOLO는 자동화된 검색 기술과 고급 특징 융합에 크게 의존하면서 지연 시간-정확도 상충 관계를 최적화하기 위해 여러 가지 새로운 기술을 도입했습니다.

DAMO-YOLO는 다중 스케일 아키텍처 검색 (MAE-NAS)을 사용하여 하드웨어 효율성에 최적화된 백본을 자동으로 설계합니다. 또한 넥(neck) 특징 융합을 위한 효율적인 RepGFPN (Re-parameterized Generalized Feature Pyramid Network)과 경량 "ZeroHead" 설계를 특징으로 합니다. 또한 훈련 중 증류 기술에 크게 의존하여 학생 모델의 표현력을 향상시킵니다.

DAMO-YOLO에 대해 자세히 알아보세요.

PP-YOLOE+

바이두 PaddlePaddle PP-YOLOE+는 PP-YOLOE 아키텍처의 점진적 업그레이드 버전입니다. 대규모 사전 훈련과 정교한 손실 함수에 중점을 두어 높은 mAP 제공하며, 특히 자체 딥러닝 프레임워크 내에서 뛰어난 성능을 발휘합니다.

PP-YOLOE+는 CSPRepResNet 백본과 ET-head(효율적 작업 정렬 헤드)를 활용합니다. "플러스" 버전은 Objects365 데이터셋에 대한 강력한 사전 훈련 전략을 도입하여 다양한 실제 환경에서의 일반화 능력을 크게 향상시킵니다.

PP-YOLOE+에 대해 자세히 알아보세요.

아키텍처 비교

이 두 모델 간의 설계 철학 차이는 그들의 이상적인 사용 사례와 하드웨어 호환성에 큰 영향을 미칩니다.

특징 융합과 백본

DAMO-YOLO의 MAE-NAS로 생성된 백본은 엣지 장치에 고도로 맞춤화되어 있으며, 종종 유리한 속도-파라미터 비율을 제공합니다. 그러나 이러한 맞춤형 아키텍처는 instance segmentation과 같은 새로운 작업에 적용하기에는 경직되고 복잡할 수 있습니다. RepGFPN 넥은 다중 스케일 특징 융합을 개선하지만, 재매개변수화(re-parameterization) 내보내기 단계에서 복잡성을 추가합니다.

PP-YOLOE+는 보다 전통적이면서도 매우 효과적인 CSPRepResNet을 기반으로 합니다. 이 백본은 유사한 정확도를YOLO 더 많은 매개변수 공간을 필요로 하지만, 훈련 안정성이 매우 높고 기존 파이프라인에 통합하기가 더 쉽습니다. 그 ET-헤드는 분류와 회귀를 효율적으로 처리하지만, 여전히 비최대 억제(NMS)와 같은 후처리 단계가 필요합니다.

후처리 지연 제거

DAMO-YOLO와 PP-YOLOE+ 모두 바운딩 박스 후처리(post-processing)를 위해 NMS가 필요합니다. 추론 지연 시간(inference latency)이 중요하다면, 기본적으로 종단 간(End-to-End) NMS-Free 설계를 특징으로 하는 Ultralytics YOLO26 사용을 고려해볼 수 있습니다. 이 획기적인 접근 방식은 NMS 후처리를 제거하여 더 빠르고 간단한 배포 파이프라인을 가능하게 합니다.

성과 및 지표 분석

이러한 모델을 생산 환경에서 평가할 때 정확도(mAP), 추론 속도, 매개변수 크기 간의 균형이 매우 중요합니다. 아래는 주요 변형 모델들의 직접 비교입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

표가 보여주듯이, DAMO-YOLO는 NAS 최적화 백본 덕분에 일반적으로 소형(s) 및 초소형(t) 스케일에서 더 낮은 지연 시간을 달성합니다. 하지만, PP-YOLOE+는 중형(m) 및 대형(l) 티어에서 놀랍도록 잘 확장되며, T4 TensorRT 속도에는 약간의 비용이 따르지만 훨씬 더 높은 mAP 점수를 자랑합니다.

메모리 요구 사항 및 교육 효율성

DAMO-YOLO가 증류(distillation)에 의존한다는 것은 종종 더 작은 student 모델을 훈련하기 전에 훨씬 더 큰 teacher 모델을 훈련해야 한다는 것을 의미합니다. 이는 CUDA memory requirements와 전체 계산 예산을 크게 증가시킵니다. PP-YOLOE+는 표준 단일 단계 훈련으로 이를 단순화하지만, PaddlePaddle 프레임워크에 단단히 결합되어 있어 PyTorch에 익숙한 팀에게는 유연성을 제한할 수 있습니다.

이와 대조적으로, 현대적인 Ultralytics YOLO26 모델은 이러한 병목 현상을 해결합니다. LLM 훈련 혁신에서 영감을 받은 SGD와 Muon의 하이브리드인 새로운 MuSGD Optimizer를 활용하여 YOLO26은 복잡한 증류 파이프라인 없이도 더 빠른 수렴과 매우 안정적인 훈련을 달성합니다. 또한, YOLO 모델은 RT-DETR와 같은 트랜스포머 기반 detect에 비해 훈련 중 훨씬 적은 CUDA memory를 필요로 합니다.

실제 적용 사례와 이상적인 사용 사례

YOLO 언제 사용해야 하는가

DAMO-YOLO는 지연 시간이 궁극적인 병목 현상인 고처리량 엣지 추론에 이상적입니다. 엔지니어링 팀이 복잡한 증류(distillation) 및 재매개변수화(re-parameterization) 프로세스를 관리할 역량을 갖추고 있다면, 그 작은 변형 모델들은 교통 관리 시스템이나 기본적인 드론 감시와 같은 환경에서 탁월한 성능을 발휘합니다.

PP-YOLOE+ 사용 시기

PP-YOLOE+는 이미 바이두 생태계에 깊이 투자했거나 대규모 서버 배포를 운영 중인 경우에 빛을 발합니다. 인상적인 mAP 성능 mAP 복잡한 의료 영상 분석이나 밀집된 제조 결함 검출에 mAP .

Ultralytics 이점

YOLO PP-YOLOE+ 모두 특정 지역적 이점을 제공하지만, 최대의 다용도성, 속도 및 사용 편의성을 추구하는 개발자들은 꾸준히 Ultralytics 선택합니다.

컴퓨터 비전 파이프라인을 업그레이드할 때 Ultralytics 비교할 수 없는 개발자 경험을 제공합니다:

  • 최대 43% 더 빠른 CPU 추론: Distribution Focal Loss (DFL)의 완전한 제거로 YOLO26은 엣지 CPU 및 저전력 IoT 디바이스에서 놀랍도록 빠릅니다.
  • 향상된 작은 객체 detect: ProgLoss 및 STAL 손실 함수의 통합은 작은 객체 인식에 획기적인 개선을 제공하며, 이는 항공 이미지에 필수적입니다.
  • 광범위한 다용도성: detection에만 엄격하게 초점을 맞춘 PP-YOLOE+와 달리, YOLO26은 작업별 아키텍처 개선을 통해 pose estimation, oriented bounding boxes (OBB) 및 semantic segmentation을 원활하게 처리합니다.

결론

DAMO-YOLO와 PP-YOLOE+는 앵커 프리 객체 detect의 진화에 있어 중요한 이정표를 나타냅니다. DAMO-YOLO는 엣지 지연 시간을 위한 신경망 아키텍처 검색의 한계를 확장했으며, PP-YOLOE+는 대규모 사전 훈련의 힘을 보여주었습니다.

그러나 속도, 정확도, 배포 편의성의 최적 균형을 추구하는 개발자에게는 Ultralytics 모델이 확실한 선택입니다. NMS 아키텍처, 강력한 Python , 그리고 다음과 같은 도구와의 원활한 통합을 통해 Weights & Biases , TensorRT 과의 원활한 통합은 프로젝트가 프로토타입에서 프로덕션 환경으로 원활하게 전환되도록 보장합니다.

시작할 준비가 되셨나요? Ultralytics 시작 가이드를 살펴보거나 YOLO11 YOLO 개요에서 더 많은 모델을 비교해 보세요.


댓글