Link to this sectionDAMO-YOLO 대 PP-YOLOE+#
실시간 컴퓨터 비전 분야의 치열한 경쟁 속에서, 특정 배포 요구 사항에 최적화된 아키텍처를 선택하는 것은 매우 중요합니다. 본 가이드에서는 DAMO-YOLO와 **PP-YOLOE+**에 대한 포괄적인 기술 비교를 제공하며, 이들의 아키텍처 설계, 학습 방법론 및 성능 지표를 심도 있게 다룹니다. 또한, 새로 출시된 Ultralytics YOLO26과 같은 최신 솔루션과 비교하여 이러한 모델들이 어떤 위치에 있는지 살펴봅니다.
Link to this section모델 개요#
두 프레임워크 모두 2022년에 등장하여 산업용 애플리케이션을 위한 강력한 대안으로 자리 잡았으며, 정교한 기술을 활용하여 정확도와 추론 속도의 한계를 넓혔습니다.
Link to this sectionDAMO-YOLO#
Alibaba Group에서 개발한 DAMO-YOLO는 지연 시간과 정확도 사이의 균형을 최적화하기 위해 자동화된 탐색 기술과 고급 특징 융합에 크게 의존하는 몇 가지 새로운 기법을 도입했습니다.
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- 조직: Alibaba Group
- 날짜: 2022-11-23
- Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
- GitHub: tinyvision/DAMO-YOLO
- 문서: DAMO-YOLO README
DAMO-YOLO는 하드웨어 효율성에 최적화된 백본을 자동으로 설계하기 위해 다중 스케일 아키텍처 탐색(MAE-NAS)을 사용합니다. 또한, 넥 특징 융합을 위한 효율적인 RepGFPN(재매개변수화된 일반화된 특징 피라미드 네트워크)과 경량 "ZeroHead" 설계를 특징으로 합니다. 나아가 학습 과정에서 증류 기술에 크게 의존하여 학생 모델의 표현력을 향상합니다.
Link to this sectionPP-YOLOE+#
Baidu PaddlePaddle 팀이 개발한 PP-YOLOE+는 PP-YOLOE 아키텍처의 증분 업그레이드 버전입니다. 이 모델은 대규모 사전 학습과 정교한 손실 함수에 집중하여, 특히 네이티브 딥러닝 프레임워크 내에서 높은 mAP를 제공합니다.
- 저자: PaddlePaddle 저자진
- 조직: Baidu
- 날짜: 2022-04-02
- Arxiv: PP-YOLOE: An evolved version of YOLO
- GitHub: PaddlePaddle/PaddleDetection
- 문서: PP-YOLOE+ Configs
PP-YOLOE+는 CSPRepResNet 백본과 ET-head(Efficient Task-aligned head)를 활용합니다. "plus" 버전은 Objects365 데이터셋에 대한 강력한 사전 학습 전략을 도입하여, 다양한 실제 환경에서 일반화 성능을 크게 향상했습니다.
Link to this section아키텍처 비교#
이 두 모델 간의 설계 철학 차이는 이상적인 사용 사례와 하드웨어 호환성에 큰 영향을 미칩니다.
Link to this section특징 융합 및 백본#
DAMO-YOLO의 MAE-NAS 생성 백본은 엣지 디바이스에 맞게 고도로 조정되어 있으며, 종종 유리한 속도-매개변수 비율을 제공합니다. 그러나 이러한 맞춤형 아키텍처는 경직될 수 있으며 인스턴스 분할과 같은 새로운 작업에 적용하기에는 복잡할 수 있습니다. RepGFPN 넥은 다중 스케일 특징 융합을 개선하지만 재매개변수화 내보내기 단계에서 복잡성을 가중합니다.
PP-YOLOE+는 더욱 전통적이면서도 매우 효과적인 CSPRepResNet에 의존합니다. 이 백본은 유사한 정확도를 위해 DAMO-YOLO보다 더 큰 매개변수 공간을 차지하지만, 학습 시 매우 안정적이며 기존 파이프라인에 통합하기 쉽습니다. ET-head는 분류 및 회귀를 효율적으로 처리하지만, 여전히 Non-Maximum Suppression(NMS)과 같은 후처리 단계가 필요합니다.
DAMO-YOLO와 PP-YOLOE+는 모두 경계 상자 후처리를 위해 NMS가 필요합니다. 추론 지연 시간이 중요하다면, 네이티브 End-to-End NMS-Free Design을 특징으로 하는 Ultralytics YOLO26 사용을 고려해 보십시오. 이 혁신적인 접근 방식은 NMS 후처리를 제거하여 더 빠르고 단순한 배포 파이프라인을 구현합니다.
Link to this section성능 및 지표 분석#
프로덕션을 위해 이러한 모델을 평가할 때는 정확도(mAP), 추론 속도 및 매개변수 크기 간의 균형이 중요합니다. 아래는 주요 변형들에 대한 직접적인 비교입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
표에서 볼 수 있듯이, DAMO-YOLO는 NAS 최적화 백본 덕분에 일반적으로 소형(s) 및 초소형(t) 스케일에서 더 낮은 지연 시간을 달성합니다. 그러나 PP-YOLOE+는 중형(m) 및 대형(l) 계층에서 매우 뛰어난 확장성을 보여주며, T4 TensorRT 속도에는 다소 불리할 수 있지만 훨씬 더 높은 mAP 점수를 자랑합니다.
Link to this section메모리 요구 사항 및 학습 효율성#
DAMO-YOLO는 증류에 의존하므로, 더 작은 학생 모델을 학습하기 전에 훨씬 더 큰 교사 모델을 학습해야 하는 경우가 많습니다. 이는 CUDA 메모리 요구 사항과 전체 계산 예산을 크게 증가시킵니다. PP-YOLOE+는 표준 단일 단계 학습으로 이를 단순화하지만, PyTorch에 익숙한 팀에게는 유연성을 제한할 수 있는 PaddlePaddle 프레임워크에 강하게 결합되어 있습니다.
반면, 최신 Ultralytics YOLO26 모델은 이러한 병목 현상을 해결합니다. LLM 학습 혁신에서 영감을 받은 SGD와 Muon의 하이브리드인 새로운 MuSGD Optimizer를 활용하는 YOLO26은 복잡한 증류 파이프라인 없이도 더 빠른 수렴과 매우 안정적인 학습을 달성합니다. 또한, YOLO 모델은 일반적으로 RT-DETR과 같은 트랜스포머 기반 탐지기에 비해 학습 시 CUDA 메모리 사용량이 훨씬 적습니다.
Link to this section실제 애플리케이션 및 이상적인 사용 사례#
Link to this sectionDAMO-YOLO를 사용해야 하는 경우#
DAMO-YOLO는 지연 시간이 최종 병목 현상인 고처리량 엣지 추론에 이상적입니다. 엔지니어링 팀이 복잡한 증류 및 재매개변수화 과정을 관리할 여력이 있다면, 해당 소형 변형은 교통 관리 시스템이나 기본 드론 감시와 같은 환경에서 뛰어난 성능을 발휘합니다.
Link to this sectionPP-YOLOE+를 사용해야 할 때#
PP-YOLOE+는 이미 Baidu 생태계에 깊이 투자했거나 대규모 서버 배포를 운영할 때 빛을 발합니다. 인상적인 mAP 성능으로 인해 복잡한 의료 영상 분석이나 밀집된 제조 결함 탐지에 적합합니다.
Link to this sectionUltralytics의 장점#
DAMO-YOLO와 PP-YOLOE+ 모두 각각의 국소적 이점을 제공하지만, 최고의 다재다능함, 속도 및 사용 편의성을 추구하는 개발자들은 지속적으로 Ultralytics Platform을 선택하고 있습니다.
컴퓨터 비전 파이프라인을 업그레이드할 때, Ultralytics YOLO26은 독보적인 개발자 경험을 제공합니다.
- 최대 43% 더 빠른 CPU 추론: Distribution Focal Loss(DFL)를 완전히 제거함으로써 YOLO26은 엣지 CPU 및 저전력 IoT 디바이스에서 놀라울 정도로 빠릅니다.
- 향상된 소형 객체 탐지: ProgLoss 및 STAL 손실 함수의 통합은 항공 이미지에 필수적인 소형 객체 인식 성능을 극적으로 향상합니다.
- 폭넓은 범용성: 탐지에만 집중하는 PP-YOLOE+와 달리, YOLO26은 작업별 아키텍처 개선을 통해 자세 추정, 지향 경계 상자(OBB) 및 의미론적 분할을 원활하게 처리합니다.
Link to this section결론#
DAMO-YOLO와 PP-YOLOE+는 앵커 프리 객체 탐지 발전의 중요한 이정표를 나타냅니다. DAMO-YOLO는 엣지 지연 시간을 위한 신경망 아키텍처 탐색의 한계를 밀어붙였고, PP-YOLOE+는 대규모 사전 학습의 힘을 입증했습니다.
그러나 속도, 정확도 및 배포 단순함 사이에서 최상의 균형을 찾는 개발자에게는 Ultralytics YOLO26 모델이 확실한 선택입니다. NMS-free 아키텍처, 강력한 Python API, 그리고 Weights & Biases 및 TensorRT와 같은 도구와의 원활한 통합을 통해 프로젝트를 프로토타입에서 프로덕션 단계까지 원활하게 진행할 수 있습니다.
시작할 준비가 되셨나요? Ultralytics 빠른 시작 가이드를 살펴보거나 YOLO11 vs DAMO-YOLO 개요에서 더 많은 모델을 비교해 보십시오.