DAMO-YOLO vs PP-YOLOE+: 상세 기술 비교
실시간 컴퓨터 비전 분야의 치열한 경쟁 속에서 특정 배포 요구 사항에 최적화된 아키텍처를 선택하는 것은 매우 중요합니다. 이 가이드는 DAMO-YOLO와 **PP-YOLOE+**를 기술적으로 상세히 비교하며, 아키텍처 설계, 학습 방법론, 성능 지표를 심층적으로 다룹니다. 또한, 이 모델들이 최근 출시된 Ultralytics YOLO26과 같은 최첨단 솔루션과 비교하여 어떤 성능을 보이는지 살펴봅니다.
모델 개요
두 프레임워크 모두 2022년에 산업용 애플리케이션을 위한 강력한 대안으로 등장했으며, 정교한 기술을 활용하여 정확도와 추론 속도의 한계를 확장했습니다.
DAMO-YOLO
Alibaba Group에서 개발한 DAMO-YOLO는 자동화된 탐색 기술과 고급 특징 융합(feature fusion)에 크게 의존하여 지연 시간과 정확도 간의 균형을 최적화하는 몇 가지 새로운 기법을 도입했습니다.
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
- 조직: Alibaba Group
- 날짜: 2022-11-23
- Arxiv: DAMO-YOLO: 실시간 객체 탐지 설계 보고서
- GitHub: tinyvision/DAMO-YOLO
- 문서: DAMO-YOLO README
DAMO-YOLO는 하드웨어 효율성에 최적화된 백본을 자동으로 설계하기 위해 다중 스케일 아키텍처 탐색(MAE-NAS)을 사용합니다. 또한 넥(neck) 특징 융합을 위한 효율적인 RepGFPN(재매개변수화된 일반화 특징 피라미드 네트워크)과 경량형 "ZeroHead" 설계를 특징으로 합니다. 나아가 학습 중 학생 모델의 표현력을 높이기 위해 증류(distillation) 기술을 적극적으로 활용합니다.
PP-YOLOE+
Baidu PaddlePaddle 팀에서 개발한 PP-YOLOE+는 PP-YOLOE 아키텍처의 점진적 업그레이드 버전입니다. 이 모델은 대규모 사전 학습과 정교해진 손실 함수에 집중하여, 특히 고유의 딥러닝 프레임워크 내에서 높은 mAP를 제공합니다.
- 저자: PaddlePaddle 저자
- 조직: Baidu
- 날짜: 2022-04-02
- Arxiv: PP-YOLOE: 진화된 버전의 YOLO
- GitHub: PaddlePaddle/PaddleDetection
- 문서: PP-YOLOE+ 구성
PP-YOLOE+는 CSPRepResNet 백본과 ET-head(효율적인 작업 정렬 헤드)를 사용합니다. "plus" 버전은 Objects365 데이터셋에 대한 강력한 사전 학습 전략을 도입하여 다양한 실제 환경에 대한 일반화 능력을 크게 향상시켰습니다.
아키텍처 비교
이 두 모델 간의 설계 철학 차이는 이상적인 사용 사례와 하드웨어 호환성에 큰 영향을 미칩니다.
특징 융합 및 백본
DAMO-YOLO의 MAE-NAS 생성 백본은 엣지 디바이스에 매우 최적화되어 있어 종종 유리한 속도-파라미터 비율을 제공합니다. 하지만 이러한 맞춤형 아키텍처는 경직될 수 있으며 객체 분할과 같은 새로운 작업에 적용하기 복잡할 수 있습니다. RepGFPN 넥은 다중 스케일 특징 융합을 개선하지만 재매개변수화 내보내기 단계에서 복잡성을 더합니다.
PP-YOLOE+는 더 전통적이면서도 매우 효과적인 CSPRepResNet에 의존합니다. 이 백본은 유사한 정확도를 위해 DAMO-YOLO보다 더 큰 파라미터 점유 공간을 필요로 하지만, 학습이 매우 안정적이고 기존 파이프라인에 통합하기가 더 쉽습니다. ET-head는 분류 및 회귀를 효율적으로 처리하지만 여전히 NMS(Non-Maximum Suppression)와 같은 후처리 단계가 필요합니다.
DAMO-YOLO와 PP-YOLOE+는 모두 경계 상자 후처리를 위해 NMS가 필요합니다. 추론 지연 시간이 중요하다면, 기본적으로 엔드투엔드 NMS-Free 설계를 특징으로 하는 Ultralytics YOLO26 사용을 고려해 보십시오. 이 혁신적인 접근 방식은 NMS 후처리를 제거하여 더 빠르고 단순한 배포 파이프라인을 구축합니다.
성능 및 지표 분석
프로덕션을 위해 이 모델들을 평가할 때는 정확도(mAP), 추론 속도, 파라미터 크기 간의 균형이 중요합니다. 아래는 주요 변형 모델에 대한 직접 비교입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
표에서 볼 수 있듯이 DAMO-YOLO는 NAS 최적화 백본 덕분에 일반적으로 소형(s) 및 초소형(t) 스케일에서 더 낮은 지연 시간을 달성합니다. 하지만 PP-YOLOE+는 중형(m) 및 대형(l) 계층으로 매우 잘 확장되며, T4 TensorRT 속도에서 약간의 비용이 발생함에도 불구하고 현저히 높은 mAP 점수를 자랑합니다.
메모리 요구 사항 및 학습 효율성
DAMO-YOLO가 증류에 의존한다는 것은 소형 학생 모델을 학습시키기 전에 훨씬 큰 교사 모델을 학습시켜야 함을 의미합니다. 이는 CUDA 메모리 요구 사항과 전반적인 컴퓨팅 예산을 크게 증가시킵니다. PP-YOLOE+는 표준 단일 단계 학습으로 이를 단순화하지만, PyTorch에 익숙한 팀에게 유연성을 제한할 수 있는 PaddlePaddle 프레임워크에 밀접하게 결합되어 있습니다.
반면, 현대적인 Ultralytics YOLO26 모델은 이러한 병목 현상을 해결합니다. LLM 학습 혁신에서 영감을 받은 SGD와 Muon의 하이브리드인 새로운 MuSGD 옵티마이저를 활용하는 YOLO26은 복잡한 증류 파이프라인 없이도 더 빠른 수렴과 매우 안정적인 학습을 달성합니다. 또한, YOLO 모델은 일반적으로 RT-DETR과 같은 트랜스포머 기반 탐지기에 비해 학습 시 훨씬 적은 CUDA 메모리를 필요로 합니다.
실제 애플리케이션 및 이상적인 사용 사례
DAMO-YOLO 사용 시기
DAMO-YOLO는 지연 시간이 궁극적인 병목인 고처리량 엣지 추론에 이상적입니다. 엔지니어링 팀이 복잡한 증류 및 재매개변수화 프로세스를 관리할 여력이 있다면, 이 모델의 소형 변형은 교통 관리 시스템이나 기본 드론 감시와 같은 환경에서 탁월한 성능을 발휘합니다.
PP-YOLOE+ 사용 시기
PP-YOLOE+는 이미 Baidu 생태계에 깊이 투자했거나 대규모 서버 배포를 운영할 때 빛을 발합니다. 인상적인 mAP 덕분에 복잡한 의료 영상 분석이나 정밀한 제조 결함 탐지에 적합합니다.
Ultralytics의 강점
DAMO-YOLO와 PP-YOLOE+ 모두 특정 현지화된 이점을 제공하지만, 최대한의 다재다능함, 속도, 사용 편의성을 추구하는 개발자들은 지속적으로 Ultralytics Platform을 선택하고 있습니다.
컴퓨터 비전 파이프라인을 업그레이드할 때, Ultralytics YOLO26은 타의 추종을 불허하는 개발자 경험을 제공합니다:
- 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 완전히 제거하여 YOLO26은 엣지 CPU와 저전력 IoT 디바이스에서 놀라울 정도로 빠릅니다.
- 향상된 소형 객체 탐지: ProgLoss 및 STAL 손실 함수의 통합은 항공 이미지에 필수적인 소형 객체 인식 성능을 극적으로 향상시킵니다.
- 광범위한 범용성: 엄격하게 탐지에 집중하는 PP-YOLOE+와 달리, YOLO26은 자세 추정, 회전 경계 상자(OBB) 및 의미론적 분할을 작업별 아키텍처 개선과 함께 원활하게 처리합니다.
결론
DAMO-YOLO와 PP-YOLOE+는 앵커 없는(anchor-free) 객체 탐지의 진화에 있어 중요한 이정표를 나타냅니다. DAMO-YOLO는 엣지 지연 시간을 위한 신경망 아키텍처 탐색의 한계를 확장했고, PP-YOLOE+는 대규모 사전 학습의 힘을 입증했습니다.
그러나 속도, 정확도, 배포 단순성의 최상의 균형을 찾는 개발자에게 Ultralytics YOLO26 모델은 확실한 선택입니다. NMS-free 아키텍처, 강력한 Python API, Weights & Biases 및 TensorRT와 같은 도구와의 원활한 통합은 프로젝트가 프로토타입에서 프로덕션으로 원활하게 이동할 수 있도록 보장합니다.
시작할 준비가 되셨습니까? Ultralytics 퀵스타트 가이드를 살펴보거나 YOLO11 vs DAMO-YOLO 개요에서 더 많은 모델을 비교해 보세요.