콘텐츠로 건너뛰기

PP-YOLOE+ vs DAMO-YOLO: 객체 감지를 위한 기술 비교

정확도, 추론 속도 및 계산 비용 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 Baidu에서 개발한 PP-YOLOE+와 Alibaba Group의 DAMO-YOLO 간의 자세한 기술 비교를 제공합니다. 개발자와 연구원이 컴퓨터 비전 프로젝트에 대한 정보에 입각한 선택을 내리는 데 도움이 되도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석합니다.

PP-YOLOE+: PaddlePaddle 생태계 내의 높은 정확도

PP-YOLOE+는 Baidu에서 PaddleDetection 제품군의 일부로 개발한 앵커 프리(anchor-free) 단일 단계 객체 감지 모델입니다. 2022년에 출시되었으며, 특히 PaddlePaddle 딥 러닝 프레임워크 내에서 합리적인 효율성을 유지하면서 높은 정확도를 달성하는 데 중점을 둡니다.

기술 세부 사항:

아키텍처 및 주요 기능

PP-YOLOE+는 정확도와 속도 간의 균형을 개선하기 위한 몇 가지 주요 개선 사항을 통해 YOLO 제품군을 기반으로 합니다.

  • Anchor-Free Design: 사전 정의된 앵커 박스를 제거함으로써 PP-YOLOE+는 감지 파이프라인을 간소화하고 하이퍼파라미터 튜닝의 복잡성을 줄입니다. 이 접근 방식은 많은 Ultralytics YOLO 모델을 포함하여 최신 감지기에서 일반적입니다. 용어집에서 앵커 프리(anchor-free) 감지기에 대해 자세히 알아볼 수 있습니다.
  • 효율적인 구성 요소: 이 모델은 강력한 특징 추출을 위해 CSPRepResNet 백본과 스케일 간 효과적인 특징 융합을 위한 PAN(Path Aggregation Network) neck을 활용합니다.
  • Decoupled Head: detection head에서 분류 및 회귀 작업을 분리합니다. 이는 두 작업 간의 간섭을 방지하여 성능을 향상시키는 것으로 알려진 기술입니다.
  • Task Alignment Learning (TAL): PP-YOLOE+는 분류 점수와 지역화 정확도를 더 효과적으로 정렬하기 위해 특수 손실 함수를 사용하여 보다 정확한 예측을 가능하게 합니다.

강점과 약점

  • 강점: PP-YOLOE+는 특히 더 큰 구성(l, x)에서 높은 정확도로 인정받고 있습니다. 이 디자인은 PaddlePaddle 생태계에 잘 통합되고 최적화되어 있어 해당 프레임워크 내에서 이미 작업 중인 개발자에게 강력한 선택입니다.
  • 약점: 주요 제한 사항은 PaddlePaddle 프레임워크에 대한 의존성입니다. PyTorch와 같이 더 일반적인 프레임워크 사용자는 통합 및 배포에 어려움을 겪을 수 있습니다. 또한 커뮤니티 지원 및 사용 가능한 리소스가 더 널리 채택된 모델보다 적을 수 있습니다.

사용 사례

PP-YOLOE+는 높은 정확도가 가장 중요하고 개발 환경이 PaddlePaddle 기반인 애플리케이션에 적합하며, 일반적인 사용 사례는 다음과 같습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

DAMO-YOLO: Alibaba의 빠르고 정확한 방법

DAMO-YOLO는 Alibaba Group의 연구진이 개발한 객체 감지 모델입니다. 2022년 말에 소개되었으며, 네트워크 아키텍처 검색부터 고급 레이블 할당 전략에 이르기까지 여러 가지 새로운 기술을 통합하여 속도와 정확도 간의 균형에서 최첨단을 달성하는 것을 목표로 합니다.

기술 세부 사항:

아키텍처 및 주요 기능

DAMO-YOLO는 뛰어난 성능을 달성하기 위해 다양한 기술을 도입했습니다.

  • NAS(Neural Architecture Search): NAS를 사용하여 최적의 백본 아키텍처(MAE-NAS)를 찾아 매우 효율적인 특징 추출기를 생성합니다.
  • Efficient RepGFPN Neck: 이 모델은 낮은 지연 시간으로 효율적인 멀티 스케일 특징 융합을 위해 설계된 새로운 Neck 디자인인 RepGFPN을 통합했습니다.
  • ZeroHead: DAMO-YOLO는 감지 헤드의 계산 오버헤드를 크게 줄이고, 이를 넥(neck)에서 분리하여 속도를 더욱 향상시키는 "ZeroHead"를 제안합니다.
  • AlignedOTA Label Assignment: AlignedOTA라는 동적 레이블 할당 전략을 사용하여 학습 중에 고품질 긍정적 샘플을 선택하기 위해 분류 및 회귀 작업을 정렬하여 정확도를 향상시킵니다.
  • 지식 증류: 훈련 과정은 지식 증류를 통해 향상되어 소형 모델의 성능을 더욱 향상시킵니다.

강점과 약점

  • 강점: DAMO-YOLO의 주요 장점은 특히 소형 모델에서 속도와 정확도의 뛰어난 균형을 제공한다는 것입니다. MAE-NAS 및 ZeroHead와 같은 혁신적인 구성 요소 덕분에 주어진 mAP 수준에서 가장 빠른 검출기 중 하나입니다.
  • 약점: 강력하긴 하지만 DAMO-YOLO는 연구 중심 모델입니다. 구현이 프로덕션 준비가 된 프레임워크에 비해 덜 다듬어지고 사용자 친화적이지 않을 수 있습니다. 주변 생태계가 포괄적이지 않아 비전문가의 경우 학습 및 배포가 더 어려울 수 있습니다.

사용 사례

DAMO-YOLO의 속도는 특히 리소스가 제한된 하드웨어에서 실시간 추론이 필요한 애플리케이션에 적합합니다.

  • 자율 시스템: 낮은 지연 시간이 중요한 로보틱스 및 드론에 적합합니다.
  • Edge AI: 작고 빠른 모델(t, s)은 NVIDIA Jetson과 같은 에지 장치에 배포하도록 최적화되어 있습니다.
  • 비디오 감시: 도난 방지 또는 교통 모니터링과 같은 애플리케이션을 위해 비디오 스트림을 효율적으로 처리합니다.

DAMO-YOLO에 대해 자세히 알아보세요.

성능 분석: PP-YOLOE+ vs. DAMO-YOLO

두 모델을 비교할 때 뚜렷한 절충점을 관찰할 수 있습니다. DAMO-YOLO는 일반적으로 크기에 비해 우수한 속도를 제공하는 반면 PP-YOLOE+는 더 큰 변형으로 더 높은 정확도로 확장됩니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

표에서 DAMO-YOLOt는 PP-YOLOE+t(39.9 mAP, 2.84ms)보다 빠른 추론(2.32ms)으로 더 높은 mAP(42.0)를 달성합니다. 그러나 PP-YOLOE+s는 파라미터 및 FLOP 효율성이 더 높습니다. 하이엔드에서 PP-YOLOE+x는 가장 높은 정확도(54.7 mAP)에 도달하지만 크기와 대기 시간에서 상당한 비용이 발생합니다.

Ultralytics의 장점: YOLO11을 선택해야 하는 이유

PP-YOLOE+와 DAMO-YOLO는 모두 매력적인 기능을 제공하지만, 전체적이고 고성능이며 사용자 친화적인 솔루션을 추구하는 개발자는 Ultralytics YOLO11을 고려해야 합니다. 이는 수년간의 연구 개발의 정점을 나타내며 성능과 사용 편의성의 최적의 조화를 제공합니다.

  • 사용 편의성: Ultralytics 모델은 간소화된 사용자 경험으로 잘 알려져 있습니다. 간단한 Python API, 광범위한 documentation 및 수많은 guides를 통해 매우 빠르게 시작할 수 있습니다.
  • 잘 관리되는 에코시스템: Ultralytics는 GitHub에서의 활발한 개발, 강력한 커뮤니티 지원, 코딩 없이 모델을 학습, 배포 및 관리할 수 있는 Ultralytics HUB 플랫폼을 포함하는 포괄적인 에코시스템을 제공합니다.
  • 성능 균형: YOLO11은 속도와 정확도 간의 뛰어난 균형을 제공하도록 설계되어 클라우드 서버에서 저전력 엣지 장치에 이르기까지 광범위한 실제 배포 시나리오에 적합합니다.
  • 다양성: 특수 감지기와 달리 Ultralytics YOLO 모델은 멀티태스킹 성능이 뛰어납니다. 단일 YOLO11 모델은 객체 탐지, 분할, 분류포즈 추정을 수행할 수 있어 타의 추종을 불허하는 유연성을 제공합니다.
  • 학습 효율성: 즉시 사용 가능한 사전 학습된 가중치와 효율적인 학습 프로세스를 통해 사용자는 최소한의 노력으로 사용자 정의 데이터 세트에서 최첨단 결과를 얻을 수 있습니다. Ultralytics 모델은 또한 많은 대안에 비해 학습 및 추론 중에 더 낮은 메모리 사용을 위해 최적화되어 있습니다.

견고하고 다재다능하며 사용하기 쉬운 모델을 찾는 개발자에게 YOLOv8YOLOv10과 같은 다른 Ultralytics 모델도 PP-YOLOE+ 및 DAMO-YOLO에 비해 상당한 이점을 제공합니다.

결론

PP-YOLOE+와 DAMO-YOLO는 모두 이 분야를 발전시킨 강력한 객체 감지 모델입니다. PP-YOLOE+는 PaddlePaddle 생태계 내에서 높은 정확도를 우선시하는 사용자에게 강력한 경쟁자입니다. DAMO-YOLO는 뛰어난 속도를 제공하는 데 탁월하여 실시간 애플리케이션에 이상적입니다.

그러나 대부분의 개발자와 연구자에게 Ultralytics YOLO 제품군, 특히 최신 YOLO11은 가장 강력한 패키지를 제공합니다. 뛰어난 성능, 여러 비전 작업에서 다재다능함, 사용 편의성, 지원적이고 잘 관리되는 생태계의 조합은 차세대 AI 솔루션을 구축하기 위한 최고의 선택입니다.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글