콘텐츠로 건너뛰기

YOLOv9 vs PP-YOLOE+: 기술 비교

올바른 객체 감지 모델을 선택하는 것은 정확도, 속도 및 리소스 요구 사항 간의 중요한 절충을 수반합니다. 이 페이지에서는 아키텍처 혁신으로 잘 알려진 최첨단 모델인 Ultralytics YOLOv9와 PaddlePaddle 생태계의 강력한 경쟁자인 Baidu의 PP-YOLOE+ 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석합니다.

YOLOv9: 향상된 학습을 위한 Programmable Gradient Information

Ultralytics YOLOv9는 딥 러닝의 오랜 과제를 해결하기 위한 획기적인 개념을 도입하여 실시간 객체 감지 분야에서 상당한 발전을 이루었습니다.

저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
조직: 대만 Academia Sinica, 정보 과학 연구소
날짜: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Documentation: https://docs.ultralytics.com/models/yolov9/

YOLOv9의 핵심 혁신은 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network)입니다. PGI는 데이터가 심층 네트워크를 통과할 때 정보 손실 문제를 해결하도록 설계되어 정확한 모델 업데이트에 사용할 수 있는 신뢰할 수 있는 기울기 정보를 보장합니다. 이는 주요 기능을 보존하고 학습을 향상시키는 데 도움이 됩니다. GELAN은 뛰어난 파라미터 활용률과 계산 효율성을 위해 최적화된 새로운 네트워크 아키텍처입니다. 이 강력한 조합을 통해 YOLOv9는 높은 추론 속도를 유지하면서 뛰어난 정확도를 달성할 수 있습니다.

YOLOv9의 주요 장점은 Ultralytics 생태계에 통합되었다는 점입니다. 이를 통해 간단한 API, 포괄적인 문서 및 강력한 지원 네트워크를 통해 간소화된 사용자 경험을 제공합니다. 이 생태계는 활발한 개발, GitHubDiscord와 같은 플랫폼의 강력한 커뮤니티, 빈번한 업데이트의 이점을 누리고 있습니다. 이를 통해 개발자는 효율적인 훈련 프로세스, 즉시 사용 가능한 사전 훈련된 가중치 및 객체 감지인스턴스 분할과 같은 여러 작업을 지원하는 플랫폼에 액세스할 수 있습니다.

강점

  • 높은 정확도: COCO와 같은 까다로운 데이터 세트에서 최첨단 mAP 점수를 달성했으며, YOLOv9-E 모델은 실시간 감지기에 대한 새로운 벤치마크를 설정했습니다.
  • 효율적인 아키텍처: GELAN 아키텍처와 PGI는 유사한 정확도를 가진 모델에 비해 훨씬 적은 파라미터와 FLOP으로 뛰어난 성능을 제공합니다.
  • 정보 보존: PGI는 심층 네트워크에서 정보 병목 현상 문제를 효과적으로 완화하여 더 나은 모델 수렴과 정확도로 이어집니다.
  • Ultralytics 생태계: 사용 편의성, 광범위한 문서, 적극적인 유지 관리 및 강력한 커뮤니티 지원의 이점을 누릴 수 있습니다. 가장 인기 있는 AI 프레임워크인 PyTorch를 기반으로 구축되어 접근성이 매우 뛰어납니다.
  • 다양성: 이 아키텍처는 다재다능하며 탐지 외에도 여러 컴퓨터 비전 작업을 지원합니다.

약점

  • 더 새로운 모델: 최신 릴리스이므로, 커뮤니티에서 제공하는 예제 및 타사 통합의 범위는 아직 증가하고 있지만 Ultralytics 프레임워크에 포함되어 채택이 가속화되고 있습니다.
  • 학습 리소스: YOLOv9는 성능 수준에 비해 효율적이지만, 가장 큰 YOLOv9 변형 모델을 학습하려면 상당한 컴퓨팅 리소스가 필요할 수 있습니다.

이상적인 사용 사례

YOLOv9은 최고 수준의 정확도와 효율성을 요구하는 애플리케이션에 탁월합니다. 이는 자율 주행, 고급 보안 시스템 및 고정밀 로봇 공학과 같은 복잡한 작업에 이상적입니다. 또한 효율적인 설계 덕분에 리소스가 제한된 엣지 AI 환경에 배포하기에 적합한 소형 버전도 있습니다.

YOLOv9에 대해 자세히 알아보세요

PP-YOLOE+: PaddlePaddle 생태계 내의 높은 정확도

PP-YOLOE+는 Baidu에서 개발한 고성능 객체 감지기이며 PaddleDetection 제품군의 핵심 부분입니다. 속도와 정확도의 강력한 균형을 제공하도록 설계되었지만 구현은 PaddlePaddle 딥 러닝 프레임워크와 긴밀하게 결합되어 있습니다.

작성자: PaddlePaddle 작성자
기관: Baidu
날짜: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
문서: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

PP-YOLOE+는 이전 PP-YOLO 버전을 기반으로 하는 앵커 프리(anchor-free) 단일 단계 검출기입니다. CSPRepResNet을 기반으로 하는 효율적인 백본과 TAL(Task Alignment Learning)을 사용하여 분류 및 지역화 정렬을 개선하는 감지 헤드를 통합합니다. 이 모델 시리즈는 다양한 계산 예산에 맞춰 다양한 크기(s, m, l, x)를 제공합니다.

강점

  • 뛰어난 성능: 경쟁력 있는 정확도와 속도를 제공하여 다양한 객체 감지 작업에 적합한 모델입니다.
  • PaddlePaddle에 최적화됨: 이미 Baidu PaddlePaddle 생태계에 투자한 팀의 경우 PP-YOLOE+는 원활한 통합과 최적화된 성능을 제공합니다.

약점

  • 프레임워크 종속성: PaddlePaddle 프레임워크에 대한 의존성은 주로 PyTorch를 사용하는 더 광범위한 커뮤니티에 중요한 장벽이 될 수 있습니다. 프로젝트를 마이그레이션하거나 PyTorch 기반 도구와 통합하는 것이 복잡할 수 있습니다.
  • 제한적인 다용도성: PP-YOLOE+는 주로 객체 감지에 중점을 둡니다. 대조적으로 YOLOv8YOLO11과 같은 Ultralytics 모델은 분할, 포즈 추정 및 분류를 포함한 여러 작업에 대한 통합 프레임워크를 기본적으로 제공합니다.
  • 생태계 및 지원: PP-YOLOE+를 둘러싼 생태계는 Ultralytics YOLO의 생태계보다 덜 광범위합니다. 사용자는 활발하게 유지 관리되는 Ultralytics 생태계에 비해 커뮤니티 튜토리얼이 적고, 지원 채널의 응답성이 떨어지며, 업데이트가 느리다는 것을 알 수 있습니다.

이상적인 사용 사례

PP-YOLOE+는 Baidu PaddlePaddle 딥 러닝 프레임워크에서 이미 표준화된 개발자 및 조직에 가장 적합합니다. 개발 팀이 PaddlePaddle에 대한 기존 전문 지식을 보유한 표준 객체 감지 애플리케이션에 적합한 선택입니다.

PP-YOLOE+에 대해 자세히 알아보세요.

성능 분석: YOLOv9 vs. PP-YOLOE+

성능을 비교할 때 YOLOv9가 정확도와 효율성 모두에 대해 더 높은 기준을 설정한다는 것을 알 수 있습니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
  • 최고 정확도: YOLOv9-E는 가장 큰 PP-YOLOE+x 모델(54.7 mAP)보다 훨씬 적은 파라미터(57.3M vs. 98.42M)를 사용하면서 55.6의 가장 높은 mAP를 달성합니다.
  • 효율성: YOLOv9는 전반적으로 뛰어난 파라미터 효율성을 보여줍니다. 예를 들어 YOLOv9-C는 25.3M 파라미터만으로 53.0 mAP에 도달하는 반면, PP-YOLOE+l은 유사한 52.9 mAP를 달성하기 위해 52.2M 파라미터가 필요합니다. 가장 작은 모델인 YOLOv9-T는 2.0M 파라미터만으로 매우 가볍습니다.
  • 속도 vs. 정확도 절충: PP-YOLOE+s는 T4 GPU에서 가장 빠른 추론 시간을 보여주지만, 정확도(43.7 mAP)가 낮아지는 단점이 있습니다. 반면, YOLOv9-S는 지연 시간의 증가는 미미하면서 훨씬 더 높은 46.8 mAP를 제공하므로 정확도가 중요한 애플리케이션에 더 나은 절충안을 제시합니다.

결론: 어떤 모델을 선택해야 할까요?

대다수의 개발자, 연구원 및 기업에게 YOLOv9이 더 나은 선택입니다. 최첨단 정확도는 뛰어난 계산 및 파라미터 효율성과 결합되어 실시간 객체 감지에서 새로운 표준을 설정합니다.

YOLOv9의 주요 장점은 성능뿐만 아니라 Ultralytics 생태계 내 통합에 있습니다. 널리 채택된 PyTorch 프레임워크를 기반으로 구축되어 사용 편의성, 광범위한 문서, 다중 작업 다용성 및 활발하고 지원적인 커뮤니티를 제공합니다. 이러한 전체적인 환경은 개발 시간을 획기적으로 줄이고 배포 및 유지 관리를 간소화합니다.

PP-YOLOE+는 유능한 모델이지만, 그 가치는 이미 Baidu PaddlePaddle 생태계 내에서 운영 중인 사용자에게 크게 국한됩니다. 이 특정 환경 외부의 사용자의 경우, 새로운 프레임워크를 채택하는 데 드는 비용과 다재다능성 및 커뮤니티 지원의 제한으로 인해 Ultralytics YOLOv9에서 제공하는 강력하고 접근 가능한 솔루션에 비해 덜 실용적인 옵션이 됩니다.

고려할 다른 모델

다양한 아키텍처를 탐색하는 경우 Ultralytics 생태계에서 사용 가능한 다른 모델에도 관심이 있을 수 있습니다.

  • YOLOv8: 매우 다재다능하고 균형 잡힌 모델로, 광범위한 작업에 적합하며 속도와 사용 편의성으로 유명합니다.
  • YOLO11: 최신 공식 Ultralytics 모델로, 성능과 효율성의 경계를 더욱 확장합니다.
  • RT-DETR: 객체 감지에 대한 다른 아키텍처 접근 방식을 제공하는 실시간 변환기 기반 감지기입니다.


📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글