PP-YOLOE+ vs. YOLOv9: 기술 비교
올바른 객체 감지 모델을 선택하는 것은 정확도, 속도 및 계산 비용 간의 중요한 절충을 수반합니다. 이 페이지에서는 Baidu의 PP-YOLOE+와 YOLOv9라는 두 가지 강력한 단일 단계 감지기 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 분석합니다. 두 모델 모두 매우 유능하지만 뚜렷한 설계 철학과 생태계에서 나오므로 정보에 입각한 의사 결정에 필수적인 비교입니다.
PP-YOLOE+: PaddlePaddle 생태계 내의 높은 정확도
PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus)는 Baidu에서 PaddleDetection 제품군의 일부로 개발한 객체 감지 모델입니다. 특히 PaddlePaddle 딥 러닝 프레임워크에 최적화되어 정확도와 효율성의 강력한 균형을 제공하기 위해 도입되었습니다.
- 작성자: PaddlePaddle 작성자
- Organization: Baidu
- 날짜: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- 문서: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 주요 기능
PP-YOLOE+는 몇 가지 주요 개선 사항을 통해 YOLO 아키텍처를 기반으로 하는 앵커 프리(anchor-free) 단일 단계 검출기입니다. 확장 가능한 백본과 넥, 효율적인 작업 정렬 헤드를 사용하여 성능을 향상시킵니다. 이 모델은 매우 실용적이고 효율적으로 설계되었지만 주요 최적화는 PaddlePaddle 프레임워크를 위한 것이므로 해당 생태계 외부에서 작업하는 개발자에게는 중요한 고려 사항이 될 수 있습니다.
강점
- 강력한 성능 균형: PP-YOLOE+는 속도와 정확성 간에 칭찬할 만한 균형을 제공하므로 다양한 실시간 애플리케이션에 적합한 옵션입니다.
- 확장 가능한 모델: 여러 크기(t, s, m, l, x)로 제공되므로 개발자는 특정 리소스 제약 조건에 맞는 모델을 선택할 수 있습니다.
- PaddlePaddle에 최적화됨: 이미 Baidu PaddlePaddle 생태계에 투자한 팀의 경우 PP-YOLOE+는 원활하고 고도로 최적화된 경험을 제공합니다.
약점
- 생태계 의존성: 이 모델은 PaddlePaddle 프레임워크와 긴밀하게 결합되어 있으며, 이는 PyTorch에 비해 사용자 기반과 커뮤니티가 작습니다. 이로 인해 통합, 배포 및 커뮤니티 지원을 찾는 데 어려움이 있을 수 있습니다.
- 제한적인 다용도성: PP-YOLOE+는 주로 객체 감지에 중점을 둡니다. 대조적으로 YOLOv8과 같은 Ultralytics 생태계 내의 모델은 분할, 분류 및 포즈 추정을 포함한 여러 작업에 대한 통합 프레임워크를 제공합니다.
- 낮은 효율성: 성능 표에서 볼 수 있듯이 PP-YOLOE+ 모델은 YOLOv9와 같은 최신 아키텍처와 비슷한 정확도 수준을 달성하기 위해 더 많은 파라미터와 FLOP를 필요로 하는 경우가 많습니다.
이상적인 사용 사례
PP-YOLOE+는 Baidu PaddlePaddle 생태계에 깊이 통합된 개발자 및 조직에 가장 적합합니다. 개발 환경이 이미 Baidu의 도구와 일치하는 표준 객체 감지 작업에 적합한 선택입니다.
YOLOv9: 향상된 학습을 위한 Programmable Gradient Information
Ultralytics YOLOv9은(는) 심층 신경망에서 정보 손실의 근본적인 문제를 해결하여 실시간 객체 감지에서 획기적인 발전을 이루었습니다. 정확성과 효율성을 모두 높이기 위해 PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network)과 같은 획기적인 개념을 도입했습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- 문서: https://docs.ultralytics.com/models/yolov9/
아키텍처 및 주요 기능
YOLOv9의 핵심 혁신인 PGI와 GELAN은 YOLOv9를 차별화합니다. PGI는 정보 병목 현상 문제를 완화하여 네트워크 업데이트에 사용할 수 있는 신뢰할 수 있는 기울기 정보를 보장하며, 이는 딥 네트워크 훈련에 매우 중요합니다. GELAN은 파라미터 활용률과 계산 속도를 최적화하는 매우 효율적인 아키텍처를 제공합니다.
원래 연구는 Academia Sinica에서 비롯되었지만, Ultralytics 생태계에 통합되어 비교할 수 없는 이점을 제공합니다.
- 사용 편의성: YOLOv9는 간소화된 사용자 경험, 간단한 Python API 및 광범위한 설명서와 함께 제공되므로 초보자와 전문가 모두가 접근할 수 있습니다.
- 잘 관리되는 에코시스템: 활발한 개발, 강력한 커뮤니티 지원, 잦은 업데이트, 그리고 노코드 훈련 및 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 통해 이점을 얻습니다.
- 학습 효율성: 이 모델은 효율적인 학습 프로세스를 제공하며, 즉시 사용 가능한 사전 학습된 가중치를 통해 빠른 개발 및 배포 주기를 가능하게 합니다.
- 더 낮은 메모리 요구 사항: 다른 Ultralytics YOLO 모델과 마찬가지로 YOLOv9는 훈련 및 추론 중에 메모리 효율적으로 설계되었으며, 이는 Transformers와 같이 더 많은 리소스를 요구하는 아키텍처에 비해 상당한 이점입니다.
강점
- 최첨단 정확도: YOLOv9는 COCO와 같은 벤치마크에서 새로운 정확도 표준을 설정하며, 이전 모델보다 뛰어난 성능을 보입니다.
- 탁월한 효율성: PGI 및 GELAN 덕분에 YOLOv9는 PP-YOLOE+ 및 기타 경쟁사보다 훨씬 적은 파라미터와 계산 리소스(FLOPs)로 더 높은 정확도를 달성합니다.
- 정보 보존: PGI는 심층 네트워크에서 정보 손실 문제를 효과적으로 해결하여 더 나은 모델 일반화 및 성능으로 이어집니다.
- 다재다능함: YOLOv9의 강력한 아키텍처는 Ultralytics 프레임워크와 결합되어 YOLOv8 및 YOLO11과 같은 모델의 특징인 다중 작업 애플리케이션에 대한 잠재력을 보유하고 있습니다.
약점
- 더 새로운 모델: 최신 릴리스이므로, 커뮤니티에서 제공하는 튜토리얼 및 타사 통합의 범위는 아직 확장되고 있지만 Ultralytics 생태계에 의해 채택이 가속화되고 있습니다.
- 학습 리소스: YOLOv9는 성능 수준에 비해 매우 효율적이지만, 가장 큰 YOLOv9 변형 모델(예: YOLOv9-E)을 학습하려면 여전히 상당한 컴퓨팅 성능이 필요할 수 있습니다.
이상적인 사용 사례
YOLOv9은 최고의 정확도와 효율성을 요구하는 애플리케이션에 이상적인 선택입니다. 자율 주행, 고급 보안 시스템 및 고정밀 로봇 공학과 같은 복잡한 시나리오에서 뛰어난 성능을 발휘합니다. 또한 효율적인 설계 덕분에 리소스가 제한된 에지 장치에 배포하기에 적합한 소형 버전도 있습니다.
정면 대결 성능 비교
모델을 직접 비교할 때 YOLOv9은 효율성과 정확도 면에서 분명한 이점을 보여줍니다. 예를 들어 YOLOv9-C 모델은 PP-YOLOE+l 모델(52.9)보다 더 높은 mAP(53.0)를 달성하면서 파라미터(25.3M 대 52.2M)와 FLOP(102.1B 대 110.07B)를 약 절반만 사용합니다. 이러한 뛰어난 파라미터 및 계산 효율성은 YOLOv9가 더 낮은 하드웨어 요구 사항으로 더 나은 성능을 제공할 수 있음을 의미하므로 보다 비용 효율적이고 확장 가능한 솔루션이 됩니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
결론 및 권장 사항
PP-YOLOE+는 기본 PaddlePaddle 생태계 내에서 유능한 모델이지만, YOLOv9은 대다수의 개발자 및 애플리케이션에 더 나은 선택으로 부상하고 있습니다. 아키텍처 혁신을 통해 뛰어난 컴퓨팅 효율성으로 최첨단 정확도를 제공합니다.
주요 차별화 요소는 에코시스템입니다. YOLOv9를 선택하면 포괄적이고 사용자 친화적인 Ultralytics 에코시스템에 액세스할 수 있습니다. 여기에는 광범위한 문서, 활발한 커뮤니티 지원, 간단한 API 및 Ultralytics HUB와 같은 강력한 도구가 포함되어 있으며, 이는 전체 개발 및 배포 파이프라인을 간소화합니다.
최고의 성능, 사용 편의성 및 다재다능함의 균형을 추구하는 개발자에게는 Ultralytics 모델을 탐색하는 것이 좋습니다. YOLOv9은 높은 정확도 요구 사항에 적합한 탁월한 선택이지만, 입증된 실적과 다중 작업 기능을 갖춘 Ultralytics YOLOv8 또는 광범위한 비전 AI 작업에서 최첨단 성능을 제공하는 최신 Ultralytics YOLO11에도 관심이 있을 수 있습니다.