YOLOv9 대 PP-YOLOE+: 기술 비교
최적의 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 엔지니어에게 매우 중요한 결정이며, 높은 정밀도에 대한 요구와 계산상의 제약 사이의 균형을 맞추는 일입니다. 이 종합 가이드에서는 YOLOv9와 새로운 그라데이션 정보 기법을 도입한 최첨단 모델, 그리고 PaddlePaddle 프레임워크에 최적화된 강력한 검출기인 PP-YOLOE+를 비교합니다. 두 모델의 아키텍처 혁신, 벤치마크 성능, 배포 적합성을 분석하여 컴퓨터 비전 애플리케이션에 가장 적합한 모델을 결정하는 데 도움을 드립니다.
YOLOv9: 학습 향상을 위한 프로그래밍 가능한 그라데이션 정보
YOLOv9 은 실시간 객체 감지기의 진화에 있어 중요한 도약을 의미합니다. 2024년 초에 출시된 이 제품은 심층 신경망의 정보 손실과 관련된 근본적인 문제를 해결하여 정확도와 파라미터 효율성에 대한 새로운 벤치마크를 설정합니다.
저자: 저자: 왕치엔야오, 홍위안 마크 리아오
조직:대만 아카데미아 시니카 정보과학연구소
날짜: 2024-02-21
아카이브:https://arxiv.org/abs/2402.13616
깃허브:https://github.com/WongKinYiu/yolov9
문서ultralytics
이 아키텍처에는 두 가지 획기적인 개념이 도입되었습니다: 프로그래머블 그라데이션 정보(PGI) 와 일반화된 효율적인 계층 집계 네트워크(GELAN)입니다. 네트워크가 더 깊어지면 손실 함수를 계산하는 데 필수적인 데이터가 손실될 수 있는데, 이를 정보 병목 현상이라고 합니다. PGI는 보조 가역 분기를 통해 안정적인 그라데이션을 생성하여 딥 피처가 중요한 정보를 유지할 수 있도록 함으로써 이 문제를 해결합니다. 동시에 GELAN은 매개변수 활용을 최적화하여 심층 컨볼루션 기반 아키텍처에 비해 더 적은 컴퓨팅 리소스로도 뛰어난 정확도를 달성할 수 있습니다.
Ultralytics 에코시스템에 통합된 YOLOv9 복잡한 워크플로를 간소화하는 사용자 중심 설계의 이점을 누릴 수 있습니다. 개발자는 교육, 검증, 배포를 위해 통합된 Python API를 활용할 수 있어 프로토타입에서 프로덕션까지 걸리는 시간을 대폭 단축할 수 있습니다. 또한 이러한 통합은 다양한 데이터 세트 및 내보내기 형식과의 호환성을 보장합니다.
PP-YOLOE+: PaddlePaddle 생태계 내의 높은 정확도
PP-YOLOE+는 패들감지 제품군의 일부로 바이두에서 개발한 PP-YOLOE의 발전된 버전입니다. 이 버전은 특히 PaddlePaddle 프레임워크에서 효율적으로 실행되도록 특별히 설계되어 산업 애플리케이션을 위한 속도와 정밀도의 강력한 균형을 제공합니다.
저자들: PaddlePaddle 저자
조직:바이두
날짜: 2022-04-02
아카이브:https://arxiv.org/abs/2203.16250
깃허브PaddlePaddle
문서PaddlePaddle
PP-YOLOE+는 앵커 프리 메커니즘을 채택하여 미리 정의된 앵커 박스가 필요하지 않으므로 하이퍼파라미터 튜닝 프로세스가 간소화됩니다. 백본은 일반적으로 CSPRepResNet을 활용하며, 작업 정렬 학습(TAL)으로 구동되는 고유한 헤드 설계가 특징입니다. 이 접근 방식은 분류 및 로컬라이제이션 작업을 정렬하여 탐지 결과의 품질을 향상시킵니다. 뛰어난 성능을 자랑하는 PP-YOLOE+는 PaddlePaddle 에코시스템과 긴밀하게 결합되어 다음에서 표준화된 팀에게 학습 곡선을 제시할 수 있습니다. PyTorch 또는 TensorFlow 표준화된 팀에게 학습 곡선을 제공할 수 있습니다.
에코시스템 종속성
PP-YOLOE+는 경쟁력 있는 성능을 제공하지만, PaddlePaddle 프레임워크에 의존하기 때문에 서구 연구 커뮤니티에서 일반적으로 사용되는 광범위한 PyTorch 도구 및 라이브러리와의 상호 운용성이 제한될 수 있습니다.
성능 분석: 속도, 정확도 및 효율성
이 두 아키텍처를 비교할 때 YOLOv9 은 파라미터 효율성과 피크 정확도 모두에서 분명한 이점을 보여줍니다. GELAN의 통합으로 YOLOv9 시각적 데이터를 보다 효과적으로 처리할 수 있어 COCO 데이터 세트에서 평균 평균 정밀도(mAP) 점수가 높아지는 동시에 지연 시간은 더 낮게 유지되는 경우가 많습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
주요 내용
- 매개변수 효율성: YOLOv9 모델은 485만 개의 파라미터를 사용하는 PP-YOLOE+t 모델보다 훨씬 적은 2.0만 개의 파라미터를 사용하면서도 대형 모델과 비슷한 성능을 달성합니다. 따라서 YOLOv9 저장 공간이 제한된 엣지 AI 디바이스에 특히 적합합니다.
- 최고 정확도:YOLOv9 약 40% 적은 파라미터(57.3M 대 98.42M)를 사용했음에도 불구하고 가장 큰 PP-YOLOE+x 모델(54.7% mAP)을 뛰어넘는 55.6%의 놀라운 mAP 달성했습니다. 이는 특징 추출 기능을 극대화하는 데 있어 GELAN의 아키텍처적 우월성을 보여줍니다.
- 추론 속도: PP-YOLOE+s는 T4 GPU에서 원시 지연 시간에서 약간의 우위를 보이지만, 일반적으로 YOLOv9 모델이 더 나은 절충안을 제공하여 비슷한 계산 비용으로 훨씬 더 높은 정확도를 제공합니다. 예를 들어, YOLOv9 정확도(53.0% 대 52.9%)에서 PP-YOLOE+l보다 성능이 뛰어나면서도 더 빠르고(7.16ms 대 8.36ms) 더 가볍습니다.
교육 방법론 및 사용 편의성
개발자 경험은 두 모델 간에 크게 다른데, 이는 주로 기본 프레임워크와 에코시스템 지원에 따라 달라집니다.
Ultralytics 에코시스템의 이점
선택 YOLOv9 을 선택하면 머신 러닝 수명 주기를 간소화하도록 설계된 포괄적인 도구 모음에 액세스할 수 있습니다.
- 간단한 API: 복잡한 상용구를 추상화하여 몇 줄의 코드만 있으면 모델을 학습할 수 있습니다.
- 메모리 효율성: Ultralytics YOLO 모델은 트랜스포머 기반 아키텍처에 비해 트레이닝 중 메모리 사용량을 낮추도록 최적화되어 있어 소비자급 하드웨어에서 더 큰 배치 크기를 사용할 수 있습니다.
- 다목적성: 탐지 외에도, Ultralytics 프레임워크는 인스턴스 세분화, 포즈 추정 및 분류를 지원하여 다양한 작업을 위한 통합 인터페이스를 제공합니다.
- 효율적인 훈련: 고급 데이터 증강과 즉시 사용 가능한 사전 학습된 가중치를 통해 개발자는 더 빠르게 컨버전스를 달성하여 귀중한 GPU 시간을 절약할 수 있습니다.
Ultralytics 간소화된 워크플로
자동화된 하이퍼파라미터 튜닝 및 실험 추적을 위해 강력한 Ultralytics 엔진을 활용하여 단 몇 줄의 Python YOLOv9 모델을 로드, 훈련 및 검증할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
PaddlePaddle 환경
PP-YOLOE+를 사용하려면 패들감지 라이브러리가 필요합니다. 강력하지만 Baidu 에코시스템에 익숙해야 합니다. 환경을 설정하고, 데이터 세트를 필요한 형식으로 변환하고, 배포를 위해 모델을 내보내는 작업은 PaddlePaddle 인프라에 아직 내장되어 있지 않은 사용자에게는 더 복잡할 수 있습니다.
이상적인 사용 사례
각 모델의 강점을 이해하면 특정 실제 애플리케이션에 적합한 도구를 선택하는 데 도움이 됩니다.
YOLOv9 선택해야 할 때
- 자율주행 시스템: 정확도를 극대화하는 것이 안전을 위해 중요한 자율 주행 차량과 로봇 공학에서 YOLOv9 우수한 mAP 필요한 신뢰성을 제공합니다.
- 엣지 배포: 가벼운 YOLOv9 인원 계산이나 스마트 리테일 분석과 같은 작업을 위해 라즈베리 파이 또는 NVIDIA 젯슨 장치에 배포하는 데 적합합니다.
- 연구 및 개발: 잘 관리된 에코시스템과 PyTorch 지원으로 새로운 컴퓨터 비전 솔루션의 프로토타입을 만들거나 객체 추적 기능을 통합하는 연구자에게 이상적입니다.
- 리소스가 제한된 환경: 제한된 VRAM으로 고성능을 필요로 하는 애플리케이션은 YOLOv9 효율적인 아키텍처와 낮은 메모리 공간의 이점을 누릴 수 있습니다.
PP-YOLOE+를 선택해야 하는 경우
- PaddlePaddle 사용자: 이미 Baidu의 인프라를 활용하고 있는 조직을 위해 PP-YOLOE+는 원활한 통합과 네이티브 최적화를 제공합니다.
- 산업 검사(중국): 아시아 시장에서의 높은 채택률을 고려할 때, 특정 패들 추론 하드웨어에 의존하는 제조 파이프라인에서 자주 볼 수 있습니다.
결론
두 모델 모두 객체 감지 분야에서 강력한 경쟁자입니다, YOLOv9 이 대다수의 글로벌 개발자와 기업에게 탁월한 선택으로 떠오르고 있습니다. 프로그래밍 가능한 그라디언트 정보(PGI)를 혁신적으로 사용하는 이 모델은 훨씬 적은 수의 파라미터를 사용하면서도 주요 지표에서 PP-YOLOE+보다 뛰어난 효율성과 함께 최첨단 정확도를 제공합니다.
또한, Ultralytics 에코시스템은 탁월한 사용 편의성, 광범위한 문서, 활기찬 커뮤니티를 제공함으로써 YOLOv9 수준을 한 단계 높여줍니다. 보안 경보 시스템을 구축하든, 의료 이미지를 분석하든, 스마트 시티 인프라를 개발하든, YOLOv9 성공에 필요한 성능 균형과 다용도성을 제공합니다.
고려할 다른 모델
최첨단 비전 AI를 탐색하고 있다면 Ultralytics 다른 강력한 모델도 고려해 보세요:
- YOLO11: 최첨단 애플리케이션을 위해 더욱 빠른 속도와 높은 정확도를 제공하는 YOLO 시리즈의 최신 진화 버전입니다.
- YOLOv8: 감지, 세분화, 포즈 및 OBB 작업을 지원하는 매우 다재다능한 업계 표준입니다.
- RT-DETR: 정확도가 뛰어난 실시간 트랜스포머 기반 감지기로, CNN 기반 아키텍처의 대안을 제공합니다.