콘텐츠로 건너뛰기

PP-YOLOE+와 YOLOv9: 기술 비교

컴퓨터 비전 프로젝트를 위한 최적의 아키텍처를 선택하려면 빠르게 진화하는 모델의 환경을 탐색해야 합니다. 이 페이지에서는 바이두의 PP-YOLOE+와 YOLOv9의 두 가지 정교한 단일 단계 객체 감지기를 자세히 비교합니다. 아키텍처 혁신, 성능 메트릭, 에코시스템 통합을 분석하여 정보에 입각한 결정을 내릴 수 있도록 도와드립니다. 두 모델 모두 뛰어난 성능을 보여주지만, 서로 다른 설계 철학과 프레임워크 종속성을 나타냅니다.

PP-YOLOE+: PaddlePaddle 생태계 내의 높은 정확도

PP-YOLOE+는 패들감지 제품군의 일부로 바이두에서 개발한 PP-YOLOE의 발전된 버전입니다. 정밀도와 추론 속도 간의 균형 잡힌 절충점을 제공하도록 설계되었으며, 특히 다음과 같은 용도에 최적화되어 있습니다. PaddlePaddle 딥 러닝 프레임워크에 최적화되어 있습니다.

저자들: PaddlePaddle 저자
조직:바이두
날짜: 2022-04-02
아카이브:https://arxiv.org/abs/2203.16250
깃허브PaddlePaddle
문서:PaddleDetection PP-YOLOE+ README

아키텍처 및 주요 기능

PP-YOLOE+는 앵커가 없는 단일 단계 탐지기로 작동합니다. 이 솔루션은 CSPRepResNet 백본을 기반으로 구축되며 분류 작업과 로컬라이제이션 작업 간의 정렬을 개선하기 위해 작업 정렬 학습(TAL) 전략을 활용합니다. 핵심 기능은 정확도를 유지하면서 계산 오버헤드를 줄여주는 효율적인 작업 정렬 헤드(ET-Head)입니다. 이 모델은 훈련 중 클래스 불균형을 처리하기 위해 다양 초점 손실 기능을 사용합니다.

강점과 약점

PP-YOLOE+의 주요 강점은 바이두의 하드웨어 및 소프트웨어 스택에 최적화되어 있다는 점입니다. 표준 객체 감지 벤치마크에서 우수한 성능을 발휘하는 확장 가능한 모델(s, m, l, x)을 제공합니다.

그러나 PaddlePaddle 생태계에 대한 의존도가 높다는 점은 광범위한 AI 커뮤니티에 큰 장애물이 되고 있습니다. PyTorch. 기존 PyTorch 워크플로를 PaddlePaddle 마이그레이션하는 것은 리소스 집약적일 수 있습니다. 또한 최신 아키텍처에 비해 PP-YOLOE+는 비슷한 정확도를 달성하기 위해 더 많은 파라미터가 필요하므로 제한된 디바이스의 스토리지와 메모리에 영향을 미칩니다.

PP-YOLOE+에 대해 자세히 알아보세요.

YOLOv9: 학습 향상을 위한 프로그래밍 가능한 그라데이션 정보

Ultralytics YOLOv9 은 심층 신경망에 내재된 '정보 병목' 문제를 해결하여 실시간 객체 감지의 패러다임 전환을 도입합니다.

저자: 저자: 왕치엔야오, 홍위안 마크 리아오
조직:대만 아카데미아 시니카 정보과학연구소
날짜: 2024-02-21
아카이브:https://arxiv.org/abs/2402.13616
깃허브:https://github.com/WongKinYiu/yolov9
문서ultralytics

아키텍처 및 주요 기능

YOLOv9 두 가지 획기적인 개념이 통합되어 있습니다: 프로그래밍 가능한 그라데이션 정보(PGI)일반화된 효율적인 레이어 집계 네트워크(GELAN)입니다.

  • PGI: 네트워크가 심화됨에 따라 피드포워드 프로세스 중에 입력 데이터 정보가 손실되는 경우가 많습니다. PGI는 안정적인 그라데이션 생성을 보장하는 보조 감독 분기를 제공하여 추론 비용을 추가하지 않고도 모델이 객체 추적 및 감지 작업에 중요한 특징을 '기억'할 수 있도록 합니다.
  • GELAN: 이 아키텍처 설계는 매개변수 효율성을 최적화하여 깊이별 컨볼루션을 사용하는 기존 백본에 비해 더 적은 계산 리소스(FLOP)로 더 높은 정확도를 달성할 수 있도록 합니다.

알고 계셨나요?

YOLOv9 PGI 기술은 이전에는 번거로운 심층 감독 방법이 필요했던 정보 병목 문제를 해결합니다. 그 결과 더 가볍고 더 정확한 모델을 만들어 성능 균형을 크게 개선합니다.

강점과 약점

YOLOv9 훈련 효율성과 파라미터 활용도가 뛰어납니다. 실시간 속도를 유지하면서 이전 반복을 능가하는 정확도로 COCO 데이터 세트에서 최첨단 결과를 달성합니다. Ultralytics 에코시스템에 통합되어 있어 내보내기 모드를 통해 ONNX 및 TensorRT 같은 형식으로 간편하게 배포하는 등 잘 관리된 에코시스템의 이점을 누릴 수 있습니다.

잠재적으로 고려할 수 있는 사항은 가장 큰 변종YOLOv9)은 학습에 상당한 GPU 리소스가 필요하다는 점입니다. 그러나 추론 메모리 풋프린트는 여전히 경쟁력이 있어 트랜스포머 기반 모델과 관련된 높은 비용을 피할 수 있습니다.

YOLOv9 대해 자세히 알아보기

비교 성능 분석

직접 비교해보면 YOLOv9 더 우수한 효율성을 보여줍니다. 예를 들어, YOLOv9 모델은 약 절반의 파라미터 (25.3M 대 52.2M)를 사용하면서 PP-YOLOE+l(52.9%)보다 더 높은 mAP (53.0%)를 달성합니다. 정확도 저하 없이 모델 크기를 획기적으로 줄인 것은 GELAN 아키텍처의 효율성을 잘 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

표는 비슷한 정확도 목표의 경우 YOLOv9 지속적으로 더 적은 컴퓨팅 리소스를 필요로 한다는 것을 보여줍니다. YOLOv9 모델은 한계를 더 뛰어넘어 55.6%의 mAP 달성하여 가장 큰 PP-YOLOE+ 변형보다 확실한 이점을 제공합니다.

Ultralytics 이점

PP-YOLOE+도 유능한 검출기이지만, Ultralytics 프레임워크를 통해 YOLOv9 선택하면 사용 편의성과 다양성 측면에서 뚜렷한 이점을 누릴 수 있습니다.

간소화된 사용자 경험

Ultralytics 개발자 친화적인 환경을 우선시합니다. PaddleDetection에 필요한 복잡한 구성 파일과 달리, Ultralytics 모델은 단 몇 줄의 Python 코드만으로 로드, 학습 및 배포할 수 있습니다. 따라서 엔지니어와 연구원의 진입 장벽이 크게 낮아집니다.

다목적성 및 에코시스템

Ultralytics 인스턴스 세분화, 포즈 추정, OBB(방향성 경계 상자) 감지 등 단순한 감지를 넘어 다양한 작업을 지원합니다. 이러한 다용도성 덕분에 개발자는 단일 통합 API를 사용하여 다양한 문제를 해결할 수 있습니다. 또한 활발한 커뮤니티와 잦은 업데이트를 통해 사용자는 최신 최적화와 TensorBoard 및 MLflow와 같은 도구와의 통합에 액세스할 수 있습니다.

코드 예시: YOLOv9 사용

다음 예는 Ultralytics Python API를 사용하여 YOLOv9 추론을 얼마나 쉽게 실행할 수 있는지 보여줍니다. 이러한 단순성은 PP-YOLOE+에 종종 요구되는 더 자세한 설정과 대조적입니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display results
results[0].show()

이상적인 사용 사례

  • PP-YOLOE+: 이미 PaddlePaddle 생태계에 깊이 통합된 팀 또는 PaddlePaddle 하드웨어 지원이 지배적인 지역의 특정 레거시 산업 애플리케이션에 가장 적합합니다.
  • YOLOv9: 자율 주행 차량, 실시간 비디오 분석, 메모리 요구 사항과 스토리지가 제약이 있는 엣지 배포 등 최고의 정확도 대비 효율을 요구하는 애플리케이션에 이상적입니다.

결론 및 권장 사항

대부분의 개발자와 조직은 최신 아키텍처(GELAN/PGI), 뛰어난 파라미터 효율성, 그리고 Ultralytics 에코시스템의 강력한 지원으로 인해 YOLOv9 탁월한 선택으로 여기고 있습니다. 이 솔루션은 즉시 사용 가능한 사전 학습된 가중치와 원활한 내보내기 기능을 갖춘 미래 지향적인 솔루션을 제공합니다.

더 다양한 기능과 빠른 속도를 원하신다면 YOLO11를 살펴보는 것도 좋습니다. YOLO11 성능과 지연 시간 사이의 균형을 더욱 개선하여 탐지, 세분화, 분류 작업을 위한 최첨단 기능을 컴팩트한 패키지로 제공합니다.

입증된 성능에 관심이 있는 분들을 위한 제품입니다, YOLOv8 은 광범위한 커뮤니티 리소스와 타사 통합 기능을 갖춘 매우 안정적인 옵션입니다.


댓글