콘텐츠로 건너뛰기

PP-YOLOE+ 대 YOLOv9: 현대 객체 탐지 기술에 대한 심층 분석

실시간 컴퓨터 비전 분야는 연구자와 개발자들이 정확도와 추론 속도의 한계를 끊임없이 넓혀가며 지속적으로 변화하고 있습니다. PP-YOLOE+와 YOLOv9을 비교할 때, 우리는 모델 아키텍처와 생태계 설계에 있어 두 가지 상이한 철학을 살펴보고 있습니다.

이 포괄적인 기술 비교 분석은 각 모델의 아키텍처 혁신, 성능 지표, 훈련 방법론 및 이상적인 사용 사례를 분석하여 다음 배포에 적합한 객체 탐지 모델을 선택하는 데 도움을 드립니다.

모델 계보와 기술적 기반

이러한 모델들의 기원과 설계적 선택을 이해하는 것은 컴퓨터 비전 프로젝트 내에서의 적합성을 판단하는 데 매우 중요합니다.

PP-YOLOE+ 개요

바이두의 PaddlePaddle 개발한 PP-YOLOE+는 2022년 4월 2일에 공개되었습니다. 이 모델은 PaddleDetection 프레임워크 내 기존 버전을 기반으로 하여 고성능 객체 탐지 기능을 제공합니다.

PP-YOLOE+는 PaddlePaddle 내 배포를 위해 고도로 최적화된 강력한 앵커 프리 아키텍처를 도입합니다. 수정된 CSPRepResNet 백본과 ET-헤드를 활용하여 특징 추출 및 바운딩 박스 회귀 성능을 향상시킵니다. 높은 평균 정밀도(mAP)를 달성하지만, PaddlePaddle 대한 의존성으로 인해 TensorFlow 익숙한 개발자에게는 통합 과정에서 마찰이 발생할 수 있습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

YOLOv9

대만 중앙연구원 정보과학연구소의 왕젠야오(王建耀)와 리아오홍위안(廖宏源)이 소개한 YOLOv9 딥러닝 정보 병목 현상을 효율적으로 처리하는 데 있어 중대한 도약을 YOLOv9 .

  • 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
  • Organization: Institute of Information Science, Academia Sinica, Taiwan
  • 날짜:21
  • Arxiv:2402.13616
  • GitHub:WongKinYiu/yolov9

YOLOv9 주요 혁신은 프로그래머블 그라디언트 정보(PGI)로, 특징들이 심층 신경망을 통과할 때 데이터 손실을 방지합니다. 일반화된 효율적 레이어 집계 네트워크(GELAN)와 결합된 YOLOv9 매개변수 효율성과 계산 흐름을 YOLOv9 . 또한 Ultralytics 기본적으로 통합되어 연구 및 상업적 응용 모두에서 높은 접근성을 제공합니다.

9에 대해 자세히 알아보기

기타 Ultralytics

최첨단 옵션을 탐색 중이라면 다음에도 관심이 있을 수 있습니다 YOLO11RT-DETR도 관심을 가질 수 있습니다. 이 두 알고리즘은 트랜스포머 기반 정밀도와 실시간 에지 성능 사이에서 서로 다른 균형을 제공합니다.

성능 및 지표 비교

원시 성능을 분석할 때 YOLOv9 탁월한 매개변수 효율성을 YOLOv9 . 더 적은 매개변수와 FLOPs를 요구하면서도 동등하거나 더 우수한 정확도를 달성하여, 모델 훈련 중 더 낮은 VRAM 요구 사항으로 이어집니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

표에서 볼 수 있듯이, YOLOv9c는 비교 가능한 PP-YOLOE+l(52.2M)보다 훨씬 적은 매개변수(25.3M) mAP 53.0 mAP 우수한 성능을 달성합니다. 이러한 낮은 메모리 사용량은 제한된 GPU 작업하는 개발자에게 YOLOv9 나은 YOLOv9 만듭니다.

생태계, 다용도성, 사용 편의성

YOLOv9 결정적 장점은 잘 관리되는 Ultralytics 원활한 통합에 YOLOv9 . PP-YOLOE+는 복잡한 PaddlePaddle 파일을 탐색해야 하는 반면, YOLOv9 간소화된 Python 이점을 YOLOv9 .

Ultralytics Python 통해 개발자는 최소한의 반복적인 코드로 사전 훈련된 가중치를 로드하고, 데이터 증강을 관리하며, 훈련을 시작할 수 있습니다.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

또한 Ultralytics 타의 추종을 불허하는 다용도성을 제공합니다. 바운딩 박스 탐지를 넘어, 이 프레임워크는 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB) 탐지를 기본적으로 지원합니다. 이를 통해 복잡한 실제 파이프라인에 모델을 적용하는 작업이 매우 효율적으로 이루어집니다.

수출 옵션

Ultralytics 사용하여 훈련된 모델은 다음과 같은 다양한 형식으로 내보낼 수 있습니다. TensorRTOpenVINO를 포함한 다양한 형식으로 내보낼 수 있어, 다양한 하드웨어에서 고도로 최적화된 추론을 보장합니다.

사용 사례 및 권장 사항

PP-YOLOE+와 YOLOv9 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLOv9 .

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 다음에 대한 강력한 선택입니다:

  • PaddlePaddle 통합: 기존 인프라가 바이두의 PaddlePaddle 프레임워크 및 툴링을 기반으로 구축된 조직.
  • 패들 라이트 에지 배포: 패들 라이트 또는 패들 추론 엔진 전용으로 고도로 최적화된 추론 커널을 갖춘 하드웨어에 배포합니다.
  • 고정밀 서버 측 탐지: 프레임워크 의존성이 문제가 되지 않는 강력한 GPU 최대 탐지 정확도를 우선시하는 시나리오.

9 선택해야 할 때

YOLOv9 다음에 권장YOLOv9 :

  • 정보 병목 연구: 프로그래머블 그라디언트 정보(PGI) 및 일반화된 효율적 레이어 집계 네트워크(GELAN) 아키텍처를 연구하는 학술 프로젝트.
  • 경사 흐름 최적화 연구: 훈련 과정에서 심층 신경망 레이어에서 발생하는 정보 손실을 이해하고 완화하는 데 초점을 맞춘 연구.
  • 고정밀도 탐지 벤치마킹: YOLOv9 강력한 COCO 성능이 아키텍처 비교를 위한 기준점으로 필요한 시나리오들.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

미래를 내다보며: YOLO26의 장점

PP-YOLOE+와 YOLOv9 모두 YOLOv9 , 새롭게 출시된 YOLO26은 생산 환경을 위한 확실한 차세대 솔루션입니다. 2026년 1월 출시된 YOLO26은 엣지 컴퓨팅 및 클라우드 배포를 위한 새로운 기준을 제시합니다. 획기적인 혁신을 바탕으로, 모든 신규 컴퓨터 비전 프로젝트에 YOLO26을 적극 권장합니다:

  • 엔드투엔드 NMS 설계: YOLO26은 기본적으로 엔드투엔드 방식으로, 비최대 억제(NMS) 후처리 과정이 전혀 필요하지 않습니다. 이는 배포 파이프라인을 크게 단순화하고 지연 시간을 줄여줍니다.
  • 최대 43% 빠른 CPU : 엣지 컴퓨팅을 위해 아키텍처를 특별히 최적화함으로써, YOLO26은 전용 GPU가 없는 하드웨어에서도 훨씬 더 빠른 성능을 발휘합니다.
  • DFL 제거: 분포 초점 손실(Distribution Focal Loss)이 제거되어 내보내기가 단순화되었으며, 저전력 에지 장치와의 호환성이 크게 개선되었습니다.
  • MuSGD 최적화기: 대규모 언어 모델 훈련 기법(Moonshot AI의 Kimi K2 등)에서 영감을 받아 개발된 이 SGD 뮤온의 하이브리드 방식은 매우 안정적인 훈련 역학과 빠른 수렴을 보장합니다.
  • ProgLoss + STAL: 이 고급 손실 함수들은 소형 물체 인식에서 현저한 개선을 가져오며, 이는 항공 영상로봇 공학에 필수적인 업그레이드입니다.
  • 특정 작업에 대한 개선 사항: YOLO26은 분할을 위한 다중 스케일 프로토(multi-scale proto) 및 자세 추정을 위한 잔차 로그 가능도 추정(RLE)과 같은 특정 작업을 위한 맞춤형 아키텍처를 포함합니다.

Ultralytics 통해 YOLO26 모델을 손쉽게 훈련하고 배포할 수 있습니다. 이 플랫폼은 데이터셋 주석 작업, 클라우드 훈련, 모델 모니터링을 위한 올인원 솔루션입니다.

실제 응용 분야

이러한 아키텍처 중에서 선택하는 것은 종종 대상 배포 환경에 따라 결정됩니다.

PP-YOLOE+는 산업 제조 센터, 특히 PaddlePaddle 및 바이두의 하드웨어 스택이 기업 인프라에 깊이 내재된 지역에서 자주 배포됩니다. 엄격한 실시간 제약보다 절대적인 정밀도가 우선시되는 정적 이미지 분석에서 탁월한 성능을 발휘합니다.

YOLOv9 동적 환경에서 신속한 실시간 추론이 필요한 상황에서 탁월한 성능을 발휘합니다. 우수한 매개변수 효율성 덕분에 자율 드론 항법 및 에지 기반 보안 시스템에 이상적입니다. 또한 낮은 VRAM 소비량은 소비자용 GPU로 훈련하는 연구자들의 진입 장벽을 낮춥니다.

스마트 시티 교통 관리와 고속 로봇 공학 분야에서 최고의 성능을 발휘하기 위해서는 최신 YOLO26이 타의 추종을 불허하며, NMS 현상의 부담 없이 종단 간 효율성을 제공합니다.


댓글