Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 대 YOLOv9#

실시간 컴퓨터 비전 분야는 연구자와 개발자들이 정확도와 추론 속도의 한계를 끊임없이 확장함에 따라 지속적으로 변화하고 있습니다. PP-YOLOE+YOLOv9을 비교할 때, 우리는 모델 아키텍처와 생태계 설계 측면에서 서로 다른 두 가지 철학을 살펴보고 있습니다.

본 종합 기술 비교는 아키텍처 혁신, 성능 지표, 학습 방법론 및 이상적인 활용 사례를 분석하여, 다음 배포를 위해 적합한 객체 탐지 모델을 선택하도록 돕습니다.

Link to this section모델 계보 및 기술적 기반#

이 모델들의 기원과 아키텍처 선택을 이해하는 것은 컴퓨터 비전 프로젝트 내에서의 적합성을 판단하는 데 매우 중요합니다.

Link to this sectionPP-YOLOE+ 개요#

Baidu의 PaddlePaddle 저자들이 개발한 PP-YOLOE+는 2022년 4월 2일에 처음 소개되었습니다. 이 모델은 고성능 객체 탐지를 제공하기 위해 PaddleDetection 프레임워크 내의 이전 반복 모델을 기반으로 구축되었습니다.

PP-YOLOE+는 PaddlePaddle 생태계 내 배포에 최적화된 강력한 앵커 프리(anchor-free) 아키텍처를 도입했습니다. 이 모델은 수정된 CSPRepResNet 백본과 ET-head를 사용하여 특징 추출 및 경계 상자(bounding box) 회귀를 개선합니다. 높은 평균 정밀도(mAP)를 달성하지만, PaddlePaddle 프레임워크에 대한 의존성으로 인해 PyTorch나 TensorFlow에 익숙한 개발자에게는 통합 과정에서 어려움이 발생할 수 있습니다.

PP-YOLOE+에 대해 더 알아보기

Link to this sectionYOLOv9 개요#

대만 아카데미아 시니카(Academia Sinica) 정보과학연구소의 Chien-Yao Wang과 Hong-Yuan Mark Liao가 소개한 YOLOv9는 딥러닝 정보 병목 현상을 효율적으로 처리하는 데 있어 중요한 도약을 의미합니다.

  • 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
  • 조직: 대만 중앙연구원 정보과학연구소
  • 날짜: 2024-02-21
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

YOLOv9의 가장 큰 혁신은 특징이 심층 신경망을 통과할 때 발생하는 데이터 손실을 방지하는 프로그래밍 가능 그래디언트 정보(PGI)입니다. 여기에 일반화된 효율적 계층 집계 네트워크(GELAN)가 결합되어 YOLOv9는 매개변수 효율성과 연산 흐름을 극대화합니다. 또한, Ultralytics 생태계에 기본적으로 통합되어 연구 및 상업적 애플리케이션 모두에서 높은 접근성을 제공합니다.

YOLOv9에 대해 더 알아보기

기타 Ultralytics 모델

최신 기술(state-of-the-art) 옵션을 찾고 계시다면, 트랜스포머 기반의 정밀도와 실시간 엣지 성능 간의 균형을 제공하는 YOLO11RT-DETR에도 관심이 있으실 수 있습니다.

Link to this section성능 및 지표 비교#

성능을 분석할 때 YOLOv9는 뛰어난 매개변수 효율성을 보여줍니다. 이 모델은 더 적은 매개변수와 FLOPs를 사용하면서도 동등하거나 더 우수한 정확도를 달성하며, 이는 모델 학습 중 더 낮은 VRAM 요구 사항으로 이어집니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

표에서 볼 수 있듯이, YOLOv9c는 비교 대상인 PP-YOLOE+l(52.2M)보다 훨씬 적은 매개변수(25.3M)로 53.0 mAP라는 강력한 성능을 달성합니다. 이러한 낮은 메모리 사용량은 YOLOv9를 제한된 GPU 리소스를 사용하는 개발자에게 더 나은 선택지로 만듭니다.

Link to this section생태계, 범용성 및 사용 편의성#

YOLOv9의 결정적인 장점은 잘 관리된 Ultralytics 생태계와의 원활한 통합에 있습니다. PP-YOLOE+는 복잡한 PaddlePaddle 설정 파일을 탐색해야 하는 반면, YOLOv9는 간소화된 Python API의 이점을 누릴 수 있습니다.

Ultralytics Python API를 사용하면 개발자는 최소한의 상용구 코드(boilerplate code)로 사전 학습된 가중치를 로드하고, 데이터 증강을 관리하며, 학습을 시작할 수 있습니다.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

또한, Ultralytics 생태계는 타의 추종을 불허하는 범용성을 제공합니다. 이 프레임워크는 경계 상자 탐지를 넘어 인스턴스 세그멘테이션, 포즈 추정회전된 경계 상자(OBB) 탐지를 기본적으로 지원합니다. 이를 통해 복잡한 실제 파이프라인에 모델을 매우 효율적으로 적용할 수 있습니다.

내보내기 옵션

Ultralytics 프레임워크를 사용하여 학습된 모델은 TensorRTOpenVINO를 포함한 다양한 형식으로 내보낼 수 있어, 다양한 하드웨어에서 최적화된 추론을 보장합니다.

Link to this section활용 사례 및 권장 사항#

PP-YOLOE+와 YOLOv9 중 선택은 프로젝트의 특정 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionPP-YOLOE+를 선택해야 하는 경우#

PP-YOLOE+는 다음과 같은 경우 강력한 선택지입니다:

  • PaddlePaddle 생태계 통합: Baidu의 PaddlePaddle 프레임워크 및 도구로 구축된 기존 인프라를 보유한 조직.
  • Paddle Lite 엣지 배포: Paddle Lite 또는 Paddle 추론 엔진에 최적화된 추론 커널을 사용하는 하드웨어에 배포하는 경우.
  • 고정밀 서버 측 탐지: 프레임워크 종속성이 문제가 되지 않는 강력한 GPU 서버에서 최대 탐지 정확도를 우선시하는 시나리오.

Link to this sectionYOLOv9를 선택해야 할 때#

YOLOv9는 다음에 권장됩니다:

  • 정보 병목 현상 연구: PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 연구하는 학술 프로젝트.
  • 그래디언트 흐름 최적화 연구: 학습 중 심층 네트워크 계층에서의 정보 손실을 이해하고 완화하는 데 중점을 둔 연구.
  • 고정밀 탐지 벤치마킹: YOLOv9의 강력한 COCO 벤치마크 성능을 아키텍처 비교를 위한 참조 지점으로 활용해야 하는 시나리오.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section향후 전망: YOLO26의 이점#

PP-YOLOE+와 YOLOv9 모두 강력하지만, 새로 출시된 YOLO26은 프로덕션 환경을 위한 결정적인 다음 단계를 제시합니다. 2026년 1월에 출시된 YOLO26은 엣지 컴퓨팅 및 클라우드 배포의 새로운 표준을 정립합니다. YOLO26의 혁신적인 기능으로 인해 모든 새로운 컴퓨터 비전 프로젝트에 이 모델을 강력히 권장합니다:

  • 종단간(End-to-End) NMS 프리 설계: YOLO26은 기본적으로 종단간 설계를 채택하여 비최대 억제(NMS) 후처리가 전혀 필요하지 않습니다. 이는 배포 파이프라인을 크게 단순화하고 지연 시간을 줄여줍니다.
  • 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅을 위해 아키텍처를 특별히 최적화함으로써, YOLO26은 전용 GPU가 없는 하드웨어에서도 현저히 빠른 속도를 제공합니다.
  • DFL 제거: Distribution Focal Loss(분포 초점 손실)가 제거되어 내보내기 과정이 더 간단해졌으며, 저전력 엣지 장치와의 호환성이 대폭 향상되었습니다.
  • MuSGD 옵티마이저: 대규모 언어 모델 학습 기법(Moonshot AI의 Kimi K2와 같은)에서 영감을 받은 SGD와 Muon의 하이브리드인 이 옵티마이저는 매우 안정적인 학습 역학 관계와 빠른 수렴을 보장합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수들은 소형 객체 인식에서 눈에 띄는 개선을 가져오며, 이는 항공 이미지로봇 공학 분야에 필수적인 업그레이드입니다.
  • 작업별 개선 사항: YOLO26은 세그멘테이션을 위한 멀티 스케일 프로토(multi-scale proto) 및 포즈 추정을 위한 잔차 로그-우도 추정(RLE)과 같은 특정 작업을 위한 맞춤형 아키텍처를 포함합니다.

데이터셋 주석, 클라우드 학습 및 모델 모니터링을 위한 올인원 솔루션인 Ultralytics Platform을 통해 YOLO26 모델을 쉽게 학습하고 배포할 수 있습니다.

Link to this section실제 활용 사례#

이러한 아키텍처 간의 선택은 종종 목표 배포 환경에 따라 결정됩니다.

**PP-YOLOE+**는 산업 제조 센터, 특히 PaddlePaddle 통합 및 Baidu의 하드웨어 스택이 엔터프라이즈 인프라에 깊이 내장된 지역에서 자주 배포됩니다. 이 모델은 엄격한 실시간 제약 조건보다 절대적인 정확도가 우선시되는 정적 이미지 분석에서 뛰어난 성능을 발휘합니다.

YOLOv9은 빠른 실시간 추론이 필요한 동적 환경에서 탁월합니다. 뛰어난 매개변수 효율성 덕분에 자율 드론 내비게이션 및 엣지 기반 보안 시스템에 이상적입니다. 또한 더 낮은 VRAM 소비량은 소비자용 GPU에서 학습하는 연구자들의 진입 장벽을 낮춰줍니다.

스마트 시티 교통 관리 및 고속 로봇 공학 전반에서 최고의 성능을 내기 위해서는, NMS 병목 현상의 오버헤드 없이 종단간 효율성을 제공하는 최신 YOLO26이 독보적입니다.

댓글