콘텐츠로 건너뛰기

PP-YOLOE+ 대 YOLO26: 실시간 객체 탐지 아키텍처 심층 분석

실시간 컴퓨터 비전 분야는 확장 가능하고 효율적이며 매우 정확한 객체 탐지 모델에 대한 수요에 힘입어 엄청난 성장을 이루었습니다. 이 분야에서 두드러지는 두 가지 아키텍처는 PaddlePaddle 강력한 탐지기인 PP-YOLOE+와Ultralytics 가 있습니다.

이 포괄적인 가이드는 두 모델을 비교하여 아키텍처, 성능 지표, 훈련 방법론 및 이상적인 사용 사례를 강조함으로써, 여러분의 다음 AI 프로젝트를 위한 정보에 기반한 결정을 내리는 데 도움을 드립니다.

기술 사양 및 저작권

이러한 모델들의 기원과 설계 철학을 이해하는 것은 실제 적용에 있어 중요한 맥락을 제공한다.

PP-YOLOE+ 상세 정보:

PP-YOLOE+에 대해 자세히 알아보세요.

YOLO26 세부 사항:

YOLO26에 대해 더 알아보기

아키텍처 혁신

PP-YOLOE+ 건축

PP-YOLOv2를 기반으로 한 PP-YOLOE+는 산업용 애플리케이션에 특화된 견고한 설계를 도입합니다. CSPRepResNet 백본과 ET-head(효율적인 작업 정렬 헤드)를 활용하여 속도와 정확도의 균형을 맞춥니다. PP-YOLOE+는 동적 레이블 할당 (TAL)을 활용하며 Baidu의 PaddlePaddle 원활하게 통합되어 T4 및 V100과 같은 NVIDIA 최적화되어 있습니다. 그러나 PaddlePaddle 대한 높은 의존도는 기존 PyTorch 환경에 익숙한 개발자들에게는 장벽이 될 수 있습니다. PyTorch 작업 흐름에 익숙한 개발자들에게는 마찰을 일으킬 수 있습니다.

YOLO26 아키텍처: 에지 우선 혁명

2026년 초 출시된 Ultralytics 실시간 탐지 파이프라인을 완전히 재구상하여 배포 단순성과 에지 효율성에 중점을 둡니다.

YOLO26의 주요 혁신 사항은 다음과 같습니다:

  • 엔드투엔드 NMS 설계: YOLO26은 기본적으로 엔드투엔드 방식으로, 비최대 억제(NMS)가 전혀 필요하지 않습니다.NMS) 후처리 과정이 필요 없습니다. 이 획기적인 기술은 최초로 YOLOv10에서 최초로 선보인 이 혁신은 장면 혼잡도와 무관하게 일관된 추론 지연 시간을 보장하여 배포를 훨씬 단순화합니다.
  • DFL 제거: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 출력 헤드를 획기적으로 단순화합니다. 이로 인해 에지 디바이스 및 마이크로컨트롤러와의 호환성이 크게 향상됩니다.
  • 최대 43% 빠른 CPU 속도: DFL 제거 및 구조적 최적화 덕분에 YOLO26은 전용 GPU가 없는 환경에 크게 최적화되어, CPU에서 기존 대비 최대 43% 빠른 추론 속도를 달성합니다. YOLO11.
  • MuSGD 최적화기: Moonshot AI의 고급 LLM 훈련 기법에서 영감을 받아, YOLO26은 SGD 뮤온 SGD 의 하이브리드 방식을 도입합니다. 이는 컴퓨터 비전 작업에 전례 없는 훈련 안정성과 더 빠른 수렴 속도를 제공합니다.
  • ProgLoss + STAL: 고급 손실 함수는 드론 운영 및 IoT 에지 센서에 중요한 소형 물체 인식 능력을 특별히 타깃팅하여 개선합니다.

YOLO26의 작업 특화 개선 사항

표준 바운딩 박스를 넘어, YOLO26은 모든 비전 작업에 걸쳐 구체적인 업그레이드를 도입합니다. 세분화에는 의미적 세분화 손실과 다중 스케일 프로토타이핑을, 자세 추정에는 잔차 로그 가능도 추정(RLE) , 방향성 바운딩 박스(OBB) 탐지에서 경계 문제를 해결하기 위한 특수 각도 손실을 사용합니다.

성과 및 지표

아래 표는 다양한 모델 규모에서 PP-YOLOE+와 YOLO26의 비교를 종합적으로 보여줍니다. YOLO26 모델은 순수 속도, 매개변수 효율성, 그리고 전체 평균 정밀도(mAP) 측면에서 확실히 우위를 점하고 있습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

참고: 굵은 글씨로 표시된 값은 모든 모델에서 가장 우수한 성과를 보인 지표를 강조합니다.

분석

  • 메모리 요구사항 및 효율성: YOLO26은 더 높은 mAP 달성하기 위해 훨씬 적은 매개변수와 FLOPs를 필요로 합니다. 예를 들어, YOLO26n(나노) 모델은 단 240만 mAP 40.9 mAP 달성하며, PP-YOLOe+t 모델을 능가하는 성능을 보임과 동시에 크기는 약 절반 수준입니다. 이는 훈련 및 배포 시 모두 더 낮은 메모리 사용량으로 이어집니다.
  • 추론 속도: TensorRT로 NMS 때 YOLO26이 지연 시간 지표에서 우위를 점합니다. NMS 제거로 GPU 1.7ms 추론 시간이 완벽히 안정적으로 GPU 반면, PP-YOLOE+는 변동 가능성이 있는 후처리 시간에 의존합니다.

Ultralytics : 생태계와 사용 편의성

원시 지표도 중요하지만, 개발자 경험이 종종 프로젝트 성공을 좌우합니다. Ultralytics 은 오래된 프레임워크를 완전히 능가하는 잘 관리된 생태계를 제공합니다.

  1. 사용 편의성: Ultralytics 복잡한 상용구 코드를 Ultralytics . YOLO26 훈련에는 단 몇 줄의 Python 코드만 필요하며, PP-YOLOE+에서 요구하는 복잡한 구성 파일을 피할 수 있습니다.
  2. 다용도성: PP-YOLOE+는 기본적으로 객체 탐지 아키텍처입니다. YOLO26은 세분화, 분류, 자세 추정 및 OBB에 대한 즉시 사용 가능한 지원을 제공합니다.
  3. 훈련 효율성: Ultralytics YOLO RT-DETR 이나 구형 아키텍처와 비교해 CUDA 메모리 요구량이 현저히 낮아, 연구자들이 소비자용 하드웨어에서도 최첨단 모델을 훈련할 수 있게 합니다.

기타 Ultralytics

YOLO26이 현재 연구의 정점이지만, Ultralytics 에는 또한 YOLO11YOLOv8도 포함하고 있습니다. 두 모델 모두 여전히 뛰어난 성능을 발휘하며 대규모 커뮤니티 지원을 받고 있어, 구형 레거시 시스템에서 전환하는 사용자에게 이상적입니다.

코드 예시: YOLO26 훈련

Ultralytics 시작은 매우 Ultralytics . 다음은 YOLO26 모델을 로드하고, 훈련하고, 검증하는 방법을 보여주는 완전히 실행 가능한 예시입니다:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset using the new MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    optimizer="auto",  # MuSGD is automatically engaged for YOLO26
)

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
print(f"Model successfully exported to: {export_path}")

이상적인 사용 사례

PP-YOLOE+를 선택해야 하는 경우

  • 레거시 PaddlePaddle : 기업이 이미 바이두의 기술 스택에 깊이 통합되어 있고 패들 추론을 위해 사전 구성된 하드웨어를 사용하는 경우, PP-YOLOE+는 안전하고 안정적인 선택입니다.
  • 아시아 제조 허브: 아시아의 많은 산업용 비전 파이프라인은 자동화된 결함 검출 분야에서 PP-YOLOE+에 대한 강력한 기존 지원 체계를 갖추고 있습니다.

YOLO26을 선택해야 할 때

  • 엣지 컴퓨팅과 IoT: 43% 더 빠른 CPU DFL 제거로 YOLO26은 라즈베리 파이, 휴대폰, 임베디드 장치에 배포하기 위한 확실한 최강자입니다.
  • 혼잡한 현장과 스마트 시티: 종단 간 NMS 아키텍처는 주차 관리 및 교통 모니터링과 같은 고밀도 환경에서 안정적인 지연 시간을 보장하며, 기존 NMS 이러한 환경에서 병목 현상을 NMS .
  • 다중 작업 프로젝트: 파이프라인에서 객체 추적, 인체 자세 추정 또는 픽셀 단위 정밀 마스크 생성이 필요한 경우, YOLO26이 단일 통합 Python 내에서 모든 작업을 처리합니다.

결론

PP-YOLOE+는 특정 생태계 내에서 여전히 뛰어난 성능의 탐지기로 자리매김하고 있지만, YOLO26의 출시로 패러다임이 전환되었습니다. Ultralytics 대규모 언어 모델(LLM)에서 영감을 받은 훈련 최적화 기법(MuSGD)과 끊임없이 개선된 NMS 아키텍처를 결합하여 높은 정확도와 손쉬운 배포성을 동시에 갖춘 모델을 Ultralytics . 속도, 정확도, 개발자 경험의 최적 균형을 추구하는 현대 개발자에게 YOLO26은 확실한 선택지입니다.


댓글