콘텐츠로 건너뛰기

실시간 객체 탐지에 대한 심층 분석: PP-YOLOE+ 대 YOLO11

컴퓨터 비전 분야는 더 빠르고 정확하며 효율적인 모델에 대한 요구에 힘입어 끊임없이 진화하고 있습니다. 객체 탐지 작업을 수행하는 개발자와 연구원에게 적합한 아키텍처를 선택하는 것은 매우 중요합니다. 이 포괄적인 비교를 통해 두 가지 주요 모델인 PP-YOLOE+와 Ultralytics YOLO11의 미묘한 차이를 살펴보겠습니다.

이 가이드에서는 각 머신러닝 모델의 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석함으로써, 다음 머신러닝 배포를 위한 정보에 기반한 결정을 내리는 데 필요한 통찰력을 제공하고자 합니다.

모델의 기원 및 기술 개요

두 모델 모두 엄격한 학술 연구와 광범위한 공학적 설계에서 비롯되었으나, 완전히 다른 생태계에서 탄생했습니다. 각 모델의 기초적인 세부 사항을 살펴보겠습니다.

PP-YOLOE+ 개요

바이두 연구진이 개발한 PP-YOLOE+는 기존 PP-YOLOE의 진화판으로, PaddlePaddle 내에서 실시간 탐지의 한계를 확장하기 위해 설계되었습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

YOLO11

Ultralytics가 개발한 YOLO11 사용성과 정확도 측면에서 획기적인 발전을 이루었습니다. 이 모델은 매우 성공적인 기존 아키텍처의 기반 위에 구축되어 개발자 경험을 원활하게 하고 다중 작업에 대한 다재다능함을 최적화합니다.

YOLO11에 대해 자세히 알아보세요

알고 계셨나요?

Ultralytics YOLO11 단순한 객체 탐지 이상의 기능을YOLO11 . 기본적으로 동일한 API를 사용하여 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB) 탐지를 수행할 수 있습니다.

건축적 및 성능 비교

이 두 탐지기를 비교할 때는 단순한 수치 이상의 요소를 살펴야 하며, 그들의 아키텍처 선택이 실제 모델 배포에 어떤 영향을 미치는지 이해해야 합니다.

PP-YOLOE+ 건축

PP-YOLOE+는 PaddlePaddle 에 크게 의존합니다. 이 모델은 강력한 앵커 프리 패러다임을 도입하여 RepResNet 백본과 수정된 경로 집계 네트워크(PAN)를 활용합니다. "+" 변종은 대규모 데이터셋 사전 훈련( Objects365 등)과 개선된 TaskAlignedAssigner를 도입하여 이전 버전을 개선했습니다. 높은 평균 정밀도(mAP)를 달성하지만, PaddlePaddle 대한 강한 의존성은 PyTorch TensorFlow 익숙한 팀에게 마찰을 일으킬 PaddlePaddle .

YOLO11

Ultralytics YOLO11 PyTorch, 현대 딥러닝의 업계 표준인 PyTorch 위에 네이티브로 구축되었습니다. 이 아키텍처는 성능 균형에 중점을 두어 속도와 정확도 사이의 유리한 절충점을 달성하여 다양한 실제 배포 시나리오에 적합합니다. YOLO11 더 나은 기울기 흐름을 위한 최적화된 C2f 모듈과 분류 및 회귀 작업을 효율적으로 분리 처리하는 분리형 헤드를 YOLO11 . 또한 YOLO11 더 낮은 메모리 요구 사항을 위해 YOLO11 , 복잡한 트랜스포머 모델인 RT-DETR과 비교하여 훈련 및 추론 시 메모리 사용량이 현저히 낮습니다.

성과 지표 표

다음 표는 다양한 모델 규모에 따른 성능 차이를 보여줍니다. YOLO11 매개변수 수와 FLOPs를 크게 mAP YOLO11 비슷한 수준 또는 더 나은 mAP 달성하는 점을 주목하십시오.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

사용 사례 및 권장 사항

PP-YOLOE+와 YOLO11 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLO11 .

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 다음에 대한 강력한 선택입니다:

  • PaddlePaddle 통합: 기존 인프라가 바이두의 PaddlePaddle 프레임워크 및 툴링을 기반으로 구축된 조직.
  • 패들 라이트 에지 배포: 패들 라이트 또는 패들 추론 엔진 전용으로 고도로 최적화된 추론 커널을 갖춘 하드웨어에 배포합니다.
  • 고정밀 서버 측 탐지: 프레임워크 의존성이 문제가 되지 않는 강력한 GPU 최대 탐지 정확도를 우선시하는 시나리오.

YOLO11 선택해야 할 때

YOLO11 다음에 권장YOLO11 :

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

Ultralytics 이점

학술적 성과 지표도 중요하지만, AI 프로젝트의 장기적 성공은 모델을 둘러싼 생태계에 크게 좌우됩니다. Ultralytics 개발자와 기업 모두에게 뚜렷한 이점을 제공합니다.

  1. 사용 편의성: Ultralytics 딥 러닝의 복잡성을 Ultralytics . 간소화된 사용자 경험과 간단한 Python 통해 개발자는 단 몇 줄의 코드로 맞춤형 모델을 훈련시킬 수 있습니다. 이는 PP-YOLOE+에서 흔히 요구되는 복잡한 구성 파일과 대조됩니다.
  2. 잘 관리된 생태계: 많은 연구 전용 저장소와 달리, Ultralytics 활발히 개발되고 있습니다. 강력한 커뮤니티 지원, 빈번한 업데이트, 그리고 다음과 같은 도구들과의 광범위한 통합을 자랑합니다. Weights & Biases , Comet 과 같은 도구와의 광범위한 통합을 자랑합니다.
  3. 다용도성: YOLO11 분류, 분할 또는 경계 상자 탐지와 같은 다양한 컴퓨터 비전 작업을 위한 단일 통합 프레임워크를 YOLO11 서로 다른 라이브러리를 학습할 필요가 없도록 합니다.
  4. 훈련 효율성: YOLO 효율적인 훈련 프로세스는 시간과 컴퓨팅 비용을 모두 절약합니다. COCO 사전 훈련된 가중치를 활용함으로써, 소비자용 하드웨어에서도 모델이 빠르게 수렴합니다.

훈련 코드 비교

사용 편의성을 보여주기 위해, 최첨단 YOLO11 훈련하는 방법을 소개합니다. 이 모델은 모든 데이터 증강, 로깅 및 하드웨어 오케스트레이션을 자동으로 처리합니다:

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run a quick inference test on a public image
inference_results = model("https://ultralytics.com/images/bus.jpg")
inference_results[0].show()

PaddleDetection에서 동등한 파이프라인을 설정하려면 복잡한 XML 구성을 수동으로 탐색하고 긴 명령줄 문자열을 실행해야 하므로, 이는 민첩한 개발 주기를 지연시킬 수 있습니다.

앞으로 바라보기: YOLO26의 등장

YOLO11 매우 강력한 도구이지만, 인공지능 분야는 빠르게 진화하고 있습니다. 2026년 1월에 출시된 YOLO26Ultralytics 계보의 최첨단을 대표하며 모든 신규 프로젝트에 권장되는 모델입니다.

YOLO26은 몇 가지 획기적인 혁신을 도입합니다:

  • 엔드투엔드 NMS 설계: 최초로 개척된 개념을 기반으로 구축 YOLOv10에서 처음 제시된 개념을 기반으로 구축된 YOLOv26은 본질적으로 엔드투엔드(end-to-end)입니다. 이는 비최대 억제(NMS) 후처리 단계를 완전히 제거하여 배포를 훨씬 단순화하고 지연 시간 변동성을 크게 줄입니다.
  • 최대 43% 빠른 CPU : 분포 초점 손실(DFL)을 전략적으로 제거함으로써 모델이 훨씬 가벼워집니다. 이 최적화로 인해 에지 컴퓨팅 및 저전력 IoT 기기에 최적의 선택이 됩니다.
  • MuSGD 최적화기: YOLO26은 컴퓨터 비전 분야에 대규모 언어 모델(LLM) 훈련 혁신을 가져왔습니다. MuSGD 최적화기( SGD 뮤온의 하이브리드)를 사용하여 매우 안정적인 훈련 역학과 더 빠른 수렴을 달성합니다.
  • ProgLoss + STAL: 이 고급 손실 함수들은 드론 영상 및 항공 감시에 핵심적인 기능인 소형 물체 인식에서 현저한 개선 효과를 보여줍니다.

결론 및 실제 적용 사례

PP-YOLOE+와 YOLO11 또는 최신 버전인 YOLO26) 사이에서 선택할 때는 배포 환경에 따라 결정됩니다.

PP-YOLOE+는 특정 산업 환경, 특히 하드웨어가 바이두 기술 스택 및 PaddlePaddle 깊이 통합된 아시아 제조 허브에서 탁월한 성능을 발휘합니다. 최대 mAP 정적 이미지 분석에 매우 적합합니다.

YOLO11 반면 YOLO26은 훨씬 더 다재다능하고 개발자 친화적인 접근 방식을 제공합니다. 낮은 매개변수 수와 높은 속도로 인해 다음과 같은 용도에 이상적입니다:

  • 스마트 리테일: 자동화된 결제 및 재고 관리를 위한 실시간 영상 처리.
  • 자율 로봇공학: 자원 제약이 있는 임베디드 장치에서 고속 장애물 회피 구현
  • 보안 및 감시: 단일하고 매우 효율적인 추론 단계에서 강력한 다중 작업 분석(추적 및 자세 추정 등)을 제공합니다.

신뢰성, 광범위한 커뮤니티 지원, 그리고 다음과 같은 형식으로의 간편한 배포 파이프라인을 찾는 현대 AI 엔지니어를 위해 ONNXTensorRT와 같은 형식으로의 직관적인 배포 파이프라인을 찾는 현대 AI 엔지니어들에게 Ultralytics 여전히 확실한 선택입니다.


댓글