콘텐츠로 건너뛰기

YOLO11 PP-YOLOE+: 상세한 아키텍처 및 성능 비교

컴퓨터 비전 분야의 급속한 발전 속에서, 올바른 객체 탐지 모델을 선택하는 것은 개발 속도부터 배포 지연 시간에 이르기까지 모든 것에 영향을 미치는 중대한 결정입니다. 본 가이드는 Ultralytics YOLO11(2024년 말 출시된 다목적이며 널리 채택된 모델)과 PaddlePaddle 견고한 산업용 탐지기인 PP-YOLOE+ 간의 포괄적인 PaddlePaddle 비교를 제공합니다.

정확도 지표, 추론 속도, 사용 편의성 및 배포 유연성을 기준으로 이러한 아키텍처를 분석하여 특정 애플리케이션에 가장 적합한 도구를 선택할 수 있도록 지원합니다.

대화형 성능 벤치마크

이러한 모델 간의 장단점을 이해하려면 표준 데이터셋에서의 성능을 시각화하는 것이 필수적입니다. COCO과 같은 표준 데이터셋에서의 성능을 시각화하는 것이 필수적입니다. 아래 차트는 평균 정밀도(mAP)와 추론 속도 간의 균형을 보여줌으로써, 지연 시간 제약 조건에 대한 "파레토 최전선"을 식별하는 데 도움을 줍니다.

성능 지표 분석

다음 표는 모델 성능에 대한 상세한 분석을 제시합니다. Ultralytics YOLO11 PP-YOLOe+ 모델 대비 훨씬 적은 매개변수로 더 높은 정확도를 제공하며 우수한 효율성을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Ultralytics YOLO11: 아키텍처 및 생태계

2024년 9월 출시, YOLO11YOLO 기존 YOLO 유산을 계승하며, 최대의 특징 추출 효율을 위해 설계된 정교한 아키텍처 구성 요소를 도입합니다.

주요 아키텍처 기능

  • C3k2 백본: CSP(Cross Stage Partial) 병목 현상의 진화형인 C3k2 블록은 더 빠른 컨볼루션 연산을 활용하여 기울기 흐름을 유지하면서 처리 속도를 향상시킵니다.
  • C2PSA 주의: C2PSA(Cross-Stage Partial with Spatial Attention) 모듈의 도입은 위성 이미지 분석에서 흔히 발생하는 과제인 소형 물체와 복잡한 질감에 대한 모델의 집중 능력을 향상시킵니다.
  • 멀티태스크 헤드: 많은 경쟁사와 달리 YOLO11 단일 프레임워크 내에서 탐지, 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB)를 지원하는 통합 헤드 구조를 YOLO11 .

YOLO11 :

YOLO11에 대해 자세히 알아보세요

PP-YOLOE+: 아키텍처와 생태계

PP-YOLOE+는 PaddlePaddle 개발한 PP-YOLOE의 업그레이드 버전입니다. Baidu PaddlePaddle 프레임워크를 활용하여 산업용 애플리케이션을 위한 강력한 베이스라인으로 설계되었습니다.

주요 아키텍처 기능

  • CSPRepResStage: 이 백본은 잔차 연결과 재매개변수화 기법을 결합하여, 훈련 중에는 복잡한 모델을 유지하면서도 추론 시에는 간소화된 모델을 구현할 수 있게 합니다.
  • TAL(작업 정렬 학습): PP-YOLOE+는 분류 및 로컬라이제이션 작업을 정렬하는 동적 레이블 할당 전략을 채택하여 양성 샘플 선택의 품질을 향상시킵니다.
  • 앵커 프리: YOLO11 마찬가지로 앵커 프리 접근법을 활용하여 튜닝에 필요한 하이퍼파라미터의 수를 줄입니다.

PP-YOLOE+ 상세 정보:

비교 분석: 왜 Ultralytics 선택해야 할까?

두 모델 모두 우수한 탐지 성능을 지녔으나, Ultralytics YOLO11 사용 편의성, 생태계 지원, 자원 효율성 측면에서 뚜렷한 장점을YOLO11 .

1. 사용 편의성 및 구현

가장 큰 차이점 중 하나는 사용자 경험에 있습니다. Ultralytics "제로 마찰" 철학을 바탕으로 설계되었습니다. Python 통해 개발자는 5줄 미만의 코드로 모델을 로드, 훈련 및 배포할 수 있습니다.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

반면 PP-YOLOE+는 PaddleDetection 제품군에 의존합니다. 강력하지만, PaddlePaddle 특화된 구성 파일 및 종속성을 다루는 가파른 학습 곡선이 종종 필요하며, 이는 표준 PyTorch에 익숙한 사용자에게는 직관적이지 않을 수 있습니다. PyTorch 작업 흐름에 익숙한 사용자에게는 직관적이지 않을 수 있습니다.

2. 훈련 효율성과 메모리 사용량

Ultralytics YOLO 효율적인 자원 활용으로 유명합니다.

  • 낮은 메모리 사용량: YOLO11 소비자용 GPU에서 훈련하도록 YOLO11 . 이는 상당한 CUDA 필요로 하는 트랜스포머 기반 아키텍처나 구형 산업용 모델에 비해 중요한 장점입니다.
  • 더 빠른 수렴: 최적화된 기본 하이퍼파라미터와 모자이크(Mosaic), 믹스업(Mixup) 같은 증강 기법 덕분에 YOLO11 더 적은 에포크 수로도 사용 가능한 정확도 수준에 수렴하는 YOLO11 , 계산 비용을 절감합니다.

3. 다용도성과 작업 지원

현대 컴퓨터 비전 프로젝트는 종종 단순한 바운딩 박스 이상의 기능을 요구합니다. 프로젝트 범위가 확장되더라도 Ultralytics 프레임워크 변경 없이도 완벽히 Ultralytics .

간소화된 배포

Ultralytics YOLO11 ONNX, TensorRT, CoreML, TFLite 등 10개 이상의 형식으로 단일 메서드를 TFLite 내보낼 수 있습니다: model.export(format='onnx')이러한 본질적인 유연성은 연구에서 생산으로의 경로를 획기적으로 단순화합니다.

비전 AI의 미래: YOLO26 소개

YOLO11 성숙하고 신뢰할 수 YOLO11 , 해당 분야는 계속 발전하고 YOLO11 . 최첨단을 추구하는 개발자들을 위해 Ultralytics 2026년 초 YOLO26을 Ultralytics .

YOLO26은 NMS 원생적 엔드투엔드 설계로 아키텍처를 혁신하며, 이는 최초로 YOLOv10에서 최초로 선보인 SGD 엔드투엔드 NMS 프리(NMS) 설계로 아키텍처에 혁신을 가져왔습니다. 비최대 억제(NMS) 후처리 및 분포 초점 손실(DFL)의 필요성을 제거함으로써, YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 달성합니다. SGD )의 하이브리드인 MuSGD 최적화기를 통합하여 LLM 혁신에서 영감을 받은 안정적인 훈련 역학을 보장합니다.

에지 디바이스를 대상으로 하거나 가능한 최고 처리량이 필요한 신규 프로젝트의 경우, YOLO26을 적극 검토할 것을 권장합니다.

YOLO26에 대해 더 알아보기

실제 사용 사례

YOLO11 장점

  • 엣지 AI 및 IoT: 높은 정확도 대비 파라미터 비율 덕분에 YOLO11n(나노)은 라즈베리 파이 및 모바일 배포에 최적입니다.
  • 의료 영상: 분할과 검출을 동시에 수행할 수 있는 능력은 종양 식별이나 세포 구조 분석에 이상적입니다.
  • 로봇공학: 방향이 중요한 로봇 그레이핑 작업에서 OBB 지원은 매우 중요합니다.

PP-YOLOE+가 적합한 경우

  • 바이두 생태계 통합: 인프라가 이미 바이두의 AI 클라우드 또는 PaddlePaddle 가속기에 크게 투자된 경우, PP-YOLOE+는 네이티브 호환성을 제공합니다.
  • 고정형 산업용 카메라: 모델 크기에 대한 제약이 적은 서버 측 추론 환경에서는 PP-YOLOE+가 여전히 경쟁력 있는 옵션으로 남아 있습니다.

결론

YOLO11 PP-YOLOE+ 모두 유능한 객체 탐지 아키텍처입니다. 그러나 대다수의 연구자와 개발자에게는 Ultralytics YOLO11 (그리고 최신 버전인 YOLO26)은 성능, 사용 편의성, 생태계 지원 측면에서 탁월한 균형을 제공합니다. 다양한 작업 간 원활한 전환이 가능하며, 방대한 커뮤니티 리소스와 문서 라이브러리를 통해 프로젝트의 미래 대비성과 확장성을 보장합니다.

모델 아키텍처에 대한 추가적인 탐구를 위해 다음 비교 자료를 검토해 보시기 바랍니다. RT-DETR 트랜스포머 기반 탐지 모델 비교 자료 또는 YOLOv10 을 통한 초기 실시간 효율성 혁신에 대한 비교 자료를 검토해 보시기 바랍니다.


댓글