Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 대 DAMO-YOLO#

컴퓨터 비전의 지속적인 발전은 실시간 객체 탐지를 위한 고도로 전문화된 아키텍처들을 탄생시켰습니다. 산업 및 연구용 애플리케이션을 위한 모델을 평가할 때, 2022년에 발표된 두 가지 주요 프레임워크인 Baidu의 **PP-YOLOE+**와 Alibaba Group의 DAMO-YOLO가 자주 논의됩니다. 두 모델 모두 새로운 백본, 고급 레이블 할당 전략, 전문적인 특징 융합 기술을 도입하여 앵커 프리(anchor-free) 탐지의 한계를 확장했습니다.

이 가이드는 PP-YOLOE+와 DAMO-YOLO에 대한 상세한 기술 분석을 제공하며, 각 모델의 아키텍처, 학습 방법론 및 배포 강점을 살펴봅니다. 또한, 귀하의 구체적인 배포 제약 조건에 맞는 도구를 선택할 수 있도록 Ultralytics YOLO26과 같은 현대적인 솔루션과 이 프레임워크들을 비교 분석합니다.

Link to this sectionPP-YOLOE+: 정교한 산업용 객체 탐지#

Baidu 생태계 내에서 개발된 PP-YOLOE+는 기존 PP-YOLOE의 반복적인 개선 버전으로, PaddlePaddle 딥러닝 프레임워크에 최적화되어 있습니다. 서버급 하드웨어에서의 정확도와 추론 속도를 극대화하도록 설계되어 산업용 검사 및 스마트 리테일 애플리케이션에 매우 적합합니다.

Link to this section아키텍처 혁신#

PP-YOLOE+는 이전의 앵커 프리 탐지기들보다 성능을 개선하기 위해 다음과 같은 아키텍처적 강화 요소를 도입했습니다:

  • CSPRepResNet 백본: 이 백본은 RepVGG 스타일의 아키텍처와 CSP(Cross Stage Partial) 연결을 결합하여, 특징 추출 능력과 추론 지연 시간(latency) 사이의 강력한 균형을 제공합니다.
  • TAL(Task Alignment Learning): PP-YOLOE+는 학습 중에 분류 및 회귀 작업을 정렬하는 고급 동적 레이블 할당 전략을 사용하여, 학습과 추론 성능 사이의 간극을 줄입니다.
  • ET-head(Efficient Task-aligned Head): 공간 해상도를 희생하지 않고 특징을 신속하게 처리하도록 설계된 간소화된 탐지 헤드로, 높은 mAP 지표를 유지하는 데 매우 유용합니다.

PP-YOLOE+ 세부 정보:

PP-YOLOE+에 대해 더 알아보기

Link to this sectionDAMO-YOLO: 엣지에서의 신경망 아키텍처 탐색#

Alibaba DAMO Academy에서 개발한 DAMO-YOLO는 완전히 다른 접근 방식을 취합니다. 연구팀은 수동으로 백본을 설계하는 대신, NAS(Neural Architecture Search)를 활용하여 엄격한 지연 시간 제약 조건에 맞춘 효율적인 네트워크 토폴로지를 찾아냈습니다.

Link to this section주요 기능 및 학습 파이프라인#

DAMO-YOLO는 자동화된 방식과 증류(distillation) 중심의 방법론을 통해 낮은 지연 시간과 높은 정확도를 강조합니다:

  • MAE-NAS 백본: DAMO-YOLO는 효율적인 신경망 아키텍처 탐색 자동화 방법(Method of Automating Efficient Neural Architecture Search)을 사용하여 파라미터와 정확도 사이의 트레이드오프에 최적화된 백본을 구축합니다.
  • Efficient RepGFPN: 재파라미터화된 일반화된 특징 피라미드 네트워크(Generalized Feature Pyramid Network)를 통해 강력한 다중 스케일 특징 융합이 가능해져, 단일 프레임 내에서 크기가 크게 다른 객체들을 탐지할 수 있습니다.
  • ZeroHead 설계: 추론 단계에서 계산 오버헤드를 대폭 줄여주는 고도로 단순화된 탐지 헤드입니다.
  • 증류 강화: 더 작은 모델 변형의 성능을 높이기 위해, DAMO-YOLO는 더 큰 티처(teacher) 모델이 학생(student) 모델을 가이드하는 복잡한 지식 증류 프로세스에 크게 의존합니다.

DAMO-YOLO 세부 정보:

DAMO-YOLO에 대해 더 알아보기

프레임워크 종속성

PP-YOLOE+와 DAMO-YOLO 모두 강력한 이론적 혁신을 제공하지만, 각자의 프레임워크(PaddlePaddle 및 특정 Alibaba 환경)에 밀접하게 결합되어 있습니다. 이는 해당 모델들을 표준화된 클라우드나 엣지 환경으로 포팅하려고 할 때 마찰을 일으킬 수 있습니다.

Link to this section성능 분석#

이러한 모델들을 평가할 때, 지연 시간, 계산 복잡도(FLOPs), 및 mAP(mean Average Precision) 간의 트레이드오프가 이상적인 배포 환경을 결정합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

DAMO-YOLO는 일반적으로 nano 및 tiny 스케일에서 더 낮은 TensorRT 지연 시간을 달성하여, 높은 처리량의 비디오 스트림 분야에서 매우 경쟁력이 있습니다. 그러나 PP-YOLOE+는 extra-large (x) 변형으로 매우 잘 확장되며, 추론 시간이 부차적인 복잡한 이미지 작업에서 최고 수준의 정확도를 달성합니다.

Link to this sectionUltralytics의 강점: 2022년 이후의 아키텍처를 넘어#

PP-YOLOE+와 DAMO-YOLO는 중요한 이정표를 세웠지만, 현대적인 개발 환경은 더 큰 범용성, 쉬운 학습 파이프라인, 낮은 메모리 요구 사항을 필요로 합니다. Ultralytics Platform은 이전 모델들이 요구했던 복잡한 증류 및 프레임워크별 설정을 훨씬 뛰어넘는 제로 마찰(zero-friction) 경험을 제공하여 이러한 요구를 해결합니다.

오늘날 최고의 성능 균형을 추구하는 개발자들에게 Ultralytics YOLO26은 실무 배포 효율성 측면에서 혁신적인 도약을 제공합니다.

Link to this section왜 YOLO26이 업계를 선도하는가#

2026년 초에 출시된 YOLO26은 YOLO11의 유산을 계승하며, 프로덕션을 위해 설계된 획기적인 기술을 도입했습니다:

  • 엔드투엔드 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 제거했습니다. 이는 더 간단한 배포 로직과 일관되고 예측 가능한 추론 지연 시간을 의미합니다.
  • MuSGD 옵티마이저: 대규모 언어 모델 학습 기술에서 영감을 받은 YOLO26은 하이브리드 MuSGD 옵티마이저를 사용합니다. 이는 매우 안정적인 학습과 빠른 수렴을 보장하여 귀중한 GPU 시간을 절약합니다.
  • 우수한 CPU 추론: DFL(Distribution Focal Loss)을 제거하고 네트워크 그래프를 최적화함으로써, YOLO26은 최대 43% 더 빠른 CPU 추론 속도를 달성하여 엣지 AI 장치를 위한 최고의 선택지가 되었습니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수들은 드론 운영 및 원격 탐사에 중요한 작은 객체 인식 성능을 크게 향상시킵니다.
  • 타의 추종을 불허하는 범용성: 탐지에만 엄격히 집중하는 PP-YOLOE+와 달리, YOLO26은 자세 추정, 인스턴스 세그멘테이션, 이미지 분류, 그리고 지향성 바운딩 박스(OBB)를 원활하게 지원합니다.

Link to this section사용 편의성과 학습 효율성#

DAMO-YOLO 모델을 학습하려면 무거운 티처-학생 증류 파이프라인을 관리해야 합니다. 반면, Ultralytics 모델을 학습하는 것은 단 몇 줄의 Python 코드만으로 가능하며, 경쟁 아키텍처에 비해 CUDA 메모리 사용량이 최소화됩니다.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

YOLO26에 대해 자세히 알아보기

Link to this section이상적인 사용 사례 및 권장 사항#

최적의 컴퓨터 비전 아키텍처 선택은 팀의 생태계 통합 및 배포 목표에 크게 좌우됩니다.

  • PP-YOLOE+를 선택하세요: 전체 파이프라인이 Baidu PaddlePaddle 생태계에 깊이 포함되어 있는 경우에 적합합니다. 정확도를 극대화하는 것이 주된 목표인 강력한 서버 환경에서의 정적 이미지 분석을 위한 훌륭한 선택입니다.
  • DAMO-YOLO를 선택하세요: 신경망 아키텍처 탐색(NAS) 알고리즘에 대한 구체적인 연구를 수행 중이거나, 공격적인 TensorRT 지연 시간 목표를 달성하기 위해 복잡한 증류 파이프라인을 유지할 수 있는 엔지니어링 자원이 있는 경우에 적합합니다.
  • Ultralytics YOLO26을 선택하세요: 대부분의 최신 프로덕션 시나리오에 권장합니다. Ultralytics 생태계는 독보적인 문서, 낮은 메모리 요구 사항, 간소화된 API를 제공합니다. 자동 품질 관리 시스템을 구축하든 Raspberry Pi에서 실시간 추적을 실행하든, YOLO26의 NMS-free 아키텍처는 즉시 빠르고 안정적이며 정확한 결과를 보장합니다.

다른 최첨단 솔루션을 탐색 중인 개발자들을 위해, Ultralytics 문서는 널리 사용되는 YOLOv8과 강력한 YOLO11에 대한 방대한 리소스를 제공하여 어떠한 컴퓨터 비전 과제에도 적합한 모델을 찾을 수 있도록 돕습니다.

댓글