Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 대 YOLOv6-3.0#

실시간 컴퓨터 비전 분야가 급격히 확장됨에 따라, 다양한 배포 시나리오에 최적화된 고도로 전문화된 아키텍처가 등장하고 있습니다. 개발자들은 높은 처리량과 신뢰할 수 있는 정확도의 균형이 필요한 애플리케이션을 구축할 때 PP-YOLOE+YOLOv6-3.0을 자주 비교합니다. 두 모델 모두 출시와 함께 산업 및 엣지 애플리케이션을 위한 추론 속도 향상에 초점을 맞추며 상당한 아키텍처 개선을 이루어냈습니다.

상세한 아키텍처 분석에 앞서, 아래 차트를 통해 이 모델들의 속도와 정확도 측면에서 상대적인 성능을 확인해 보십시오.

Link to this sectionPP-YOLOE+: 아키텍처의 강점과 약점#

PaddlePaddle 저자들이 개발한 PP-YOLOE+는 이전 모델을 기반으로 다양한 규모 요건에서 강력한 성능을 제공하는 대표적인 앵커 프리 검출기(anchor-free detector)입니다.

Link to this section아키텍처 주요 특징#

PP-YOLOE+는 기존 PP-YOLOE 설계보다 몇 가지 중요한 개선 사항을 도입했습니다. 강력한 CSPRepResNet 백본을 활용하여 계산 비용과 특징 추출 능력 사이의 균형을 효율적으로 유지합니다. 또한 고급 특징 피라미드 네트워크(FPN)와 경로 집계 네트워크(PAN)를 결합하여 다중 스케일 특징 융합을 보장합니다. 가장 눈에 띄는 기능 중 하나는 객체 탐지(object detection) 과정에서 분류와 위치 조정 기능을 크게 향상시킨 ET-head(Efficient Task-aligned head)입니다.

PP-YOLOE+는 인상적인 평균 정밀도(mAP)를 달성하지만, PaddlePaddle 생태계에 대한 의존도는 PyTorch 네이티브 워크플로우에 익숙한 연구자들에게 가파른 학습 곡선을 요구할 수 있습니다. 이는 Paddle 추론 지원이 직접적으로 제공되지 않는 이종 엣지 디바이스를 대상으로 할 때 모델 배포 과정을 다소 복잡하게 만들 수 있습니다.

배포 환경

PP-YOLOE+는 Baidu의 기술 스택 내 배포에 최적화되어 있어, 프로덕션 환경이 Paddle 추론 도구에 크게 의존하는 경우 훌륭한 선택입니다.

PP-YOLOE+에 대해 더 알아보기

Link to this sectionYOLOv6-3.0: 산업용 처리량#

Meituan Vision AI 부서에서 출시한 YOLOv6-3.0은 GPU 하드웨어에서 대규모 처리량을 우선시하며, 산업용 애플리케이션을 위한 차세대 객체 탐지기로 설계되었습니다.

Link to this section아키텍처 주요 특징#

YOLOv6-3.0은 TensorRT를 사용하는 NVIDIA GPU에서 하드웨어 활용을 극대화하도록 맞춤 제작된 EfficientRep 백본을 탑재하고 있습니다. v3.0 업데이트를 통해 넥 부분에 양방향 연결(BiC) 모듈이 추가되어 파라미터 수를 크게 늘리지 않으면서도 공간 특징 유지력을 향상시켰습니다. 또한 모델 학습 중에는 앵커 기반의 안정성을 활용하고, 실시간 추론 중에는 빠른 앵커 프리 아키텍처를 유지하는 앵커 보조 학습(AAT) 전략을 도입했습니다.

그러나 YOLOv6-3.0은 서버급 GPU에 최적화되어 있으므로, CPU 전용 엣지 디바이스와 같이 제약이 많은 환경에서는 지연 시간 개선 효과가 줄어들 수 있습니다. 이러한 전문성으로 인해 오프라인 비디오 분석과 같은 환경에서는 뛰어나지만, 더 작은 로컬 하드웨어에서는 동적으로 최적화된 모델에 비해 뒤처질 수 있습니다.

YOLOv6에 대해 더 알아보기

Link to this section성능 비교표#

다음 표는 두 아키텍처의 다양한 스케일 변형 모델을 직접 비교한 주요 성능 지표를 나타냅니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Link to this section활용 사례 및 권장 사항#

PP-YOLOE+와 YOLOv6 중 선택하는 것은 프로젝트의 구체적인 요구 사항, 배포 제약 조건, 생태계 선호도에 따라 달라집니다.

Link to this sectionPP-YOLOE+를 선택해야 하는 경우#

PP-YOLOE+는 다음과 같은 경우 강력한 선택지입니다:

  • PaddlePaddle 생태계 통합: Baidu의 PaddlePaddle 프레임워크 및 도구로 구축된 기존 인프라를 보유한 조직.
  • Paddle Lite 엣지 배포: Paddle Lite 또는 Paddle 추론 엔진에 최적화된 추론 커널을 사용하는 하드웨어에 배포하는 경우.
  • 고정밀 서버 측 탐지: 프레임워크 종속성이 문제가 되지 않는 강력한 GPU 서버에서 최대 탐지 정확도를 우선시하는 시나리오.

Link to this sectionYOLOv6을 선택해야 하는 경우#

YOLOv6은 다음 경우에 권장됩니다:

  • 산업용 하드웨어 인식 배포: 모델의 하드웨어 인식 설계와 효율적인 재파라미터화가 특정 타겟 하드웨어에서 최적화된 성능을 제공하는 시나리오.
  • 빠른 단일 스테이지 탐지: 통제된 환경에서 실시간 비디오 처리를 위해 GPU에서의 원시 추론 속도를 우선시하는 애플리케이션.
  • Meituan 생태계 통합: 이미 Meituan의 기술 스택 및 배포 인프라 내에서 작업 중인 팀.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 강점: 레거시 모델을 넘어선 발전#

PP-YOLOE+와 YOLOv6-3.0이 타겟 솔루션을 제공하는 반면, 현대 AI 개발은 다재다능하고 메모리 효율적인 워크플로우를 요구합니다. 이때 Ultralytics 플랫폼은 타의 추종을 불허하는 개발자 경험을 제공합니다. 통합된 Python API를 사용하여 기존 연구 저장소에서 흔히 볼 수 있는 엄청난 설정 오버헤드 없이 최첨단 모델을 원활하게 학습, 검증 및 배포할 수 있습니다.

Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.

Link to this sectionYOLO26을 만나보세요: 새로운 표준#

최고의 최첨단 비전 모델을 배포하려는 조직을 위해 (2026년 1월 출시된) Ultralytics YOLO26은 성능의 경계를 재정의합니다. 몇 가지 핵심 혁신을 통해 이전 세대보다 훨씬 뛰어난 성능을 발휘합니다.

  • 엔드 투 엔드 NMS 프리 설계: YOLOv10의 개념을 계승한 YOLO26은 비최대 억제(NMS) 후처리를 완전히 제거합니다. 이러한 네이티브 엔드 투 엔드 접근 방식은 예측 가능하고 초저지연 추론을 보장하며, 이는 실시간 안전 시스템에 필수적입니다.
  • 최대 43% 더 빠른 CPU 추론: 아키텍처에서 DFL(Distribution Focal Loss)을 제거함으로써 YOLO26은 엣지 컴퓨팅 및 전용 GPU 가속이 없는 환경에 극도로 최적화되었습니다.
  • MuSGD 옵티마이저: LLM 학습 안정성을 비전 모델에 통합한 이 하이브리드 옵티마이저(Moonshot AI에서 영감을 받음)는 빠른 수렴과 매우 안정적인 커스텀 학습 세션을 가능하게 합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수 공식은 항공 드론 영상 및 복잡한 장면 분석과 같은 애플리케이션에 필수적인 소형 객체 인식에서 놀라운 개선을 제공합니다.
미래를 대비하는 파이프라인

오늘 새로운 프로젝트를 구축 중이라면, 기존 아키텍처를 우회하고 YOLO26을 도입할 것을 강력히 권장합니다. 메모리 효율성과 NMS가 필요 없는 속도 덕분에 프로덕션 환경으로 배포하기가 훨씬 더 쉽습니다.

Link to this section원활한 구현#

Ultralytics Python 패키지를 사용하여 최첨단 모델을 학습하고 내보내는 것은 매우 간단합니다. 다음 예제는 최신 YOLO26 모델을 학습시키고 빠른 엣지 배포를 위해 ONNX로 내보내는 방법을 보여줍니다.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

기존 워크플로우에 깊이 통합되어 있으면서 현대적인 안정성을 찾는 팀이라면, 전체 Ultralytics 생태계가 지원하는 포괄적인 작업 범용성을 제공하는 Ultralytics YOLO11을 탐색하는 것도 훌륭한 전환 단계입니다.

댓글