Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 대 PP-YOLOE+#

실시간 객체 탐지를 위한 프레임워크를 선택할 때, 머신러닝 엔지니어들은 종종 다양한 고성능 아키텍처를 평가합니다. 산업용 애플리케이션 환경에서 주목할 만한 두 모델은 YOLOv6-3.0과 **PP-YOLOE+**입니다. 두 모델 모두 정확도와 속도의 한계를 뛰어넘었지만, 약간씩 다른 생태계와 배포 하드웨어에 맞춰 최적화되어 있습니다.

이 기술 비교에서는 두 모델의 아키텍처, 성능 지표, 학습 방법론을 심층적으로 살펴보고, 뛰어난 범용성과 사용 편의성을 제공하는 Ultralytics YOLO26과 같은 현대적인 대안을 소개합니다.

Link to this sectionYOLOv6-3.0: 고처리량 산업용 엔진#

Meituan의 Vision AI 부서에서 개발한 YOLOv6-3.0은 산업 환경, 특히 강력한 서버급 GPU를 활용하는 환경에 최적화되어 있습니다.

  • 저자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
  • 조직: Meituan
  • 날짜: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this section아키텍처 혁신#

YOLOv6-3.0은 NVIDIA GPU와 같은 하드웨어 가속기 활용을 극대화하도록 특별히 설계된 EfficientRep 백본을 사용합니다. 이 아키텍처는 넥(neck) 부분에 양방향 연결(Bi-directional Concatenation, BiC) 모듈을 도입하여 다중 스케일 특징의 융합을 크게 향상시킵니다. 또한 앵커 기반 학습(Anchor-Aided Training, AAT) 전략을 통합했습니다. 이 하이브리드 접근 방식은 학습 단계에서는 앵커 기반 네트워크의 강력한 수렴 특성을 활용하면서도, 추론 시에는 앵커를 제거하여 앵커 프리(anchor-free) 패러다임의 빠른 속도를 유지합니다.

YOLOv6에 대해 더 알아보기

Link to this sectionPP-YOLOE+: PaddlePaddle의 탐지 챔피언#

**PP-YOLOE+**는 Baidu 연구원들이 PaddlePaddle 프레임워크 내에서 완전히 개발한 PP-YOLO 시리즈의 진화형입니다. 이 모델은 이미 Paddle 생태계가 구축된 환경에서 뛰어난 성능을 발휘합니다.

Link to this section아키텍처 혁신#

PP-YOLOE+는 TAL(Task Alignment Learning)로 알려진 동적 레이블 할당 전략을 도입한 앵커 프리 탐지기입니다. 이 모델은 CSPRepResNet 백본을 사용하여 계산 효율성을 유지하면서도 의미론적 특징을 효과적으로 포착합니다. 이 모델은 TensorRT 및 OpenVINO를 통한 배포에 고도로 최적화되어 있어, 사용자가 PaddlePaddle API 사용에 익숙하다면 엣지 및 서버 배포를 위한 강력한 선택지가 될 수 있습니다.

PP-YOLOE+에 대해 더 알아보기

프레임워크 고려 사항

PP-YOLOE+는 훌륭한 결과를 제공하지만, PaddlePaddle에 대한 의존도는 PyTorch에 익숙한 엔지니어들에게 학습 곡선을 요구할 수 있습니다. Ultralytics와 같은 통합 프레임워크를 사용하면 설정 시간을 크게 단축할 수 있습니다.

Link to this section성능 비교#

이러한 모델들을 평가하려면 평균 정밀도(mAP)와 추론 속도의 균형을 살펴보아야 합니다. 아래 표는 COCO 검증 데이터셋에서의 성능을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

두 모델 모두 강력한 성능을 보여주지만, YOLOv6-3.0은 일반적으로 더 작은 모델 크기에서 순수 TensorRT 속도 면에서 약간의 우위를 점하며, 이는 고속 자동 결제나 제조 결함 탐지에 매우 효과적입니다. 반면 PP-YOLOE+는 최대 정확도를 위해 더 많은 파라미터 수로 확장하는 데 유리합니다.

Link to this sectionUltralytics의 강점: YOLO26 소개#

YOLOv6-3.0과 PP-YOLOE+ 모두 매우 뛰어난 성능을 자랑하지만, 빠르게 발전하는 컴퓨터 비전 분야에서는 단순히 빠른 속도뿐만 아니라 탁월한 사용 편의성, 낮은 메모리 요구 사항, 그리고 통합된 생태계를 제공하는 아키텍처가 요구됩니다. 바로 이 지점에서 Ultralytics YOLO 모델, 특히 YOLO11과 최첨단 모델인 **YOLO26**이 최신 기술의 기준을 재정의하고 있습니다.

2026년 1월에 출시된 YOLO26은 엣지 우선 및 클라우드 준비 완료 비전 AI를 위한 새로운 벤치마크를 수립하며, 레거시 모델 대비 다음과 같은 상당한 이점을 제공합니다:

  • 엔드투엔드 NMS-Free 디자인: YOLOv10이 마련한 기반을 바탕으로, YOLO26은 후처리 과정에서 NMS(Non-Maximum Suppression)를 기본적으로 제거했습니다. 이를 통해 배포 로직이 크게 단순화되고 복잡한 장면에서의 지연 시간 가변성이 감소합니다.
  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써, YOLO26은 CPU 성능을 획기적으로 가속화하여 IoT 장치 및 모바일 애플리케이션에서 YOLOv6나 PP-YOLOE+보다 훨씬 뛰어난 성능을 발휘합니다.
  • MuSGD 옵티마이저: 고급 LLM 학습 기술(Moonshot AI의 Kimi K2와 같은)에서 영감을 받은 하이브리드 MuSGD 옵티마이저는 전통적인 SGD나 AdamW보다 빠르게 수렴하며 매우 안정적이고 효율적인 학습을 제공합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 드론 영상 및 항공 감시에서 중요한 요소인 소형 객체 인식 능력을 크게 향상시킵니다.
  • 작업 전반의 범용성: 탐지에 집중된 YOLOv6-3.0과 달리, YOLO26은 인스턴스 세그멘테이션, 포즈 추정, 분류, 그리고 회전형 경계 상자(OBB) 탐지를 즉시 지원합니다.

Link to this section간소화된 학습 생태계#

PP-YOLOE+를 배포하려면 PaddlePaddle 환경을 관리해야 하며, YOLOv6-3.0은 연구 중심의 스크립트를 탐색해야 합니다. 반면 Ultralytics 플랫폼은 처음부터 끝까지 원활한 경험을 제공합니다.

최첨단 YOLO26 모델을 학습하는 데는 몇 줄의 Python 코드면 충분합니다:

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

이 간단한 API는 RT-DETR과 같은 트랜스포머 기반 모델 대비 학습 중 메모리 사용량이 적어 고성능 AI를 누구나 쉽게 접근할 수 있도록 민주화합니다.

Link to this section이상적인 사용 사례 및 배포 전략#

적절한 모델을 선택하는 것이 배포 파이프라인 성공의 핵심입니다.

Link to this sectionYOLOv6-3.0을 사용해야 하는 경우#

  • 고속 제조: 산업용 카메라가 전용 NVIDIA T4 또는 A100 GPU로 직접 입력되어 5ms 미만의 일관된 추론을 요구하는 환경.
  • 서버 측 비디오 분석: 순수 GPU 처리량이 주요 병목 현상인 다중 고밀도 비디오 스트림 처리.

Link to this sectionPP-YOLOE+를 사용해야 할 때#

  • Baidu/Paddle 생태계: PaddlePaddle 기술 스택에 많은 투자를 했거나 Baidu 도구 체인에 최적화된 하드웨어에 배포하는 기업 환경.
  • 고정밀 정적 이미지: 엣지 배포 속도보다 Extra-Large(PP-YOLOE+x) 모델의 높은 mAP가 더 중요한 시나리오.

Link to this sectionUltralytics YOLO26을 선택해야 하는 이유#

  • 엣지 및 IoT 장치: NMS-free 디자인과 DFL 제거 기능을 갖춘 YOLO26은 Raspberry Pi, NXP 또는 모바일 CPU 환경에서 의심할 여지 없는 최선의 선택입니다.
  • 다중 작업 애플리케이션: 통합 API를 사용하여 객체 추적, 포즈 추정 또는 세그멘테이션을 동시에 수행해야 하는 프로젝트.
  • 신속한 프로토타이핑에서 프로덕션까지: Ultralytics 플랫폼을 활용하여 간소화된 데이터셋 라벨링, 하이퍼파라미터 튜닝, 원클릭 모델 배포를 수행하는 팀.

더 넓은 탐지 모델의 세계를 탐색하려는 개발자들을 위해, YOLOXDAMO-YOLO와 같은 프레임워크 또한 Ultralytics 문서에서 검토해 볼 가치가 있는 고유한 아키텍처 접근 방식을 제공합니다.

댓글