콘텐츠로 건너뛰기

YOLO26 대 RTDETRv2: 차세대 실시간 탐지기의 기술적 비교

컴퓨터 비전 분야의 급속한 발전 속에서, 속도, 정확도, 배포 유연성 간의 균형을 맞추기 위해서는 올바른 객체 탐지 모델을 선택하는 것이 매우 중요합니다. 본 가이드는 실시간 성능을 위해 설계된 두 가지 최첨단 아키텍처인 Ultralytics RTDETRv2 간의 포괄적인 기술적 비교를 제공합니다.

두 모델 모두 현대적 혁신을 활용해 높은 정확도를 달성하지만, 아키텍처 철학, 최적화 전략, 배포 용이성 측면에서 크게 차이가 납니다. 본 분석은 컴퓨터 비전 애플리케이션에 대한 정보에 기반한 결정을 내리는 데 도움을 주기 위해 두 모델의 지표, 구조적 차이점, 이상적인 사용 사례를 심층적으로 살펴봅니다.

경영진 요약

Ultralytics 2026년 1월 출시된 YOLO 최신 진화 버전입니다. 본래부터 종단 간(NMS) 설계를 도입하여 비최대 억제(NMS)와 같은 후처리 단계가 필요하지 않습니다. DFL 제거 및 새로운 MuSGD 최적화기 같은 최적화를 통해 YOLO26은 엣지 디바이스에서 최대 효율을 발휘하도록 설계되어, 이전 버전 대비 최대 43% 빠른 CPU 제공합니다. 통합된 Ultralytics 일부로서 원활한 훈련, 검증 및 배포를 보장합니다.

바이두가 개발한 RTDETRv2 (실시간 탐지 트랜스포머 v2) RT-DETR 하이브리드 인코더를 RT-DETR 유연한 이산 쿼리 선택을 RT-DETR 기존 RT-DETR 발전시켰습니다. 이 모델은 트랜스포머의 정확도 이점을 실시간 시나리오에 적용하는 데 중점을 둡니다. 트랜스포머 아키텍처를 NMS (노드 간 선택)를 제거하지만, 일반적으로 CNN 기반 또는 하이브리드 최적화 YOLO 비해 더 많은 계산 자원과 GPU 필요합니다.

성능 지표 비교

아래 표는 COCO 두 모델의 성능을 비교한 것입니다. YOLO26은 특히 매개변수 수와 추론 속도 측면에서 뛰어난 효율성을 보여주어, 에지 AI 애플리케이션에 매우 적합합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

성능 균형

YOLO26은 훨씬 적은 mAP 더 높은 mAP 달성합니다. 예를 들어, YOLO26s는 GPU 약 2배 빠른 속도를 보 GPU 절반 미만(950만 vs 2000만) GPU RTDETRv2-s (48.6 vs 48.1 mAP)보다 우수한 성능을 보입니다.

심층적인 아키텍처 분석

Ultralytics YOLO26

YOLO26은 정확도를 저하시키지 않으면서 배포를 단순화하고 속도를 향상시키기 위한 획기적인 아키텍처 변경 사항을 다수 도입합니다.

  • 엔드투엔드 NMS: 기존 YOLO 주요 차이점으로, YOLO26은 본질적으로 엔드투엔드 구조를 가집니다. 이 설계는 비최대 억제(NMS) 후처리 단계를 제거하여 배포 시 지연 시간과 복잡성을 줄입니다. 이 접근법은 YOLOv10 에서 처음 제안되었으며 여기서 더욱 정교화되었습니다.
  • DFL 제거: 분포 초점 손실(Distribution Focal Loss)을 제거함으로써 모델 구조가 단순화됩니다. 이 변경은 에지 및 저전력 장치와의 호환성 향상에 핵심적이며, 다음과 같은 형식으로의 내보내기를 간소화합니다. ONNX 및 CoreML 내보내기를 간소화합니다.
  • MuSGD 최적화기: Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM) 훈련 혁신에서 영감을 받아, YOLO26은 SGD 결합한 하이브리드 최적화기를 활용합니다. 이를 통해 더 안정적인 훈련 역학과 더 빠른 수렴을 달성합니다.
  • ProgLoss + STAL: 점진적 손실 균형(Progressive Loss Balancing)과 소형 대상 인식 라벨 할당(Small-Target-Aware Label Assignment)의 결합은 항공 이미지 분석과 같은 컴퓨터 비전 작업에서 흔히 발생하는 과제인 소형 물체 탐지 성능을 크게 향상시킵니다.

YOLO26에 대해 더 알아보기

RTDETRv2

RTDETRv2는 CNN 기반 YOLO의 우위를 도전하기 위해 설계된 트랜스포머 기반 탐지기인 기존 RT-DETR 기반 위에 구축되었습니다.

  • 트랜스포머 백본: NMS 없이도 객체 쿼리를 본질적으로 처리하는 트랜스포머 인코더-디코더 아키텍처를 활용합니다.
  • 유연한 이산 쿼리: 기존 방식에 비해 쿼리 선택을 위한 보다 유연한 메커니즘을 도입하여 다양한 규모에 걸친 적응성을 향상시키는 것을 목표로 한다.
  • 하이브리드 인코더: 다중 스케일 특징을 처리하기 위해 하이브리드 인코더를 활용하며, 셀프 어텐션의 계산 비용과 전역적 컨텍스트 요구 사이의 균형을 맞추려 시도한다.

사용 편의성 및 에코시스템

가장 중요한 차별화 요소 중 하나는 모델을 둘러싼 생태계입니다.

Ultralytics 성숙하고 광범위한 Ultralytics 생태계의 혜택을 누릴 수 있습니다. 사용자는 탐지, 분할, 분류, 자세 추정, 방향성 경계 상자(OBB) 등 다양한 작업에 걸쳐 훈련, 검증 및 배포를 위한 통합 API를 활용할 수 있습니다. Ultralytics Weights & Biases 과 같은 도구와의 원활한 통합을 통해 실험 추적 및 모델 관리를 손쉽게 수행할 수 있습니다.

RTDETRv2는 강력하지만, 종종 더 복잡한 설정과 구성이 필요합니다. 특정 변환기 라이브러리에 대한 의존성과 높은 메모리 오버헤드로 인해 "플러그 앤 플레이" 솔루션을 찾는 개발자들에게는 접근성이 떨어질 수 있습니다. 문서화와 커뮤니티 지원은 점차 확대되고 있지만, 일반적으로 Ultralytics 제공되는 풍부한 리소스보다 포괄적이지 않습니다.

훈련 효율성과 자원

메모리 요구 사항: RTDETRv2와 같은 트랜스포머 기반 모델은 메모리 소모가 매우 큰 것으로 악명 높습니다. 이들은 일반적으로 YOLO26의 CNN 최적화 아키텍처에 비해 훈련 및 추론 과정에서 훨씬 더 많은 CUDA 필요로 합니다. 이로 인해 YOLO26은 소비자용 GPU에서 훈련하거나 리소스가 제한된 하드웨어에 배포할 때 보다 실용적인 선택이 됩니다.

훈련 속도: MuSGD 최적화기와 효율적인 아키텍처 덕분에 YOLO26은 더 빠른 수렴 속도를 제공합니다. 이는 의료 영상 데이터셋 작업이든 제조 품질 관리 시스템이든, 맞춤형 모델 훈련과 관련된 시간 및 컴퓨팅 비용을 절감합니다.

코드 예시: YOLO26 훈련

Ultralytics Python 를 사용하면 YOLO26 훈련이 간단합니다:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

사용 사례 권장 사항

다음과 같은 경우 YOLO26을 선택하십시오:

  • 에지 배포가 최우선 과제입니다: CPU 모델 크기가 중요한 제약 조건인 모바일 기기(Android), 라즈베리 파이 또는 임베디드 시스템에서 모델을 실행해야 합니다. 43% 더 빠른 CPU 성능은 여기서 판도를 바꿀 요소입니다.
  • 다기능성이 요구됩니다: 귀하의 프로젝트는 여러 작업을 포함합니다. YOLO26은 탐지, 분할, 자세 추정, OBB를 지원하는 통합 모델 계열인 반면, RTDETRv2는 주로 탐지에 초점을 맞춥니다.
  • 신속한 개발: 간소화된 사용자 경험, 방대한 문서, 즉시 사용 가능한 사전 훈련된 가중치, 그리고 활발한 커뮤니티 지원을 원합니다.
  • 소형 물체 탐지: 드론 기반 농업 모니터링과 같이 소형 물체를 탐지하는 애플리케이션에서는 ProgLoss와 STAL이 뚜렷한 이점을 제공합니다.

다음과 같은 경우 RTDETRv2를 선택하십시오:

  • 연구 관심사: 학술 연구를 위해 특히 트랜스포머 기반 아키텍처를 조사하고 있습니다.
  • 특정 하드웨어: 메모리 오버헤드가 덜 중요한 고성능 서버급 GPU(예: A100)를 사용할 수 있으며, 특히 트랜스포머 기반 접근법이 필요합니다.

결론

RTDETRv2가 실시간 탐지에서 트랜스포머의 잠재력을 보여주는 반면, Ultralytics 실용적인 현장 배포에 있어 여전히 최상의 선택입니다. 엔드투엔드 NMS 프리 추론, 현저히 낮은 리소스 요구 사항, Ultralytics 통합이 결합되어 개발자와 엔지니어에게 필수 솔루션으로 자리매김했습니다. 스마트 시티 인프라 구축, 자율 로봇 개발, 모바일 앱 제작 등 어떤 분야든 YOLO26은 속도, 정확도, 사용 편의성 사이의 최적의 균형을 제공합니다.

Ultralytics 다른 모델을 살펴보고 싶은 사용자를 위해, YOLO11 은 여전히 완전히 지원되는 강력한 대안으로, 다양한 컴퓨터 비전 작업에 대한 견고한 기준선을 제공합니다.

모델 상세 정보

YOLO26

RTDETRv2


댓글