Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 대 RTDETRv2#

컴퓨터 비전 분야는 매우 빠른 속도로 발전하고 있으며, 새로운 아키텍처들이 실시간 객체 탐지의 최첨단 기술(SOTA)을 끊임없이 재정의하고 있습니다. 이러한 진화의 두 가지 중요한 이정표는 YOLOv10과 RTDETRv2입니다. 두 모델 모두 기존 탐지 파이프라인의 근본적인 병목 현상인 NMS(Non-Maximum Suppression) 후처리를 제거하는 것을 목표로 하지만, 이 문제에 접근하는 아키텍처 패러다임은 완전히 다릅니다.

이 기술적 비교에서는 두 모델의 아키텍처, 학습 방법론 및 이상적인 배포 시나리오를 심층적으로 분석하여 개발자와 연구자가 차기 비전 AI 프로젝트에 적합한 도구를 선택할 수 있도록 돕습니다.

Link to this sectionYOLOv10: NMS-Free의 선구자#

칭화대학교 연구진이 개발한 YOLOv10은 아키텍처 효율성과 후처리 병목 현상 제거에 크게 중점을 둡니다. NMS-free 학습을 위한 일관된 이중 할당(consistent dual assignments)을 도입하여, 추론 지연 시간을 크게 줄이면서도 경쟁력 있는 성능을 달성합니다.

Link to this section기술 사양#

Link to this section아키텍처 및 방법론#

YOLOv10의 주요 혁신은 효율성과 정확도를 모두 고려한 전체적인 모델 설계에 있습니다. 두 관점 모두에서 다양한 구성 요소를 최적화하여 계산 오버헤드를 크게 줄였습니다. 일관된 이중 할당 전략을 통해 모델은 NMS에 의존하지 않고 학습할 수 있으며, 이는 간소화된 엔드투엔드 배포 파이프라인으로 이어집니다. 이는 모델을 ONNXTensorRT와 같은 엣지 형식으로 내보낼 때 특히 유용한데, 이때 후처리 작업은 예상치 못한 지연 시간을 유발할 수 있기 때문입니다.

Link to this section강점 및 약점#

이 모델은 특히 작은 변형 모델(N 및 S)에서 탁월한 속도-정확도 트레이드오프를 보여줍니다. 최소한의 지연 시간 덕분에 고속 엣지 환경에 이상적입니다. 그러나 YOLOv10은 원시 탐지 속도는 뛰어나지만, 여전히 탐지 전용 모델입니다. 인스턴스 세그멘테이션이나 포즈 추정이 필요한 팀은 더 범용적인 프레임워크를 찾아야 할 것입니다.

YOLOv10에 대해 더 알아보기

Link to this sectionRTDETRv2: Detection Transformer의 정교화#

원래의 Real-Time Detection Transformer를 기반으로 구축된 RTDETRv2는 성능 향상을 위해 여러 가지 'bag of freebies'를 통합하였으며, Transformer가 실시간 시나리오에서 CNN과 경쟁할 수 있음을 보여줍니다.

Link to this section기술 사양#

Link to this section아키텍처 및 방법론#

RTDETRv2는 시각적 특징 추출을 위한 CNN(Convolutional Neural Network) 백본과 포괄적인 장면 이해를 위한 Transformer 인코더-디코더를 결합한 하이브리드 아키텍처를 사용합니다. Transformer의 셀프 어텐션 메커니즘을 통해 모델은 이미지를 전역적으로 파악할 수 있어 복잡한 장면, 겹치는 객체, 밀집된 군중을 처리하는 데 매우 효과적입니다.

Link to this section강점 및 약점#

Transformer 아키텍처는 특히 더 큰 파라미터 규모에서 우수한 정확도를 제공하며 NMS 없이 최종 탐지 결과를 기본적으로 출력합니다. 하지만 그 대가가 따릅니다. Transformer 모델은 일반적으로 학습 중에 훨씬 더 많은 CUDA 메모리를 필요로 하며 순수 CNN 아키텍처에 비해 수렴 속도가 느릴 수 있습니다. RTDETRv2는 추론 속도가 향상되었지만, 일반적으로 가벼운 YOLO 변형 모델보다 메모리를 더 많이 소비합니다.

RTDETRv2에 대해 자세히 알아보기

Link to this section성능 비교#

성능 지표를 평가하면 각 모델이 어디에서 강점을 보이는지 더 명확하게 알 수 있습니다. 다음 표는 COCO 데이터셋에서의 성능을 강조합니다:

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

데이터를 분석하면 YOLOv10이 유사한 크기에서 파라미터 효율성과 TensorRT 추론 속도 면에서 확실한 우위를 점하고 있음을 알 수 있습니다. RTDETRv2-x는 정확도 면에서 거대한 YOLOv10x와 대등하지만, 약 2,000만 개의 파라미터와 상당히 높은 FLOPs를 추가로 요구합니다.

Link to this section활용 사례 및 권장 사항#

YOLOv10과 RT-DETR 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOv10을 선택해야 할 때#

YOLOv10은 다음 용도에 강력한 선택지입니다:

  • NMS 없는 실시간 탐지: Non-Maximum Suppression 없이 엔드 투 엔드 탐지를 수행하여 배포 복잡성을 줄이는 애플리케이션.
  • 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 스케일 전반에서 추론 속도와 탐지 정확도 사이의 강력한 균형이 필요한 프로젝트.
  • 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.

Link to this sectionRT-DETR을 선택해야 할 때#

RT-DETR 권장 대상:

  • Transformer 기반 탐지 연구: NMS 없이 엔드 투 엔드 객체 탐지를 위해 어텐션 메커니즘과 Transformer 아키텍처를 탐구하는 프로젝트.
  • 유연한 지연 시간을 가진 고정밀 시나리오: 탐지 정확도가 최우선이며, 약간 높은 추론 지연 시간이 허용되는 애플리케이션.
  • 대형 객체 탐지: Transformer의 글로벌 어텐션 메커니즘이 자연스러운 이점을 제공하는, 주로 중대형 객체가 있는 장면.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 강점: 생태계와 혁신#

YOLOv10과 RTDETRv2 모두 강력한 탐지 기능을 제공하지만, 모델 선택은 종종 주변 소프트웨어 생태계에 좌우됩니다. Ultralytics Platform은 딥러닝의 복잡성을 추상화하는 원활하고 통합된 인터페이스를 제공합니다.

Link to this section새로운 표준: Ultralytics YOLO26#

최고의 성능을 추구하는 개발자들에게 Ultralytics YOLO26은 최근 아키텍처 발전의 정점을 보여줍니다. 2026년 초에 출시된 YOLO26은 YOLOv10이 개척한 엔드투엔드 NMS-Free 설계를 계승하여 NMS 후처리를 완전히 제거함으로써 더 빠르고 간편한 배포를 가능하게 합니다.

왜 YOLO26을 선택해야 합니까?

YOLO26은 MuSGD 옵티마이저(SGD와 Muon의 하이브리드)를 통해 LLM 학습 혁신을 컴퓨터 비전에 도입하여 더 안정적인 학습과 빠른 수렴을 달성합니다. 또한 최대 43% 더 빠른 CPU 추론을 자랑하며 엣지 컴퓨팅을 위한 최고의 선택이 되었습니다.

또한 YOLO26은 작은 객체 인식에서 눈에 띄는 개선을 위해 ProgLoss + STAL을 도입했으며, 전문화된 YOLOv10과 달리 뛰어난 범용성을 제공합니다. 이 모델은 객체 탐지, 세그멘테이션, 포즈, 그리고 시맨틱 세그멘테이션 손실과 포즈를 위한 RLE(Residual Log-Likelihood Estimation)와 같은 작업별 개선 사항이 적용된 회전된 경계 상자(OBB)를 기본적으로 지원합니다. 나아가 Distribution Focal Loss(DFL)를 제거하여 내보내기 프로세스를 간소화하고 저전력 장치와의 호환성을 높였습니다.

YOLO26에 대해 자세히 알아보기

Link to this section사용 편의성과 학습 효율성#

Ultralytics YOLO11과 같은 이전 세대 모델로 실험하든 최첨단 YOLO26으로 작업하든, 간소화된 Python API는 학습 중 메모리 사용량을 줄이고 워크플로우를 극도로 빠르게 만듭니다.

from ultralytics import RTDETR, YOLO

# Train the end-to-end YOLOv10 model
model_yolo = YOLO("yolov10n.pt")
model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Alternatively, evaluate RTDETR within the same API
model_rtdetr = RTDETR("rtdetr-l.pt")
results = model_rtdetr.predict("https://ultralytics.com/images/bus.jpg")

잘 관리된 생태계는 하이퍼파라미터 튜닝을 위한 도구를 제공하며, 광범위한 추적 솔루션 및 모델 배포 옵션과 완벽하게 통합됩니다.

Link to this section결론#

YOLOv10과 RTDETRv2는 모두 NMS-free 객체 탐지를 향한 강력한 이정표입니다. RTDETRv2는 높은 메모리 요구 사항에도 불구하고 Transformer가 뛰어난 전역 문맥 이해와 함께 실시간 지연 시간을 달성할 수 있음을 입증합니다. YOLOv10은 리소스가 제한된 탐지 작업을 위해 맞춤화된 매우 효율적이고 빠른 CNN 대안을 제공합니다.

그러나 균형 잡힌 성능, 다중 작업 범용성, 가장 성숙한 생태계를 고려할 때 개발자들은 Ultralytics YOLO26을 활용하는 것을 적극 권장합니다. 이 모델은 전작들의 아키텍처 혁신과 비전 AI 배포를 원활하게 만드는 강력하고 사용자 친화적인 도구들을 아름답게 결합합니다.

댓글