Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 대 RTDETRv2#

컴퓨터 비전 분야는 지난 몇 년간 비약적으로 발전했으며, 개발자들에게 복잡한 시각적 작업을 해결하기 위한 광범위한 아키텍처 선택지를 제공합니다. 가장 대중적인 패러다임으로는 합성곱 신경망(CNN)과 Detection Transformer(DETR)가 있습니다.

본 가이드는 이 두 범주에서 가장 핵심적인 두 모델인, 매우 효율적이고 널리 채택된 CNN 기반 모델인 Ultralytics YOLOv5와 최첨단 Transformer 기반 실시간 객체 탐지기인 RTDETRv2에 대한 심층적인 기술적 비교를 제공합니다.

Link to this sectionUltralytics YOLOv5: 효율성의 업계 표준#

출시 이후, Ultralytics YOLOv5는 전 세계적으로 수천 개의 상용 애플리케이션과 연구 프로젝트를 뒷받침하며 AI 커뮤니티의 초석이 되었습니다. PyTorch 프레임워크를 기반으로 완전히 구축된 이 모델은 실시간 성능을 저해하지 않으면서 직관적인 개발자 경험을 최우선으로 고려했습니다.

주요 특징:

Link to this section아키텍처 및 강점#

YOLOv5는 매우 낮은 메모리 사용량을 유지하면서 특징 추출 효율성을 극대화하도록 설계된 간소화된 CNN 아키텍처를 활용합니다. 이 모델은 CSPDarknet 백본과 PANet 넥을 사용하여 다중 스케일 특징 융합을 위한 강력한 조합을 만들어냅니다.

One of the primary advantages of YOLOv5 is its Performance Balance. It strikes an exceptional trade-off between speed and accuracy, making it an ideal choice for model deployment on resource-constrained hardware like NVIDIA Jetson devices and smartphones.

또한 YOLOv5는 타의 추종을 불허하는 다재다능함을 자랑합니다. 단순히 경계 상자(bounding box) 예측에 국한된 모델과 달리, YOLOv5는 이미지 분류인스턴스 세분화를 기본적으로 지원하여 다양한 시각적 작업을 위한 통합 프레임워크를 제공합니다. 학습 효율성 또한 뛰어나며, Transformer 기반 아키텍처와 비교하여 학습 중 훨씬 적은 CUDA 메모리를 필요로 합니다.

Link to this section단점#

기존의 CNN 프레임워크를 기반으로 하기 때문에, YOLOv5는 후처리 과정에서 중복된 경계 상자를 제거하기 위해 본질적으로 NMS(Non-Maximum Suppression)에 의존합니다. Ultralytics 프레임워크 내에서 매우 최적화되어 있지만, NMS는 특정 에지 NPU에서 간헐적으로 지연 시간 병목 현상을 일으킬 수 있습니다.

YOLOv5에 대해 더 알아보기

Link to this sectionRTDETRv2: Baidu의 실시간 Transformer#

RTDETRv2(Real-Time Detection Transformer v2)는 실시간 객체 탐지에 Transformer 아키텍처를 적용하는 데 있어 획기적인 발전을 이루었으며, 기존 DETR 모델들을 괴롭혔던 컴퓨팅 비효율성 문제를 해결했습니다.

주요 특징:

Link to this section아키텍처 및 강점#

RTDETRv2는 하이브리드 인코더와 유연한 디코더 설계를 활용하여 이미지를 처리함으로써 이전 모델의 강점을 계승했습니다. Transformer의 셀프 어텐션 메커니즘은 모델에 이미지 맥락에 대한 전역적인 이해를 제공하여, 객체가 심하게 가려진 복잡한 장면에서도 탁월한 성능을 발휘하게 합니다.

A defining feature of RTDETRv2 is its end-to-end, NMS-free design. By predicting object queries directly without requiring anchor boxes or NMS post-processing, it simplifies the inference pipeline. This architecture achieves an impressive mAP (mean Average Precision) on benchmark datasets like COCO.

Link to this section단점#

실시간 성능에도 불구하고, RTDETRv2는 YOLO 모델에 비해 현저히 높은 메모리 요구 사항을 갖습니다. Transformer의 어텐션 메커니즘은 시퀀스 길이에 따라 이차 함수적으로 확장되므로, 거대한 GPU 클러스터를 사용하지 않으면 고해상도 학습 중에 메모리 부족(out-of-memory) 오류가 발생할 수 있습니다. 또한 세분화나 자세 추정에 대한 기본 지원 없이 2D 객체 탐지에만 집중하므로 Ultralytics 생태계의 즉각적인 범용성은 부족합니다.

RTDETR에 대해 더 알아보기

Link to this section성능 비교표#

이 아키텍처들을 객관적으로 평가하기 위해 성능 지표를 정리했습니다. 굵게 표시된 값은 테스트된 스케일 전반에서 가장 효율적이거나 높은 성능을 보인 지표를 나타냅니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
성능 맥락

RTDETRv2-x가 절대적으로 가장 높은 mAP를 달성하지만, YOLOv5n 파라미터의 거의 30배를 요구합니다. 제한된 하드웨어에서 실행되는 고속 애플리케이션의 경우, Ultralytics 모델이 일관되게 최상의 컴퓨팅 효율성을 제공합니다.

Link to this sectionUltralytics 생태계의 이점#

연구용 노트북에서 프로덕션 환경으로 모델을 옮길 때, 모델을 둘러싼 소프트웨어는 신경망 아키텍처만큼이나 중요합니다. Ultralytics가 제공하는 잘 관리된 생태계는 개발 수명 주기를 획기적으로 가속화합니다.

Link to this section비할 데 없는 사용 편의성#

Ultralytics 모델은 매우 간소화된 사용자 경험을 최우선으로 합니다. 사용자 정의 모델을 학습시키거나, 검증을 실행하거나, TensorRT 또는 ONNX와 같은 하드웨어별 형식으로 내보내기를 원할 경우, Ultralytics Python API를 사용하면 단 몇 줄의 코드만으로 이를 달성할 수 있습니다.

다음은 Ultralytics 모델을 사용하여 얼마나 간단하게 학습 및 추론을 실행할 수 있는지 보여주는 실용적인 코드 예제입니다:

from ultralytics import YOLO

# Initialize the model (automatically downloads the weights)
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="cpu")

# Perform inference on an online image
inference_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
inference_results[0].show()

This simple, unified API natively supports experiment tracking integrations with tools like Weights & Biases and Comet, allowing developers to log metrics seamlessly without writing complex boilerplate code.

Link to this section활용 사례 및 권장 사항#

YOLOv5와 RT-DETR 중 선택하는 것은 프로젝트의 특정 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOv5를 선택해야 하는 경우#

YOLOv5는 다음에 추천합니다:

  • 검증된 프로덕션 시스템: YOLOv5의 긴 안정성 이력, 광범위한 문서, 방대한 커뮤니티 지원이 가치 있게 평가되는 기존 배포 환경.
  • 리소스가 제한된 학습: YOLOv5의 효율적인 학습 파이프라인과 낮은 메모리 요구 사항이 유리한, GPU 자원이 제한된 환경.
  • 광범위한 내보내기 형식 지원: ONNX, TensorRT, CoreML, TFLite를 포함한 다양한 형식으로 배포가 필요한 프로젝트.

Link to this sectionRT-DETR을 선택해야 할 때#

RT-DETR 권장 대상:

  • Transformer 기반 탐지 연구: NMS 없이 엔드 투 엔드 객체 탐지를 위해 어텐션 메커니즘과 Transformer 아키텍처를 탐구하는 프로젝트.
  • 유연한 지연 시간을 가진 고정밀 시나리오: 탐지 정확도가 최우선이며, 약간 높은 추론 지연 시간이 허용되는 애플리케이션.
  • 대형 객체 탐지: Transformer의 글로벌 어텐션 메커니즘이 자연스러운 이점을 제공하는, 주로 중대형 객체가 있는 장면.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section향후 전망: YOLO11 및 YOLO26#

오늘 새로운 비전 프로젝트를 시작하신다면, 최신 세대의 Ultralytics 모델을 살펴보시는 것을 강력히 권장합니다.

YOLOv5는 여전히 매우 신뢰할 수 있지만, YOLO11은 개선된 정확도와 OBB(Oriented Bounding Box) 탐지를 포함한 확장된 작업 세트를 제공합니다.

더욱 중요한 것은 최첨단 YOLO26이 양쪽의 장점을 결합했다는 점입니다. YOLOv10에서 처음 도입된 종단 간 NMS-Free 설계를 구현하여 CNN의 효율성을 유지하면서 후처리 오버헤드를 제거했습니다. 또한 YOLO26은 LLM 학습 혁신에서 영감을 받은 MuSGD 옵티마이저를 도입하여 더 빠른 수렴을 제공합니다. DFL 제거(내보내기 간소화 및 에지/저전력 장치 호환성을 위해 분포 초점 손실 제거)를 통해 YOLO26은 최대 43% 더 빠른 CPU 추론을 구현하여 에지 AI를 위한 최고의 선택이 됩니다. 또한, ProgLoss + STAL은 IoT, 로봇 공학 및 항공 이미지 분석에 필수적인 소형 객체 인식 개선을 포함한 향상된 손실 함수를 제공합니다.

Link to this section결론#

YOLOv5와 RTDETRv2 중 선택하는 것은 배포 제약 조건에 따라 크게 달라집니다. RTDETRv2는 강력한 Transformer 어텐션 메커니즘을 활용하여 mAP의 한계를 넓혔지만, 메모리 및 컴퓨팅 오버헤드라는 큰 비용이 따릅니다.

반대로 Ultralytics YOLOv5는 클라우드 서버에서 마이크로컨트롤러까지 모든 환경에서 원활하게 작동하는 검증되고 최적화된 범용 솔루션을 제공합니다. 가능한 최고의 정확도와 원활한 배포 도구를 동시에 원하는 팀에게는 Ultralytics 생태계 내에서 YOLO26으로 업그레이드하는 것이 최신 비전 AI 애플리케이션을 위한 최고의 솔루션입니다.

댓글