콘텐츠로 건너뛰기

RTDETRv2 대YOLO: 현대 실시간 객체 탐지를 위한 종합 가이드

컴퓨터 비전 분야는 연구자와 엔지니어들이 속도, 정확도, 효율성을 완벽하게 조화시킨 모델 구축을 위해 끊임없이 노력하며 진화하고 있다. 이 분야에서 큰 파장을 일으킨 두 가지 주요 아키텍처는 바이두가 개발한 RTDETRv2와 알리바바 그룹이 제작한YOLO. 두 모델 모두 실시간 객체 탐지의 한계를 넓혔으나, 인상적인 성과를 달성하기 위해 근본적으로 다른 아키텍처 철학을 채택했다.

이 기술 비교에서는 해당 모델들의 아키텍처, 훈련 방법론, 실제 배포 역량을 심층적으로 분석합니다. 또한 광범위한 생태계, 특히 고도로 최적화된 Ultralytics 최첨단 YOLO26 아키텍처와의 비교 평가도 진행할 예정입니다.

아키텍처 혁신

이러한 모델의 핵심 메커니즘을 이해하는 것은 생산 환경에 적합한 도구를 선택해야 하는 머신러닝 엔지니어에게 매우 중요합니다.

RTDETRv2: 트랜스포머 접근 방식

기존 RT-DETR 성공을 바탕으로, RTDETRv2는 하이브리드 인코더와 트랜스포머 디코더를 활용합니다. 이 설계는 모델이 글로벌 컨텍스트를 매우 효과적으로 처리할 수 있게 하여, 밀집된 장면에서 겹치는 객체를 구별하는 데 탁월한 성능을 발휘합니다. 이 아키텍처의 가장 큰 장점은 기본적으로 NMS(비최대 억제)가 필요 NMS 설계입니다. NMS 단계를 제거함으로써 RTDETRv2는 추론 파이프라인을 간소화하고 다양한 하드웨어 구성에서 더 안정적인 지연 시간을 보장합니다.

RTDETRv2에 대해 자세히 알아보세요.

YOLO: CNN 효율성 향상

반면YOLO 매우 성공적인 CNN 기반 YOLO 계승하면서도 여러 획기적인 개선 사항을 도입했습니다. 신경망 구조 탐색(NAS)을 활용해 백본을 최적화하여 최대의 특징 추출 효율을 보장합니다. 또한 효율적인 RepGFPN(재매개변수화 일반화 피라미드 네트워크)과 ZeroHead 설계를 도입하고, AlignedOTA 및 디스틸레이션 향상 기법을 적용합니다. 이러한 혁신을YOLO 매우 경쟁력 있는mAPval 점수를 유지하면서 빠른 추론 속도를YOLO .

DAMO-YOLO에 대해 자세히 알아보세요.

건축적 분화

RTDETRv2는 NMS 없이 전역적 특징 이해를 위한 어텐션 메커니즘 활용에 중점을 두는 반면,YOLO NAS와 고급 디스틸레이션을 통해 전통적 CNN 효율성을YOLO . 표준 후처리가 필요하지만 특정 하드웨어에서 뚜렷한 속도 이점을 제공합니다.

성능 및 지표 비교

모델 배포를 평가할 때 평균 정밀도(mAP), 추론 속도, 매개변수 수와 같은 성능 지표가 가장 중요합니다. 아래는 두 모델 계열에 대한 상세한 비교입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

결과 분석

표에서 볼 수 있듯이, RTDETRv2-x는mAPval 54.3이라는 최고 정확도를 달성하며 COCO 같은 복잡한 검증에서 트랜스포머 아키텍처의 성능을 입증합니다. 그러나 이는 훨씬 더 많은 매개변수(76M)와 FLOPs를 필요로 하는 대가를 치릅니다.

반대로 DAMO-YOLO (Tiny)는 매우 가벼워 850만 개의 매개변수만 필요로 하여 CUDA 극도로 제한된 환경에서 놀라울 정도로 빠른 옵션입니다.YOLO 레거시 에지 디바이스에 대해 속도와 정확도 사이에서 유리한 절충점을 제공합니다.

생태계, 사용성 및 Ultralytics

공식 RT-DETR YOLO 같은 독립 저장소에서는 이러한 모델을 훈련하는 원시 코드를 제공하지만, 이를 생산 파이프라인에 통합하려면 종종 방대한 양의 상용 코드와 수동 최적화가 필요합니다.

Ultralytics 바로 여기서 개발자 경험을 획기적으로 간소화합니다. Ultralytics RTDETRv2와 같은 모델을 통합 API에 직접 Ultralytics 사용자가 단 한 줄의 코드로 모델을 훈련, 검증 및 내보낼 수 있게 합니다. 또한 Ultralytics 무거운 트랜스포머 기반 독립형 저장소에 비해 훈련 중 최소한의 메모리 요구 사항으로 유명합니다.

코드 예시: 원활한 통합

Ultralytics Python 활용하여 추론을 실행하는 방법은 다음과 같이 간단합니다. 트랜스포머 모델을 사용하든 최신 CNN을 사용하든 API는 동일하게 유지됩니다.

from ultralytics import RTDETR, YOLO

# Load an RTDETRv2 model for complex scene understanding
model_rtdetr = RTDETR("rtdetr-l.pt")

# Load the latest Ultralytics YOLO26 model for ultimate edge performance
model_yolo26 = YOLO("yolo26n.pt")

# Run inference on a sample image effortlessly
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")
results_yolo = model_yolo26("https://ultralytics.com/images/bus.jpg")

# Display the results
results_yolo[0].show()

생산용 모델 내보내기

Ultralytics 를 사용하면 원활하게 훈련된 모델을 내보내기 간단한 CoreML TensorRT, ONNX 또는 CoreML 같은 형식으로 변환합니다. model.export(format="engine") 명령을 통해 배포 과정의 마찰을 획기적으로 줄입니다.

이상적인 사용 사례

이러한 아키텍처 중에서 선택하는 것은 전적으로 특정 프로젝트 요구 사항에 달려 있습니다:

  • RTDETRv2는 VRAM이 풍부한 서버 측 처리에서 탁월한 성능을 발휘합니다. 이 모델의 글로벌 컨텍스트 인식 능력은 가림 현상이 빈번한 의료 영상 및 밀집 군중 분석에 완벽하게 적합합니다.
  • YOLO 매개변수 수가 적고 높은 FPS가 필수적인 임베디드 IoT 애플리케이션 및 고속 산업용 검사 라인에 매우 적합합니다.

미래: Ultralytics

RTDETRv2와YOLO 모두YOLO , 컴퓨터 비전 분야는 빠르게 발전하고YOLO . 새로운 프로젝트에는 최신 기술인 Ultralytics 는 속도, 정확도, 개발자 경험의 궁극적인 통합을 보여줍니다.

YOLO26은 엔드투엔드 NMS 설계를 채택하여, 막대한 계산 오버헤드 없이 트랜스포머의 주요 이점을 구현합니다. 대규모 언어 모델 훈련에서 영감을 받은 혁신적인 MuSGD 최적화기를통합하여 안정적이고 빠른 수렴을 달성합니다. 또한 DFL 제거 (간편한 수출 및 에지/저전력 장치 호환성 향상을 위한 분포 초점 손실 제거)를 통해 YOLO26은 최대 43% 빠른 CPU 달성하여 에지 컴퓨팅 분야의 확실한 챔피언으로 자리매김했습니다. 더불어 ProgLoss + STAL은 IoT, 로봇공학, 항공 이미징에 중요한 소형 물체 인식 성능을 현저히 개선한 향상된 손실 함수를 제공합니다.

경계 상자에만 국한된 모델과 달리, YOLO26 제품군은 인스턴스 분할자세 추정부터 방향성 경계 상자(OBB)에 이르기까지 다양한 작업을 지원하는 탁월한 다용도성을 제공하며, 직관적인 Ultralytics 통해 모든 작업이 원활하게 관리됩니다.

플랫폼에서 YOLO26 탐색하기

모델 세부사항 및 참고 자료

RTDETRv2

DAMO-YOLO

다른 비교를 살펴보고 싶은 사용자를 위해, RTDETRv2 대 YOLO11 또는 YOLO YOLOv8 대한 가이드를 확인하여 이 모델들이 이전 세대 Ultralytics 비교하여 어떻게 성능을 발휘하는지 살펴보세요.


댓글