RTDETRv2 대 YOLO11: 실시간 객체 탐지 아키텍처에 대한 심층 분석
컴퓨터 비전 분야는 끊임없이 발전하고 있으며, 새로운 아키텍처들이 엣지 디바이스와 클라우드 서버에서 가능한 작업의 한계를 넓히고 있습니다. 현재 실시간 객체 탐지 분야에서 가장 주목받는 두 가지 경쟁자는 RTDETRv2와 YOLO11입니다. 두 모델 모두 뛰어난 성능을 제공하지만, 이들은 트랜스포머 기반 접근 방식과 고도로 최적화된 합성곱 신경망(CNN)이라는 근본적으로 다른 아키텍처 철학을 나타냅니다.
이 포괄적인 기술 비교에서는 두 모델의 아키텍처, 성능 지표, 학습 방법론 및 이상적인 사용 사례를 살펴봄으로써, 차세대 인공지능 애플리케이션을 위한 정보에 입각한 결정을 내릴 수 있도록 돕겠습니다.
RTDETRv2: 트랜스포머 기반의 도전자
기존 Real-Time Detection Transformer의 진화형으로 도입된 RTDETRv2는 어텐션 메커니즘을 활용하여 시각 데이터를 처리합니다. 이미지 패치를 시퀀스로 처리함으로써 이미지 컨텍스트에 대한 전반적인 이해를 달성하며, 이는 복잡한 장면에서 심하게 겹치는 객체를 탐지하는 데 매우 유용합니다.
모델 세부 정보:
- 저자: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang 및 Yi Liu
- 조직: Baidu
- 날짜: 2024-07-24
- Arxiv: 2407.17140
- GitHub: RT-DETR 저장소
- 문서: RTDETRv2 문서
아키텍처의 강점과 약점
RTDETRv2의 주요 혁신은 엔드투엔드 NMS-free 아키텍처입니다. 비최대 억제(NMS)를 제거함으로써 후처리 파이프라인을 단순화했습니다. 또한 다중 스케일 특징 추출 기능이 기존 RT-DETR 모델보다 향상되어 다양한 크기의 객체를 더 잘 식별할 수 있게 되었습니다.
하지만 트랜스포머에 의존하기 때문에 RTDETRv2는 학습 과정에서 일반적으로 상당히 높은 메모리 요구 사항으로 인한 어려움을 겪습니다. 트랜스포머는 대체로 수렴 속도가 느리고 기존 CNN에 비해 훨씬 더 많은 CUDA 메모리를 필요로 하여, 소비자용 하드웨어에서 작업하거나 제한된 엣지 AI 환경에 배포하는 연구자들에게는 접근성이 낮을 수 있습니다.
Ultralytics YOLO11: CNN 효율성의 정점
수년간의 기초 연구를 바탕으로 Ultralytics는 YOLO 계보에서 거대한 도약을 이룬 YOLO11을 출시했습니다. 이 모델은 CNN 아키텍처를 개선하여 전례 없는 속도와 정확도를 달성했으며, 커뮤니티가 기대하는 유연성과 개발자 친화적인 생태계를 유지합니다.
모델 세부 정보:
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2024년 9월 27일
- GitHub: Ultralytics 저장소
Ultralytics의 강점
YOLO11은 성능 균형(Performance Balance) 면에서 뛰어납니다. 속도와 정확도 사이에서 비범한 균형을 이루어, 대규모 클라우드 컴퓨팅 클러스터부터 경량 모바일 디바이스에 이르기까지 다양한 실제 배포 시나리오에서 탁월한 다재다능함을 보여줍니다.
또한 Ultralytics YOLO 모델은 학습 및 추론 중 낮은 메모리 사용량으로 유명합니다. VRAM을 쉽게 소모할 수 있는 트랜스포머 모델과 달리, YOLO11은 표준 GPU에서 더 큰 배치 사이즈를 허용합니다. 더욱이 YOLO11은 단순히 객체 탐지에 국한되지 않으며, 인스턴스 세그멘테이션, 이미지 분류, 포즈 추정 및 지향성 경계 상자(OBB)를 기본적으로 지원하여 놀라운 **범용성(Versatility)**을 자랑합니다.
성능 및 메트릭 비교
수치상으로 비교해 보면 RTDETRv2가 인상적인 정확도를 달성하는 반면, YOLO11은 특히 TensorRT에서 뛰어난 추론 속도와 함께 훨씬 더 세분화된 모델 크기 선택지를 제공한다는 점이 명확해집니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
표에서 볼 수 있듯이, YOLO11x 모델은 RTDETRv2-x 변형과 비교하여 더 적은 FLOPs(194.9B 대 259B)를 사용하면서도 54.7%라는 우수한 mAPval를 달성하고, TensorRT에서 더 빠른 추론(11.3ms 대 15.03ms)을 제공합니다. 나노 및 스몰 YOLO11 변형은 Raspberry Pi와 같이 제약이 있는 디바이스를 위한 독보적인 경량 옵션을 제공합니다.
생태계, 사용 편의성 및 학습
Ultralytics 모델의 결정적인 특징은 간소화된 사용자 경험입니다. ultralytics Python 패키지는 데이터 증강, 분산 학습 및 모델 내보내기의 복잡한 작업을 처리하는 통합적이고 직관적인 API를 제공합니다. RTDETRv2의 연구용 저장소는 상당한 상용구 코드와 구성이 필요한 반면, Ultralytics는 "zero-to-hero" 파이프라인을 제공합니다.
흥미롭게도 Ultralytics 생태계는 매우 강력하여 RT-DETR 모델을 YOLO 모델과 함께 실행하는 것을 기본적으로 지원합니다! 이를 통해 Weights & Biases 및 Comet ML과의 통합을 포함하여 Ultralytics의 잘 관리된 생태계를 활용하여 실험을 쉽게 추적할 수 있습니다.
from ultralytics import RTDETR, YOLO
# Load an RTDETR model seamlessly through the Ultralytics API
model_rtdetr = RTDETR("rtdetr-l.pt")
# Load a highly optimized YOLO11 model
model_yolo = YOLO("yolo11n.pt")
# Train YOLO11 with highly efficient memory usage
results = model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained YOLO model to ONNX format
model_yolo.export(format="onnx")머신러닝에서 학습 효율성은 매우 중요합니다. Ultralytics 모델은 빠르게 수렴하는 사전 학습된 가중치를 활용합니다. 코드를 작성하지 않고 데이터셋, 학습 실행 및 배포 엔드포인트를 관리하려면 통합 MLOps 경험을 제공하는 Ultralytics Platform을 살펴보십시오.
실제 적용 사례
이러한 아키텍처 사이에서 선택하는 것은 종종 프로젝트의 구체적인 배포 제약 조건에 달려 있습니다.
RTDETRv2가 뛰어난 분야: RTDETRv2의 트랜스포머 백본은 전역 컨텍스트가 필요한 밀집되고 심하게 가려진 객체가 있는 시나리오에서 매우 효과적입니다. 이는 종종 학술 연구 및 계산 비용보다 어텐션 기반 관계 매핑이 더 중요한 애플리케이션에서 평가됩니다.
YOLO11이 압도적인 분야: YOLO11은 실용적인 실제 배포 분야의 명백한 승자입니다. 최소한의 메모리 사용량과 놀라울 정도로 빠른 추론 속도는 다음과 같은 분야에 이상적입니다.
- 스마트 제조: 산업용 PC를 사용하여 생산 라인에서 실시간 결함 탐지를 수행합니다.
- 농업: 실시간 작물 건강 모니터링 및 자동화된 수확 로봇을 위해 드론에 배포합니다.
- 리테일 분석: 거대한 서버 팜 없이도 대기열 관리 및 재고 추적을 위해 여러 카메라 스트림을 동시에 처리합니다.
사용 사례 및 권장 사항
RT-DETR와 YOLO11 사이의 선택은 프로젝트의 구체적인 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
RT-DETR을 선택해야 할 시기
RT-DETR은 다음과 같은 경우에 강력한 선택입니다:
- Transformer 기반 탐지 연구: NMS 없이 엔드 투 엔드 객체 탐지를 위해 어텐션 메커니즘과 Transformer 아키텍처를 탐구하는 프로젝트.
- 유연한 지연 시간을 가진 고정밀 시나리오: 탐지 정확도가 최우선이며 약간 더 높은 추론 지연 시간이 허용되는 응용 프로그램.
- 대형 객체 탐지: Transformer의 전역 어텐션 메커니즘이 자연스러운 이점을 제공하는, 중대형 객체가 주로 나타나는 장면.
YOLO11을 선택해야 할 때
YOLO11은 다음 경우에 권장됩니다:
- 프로덕션 엣지 배포: 신뢰성과 활발한 유지 관리가 무엇보다 중요한 Raspberry Pi 또는 NVIDIA Jetson과 같은 디바이스에서의 상용 애플리케이션.
- 다중 작업 비전 애플리케이션: 단일 통합 프레임워크 내에서 탐지, 세그멘테이션, 포즈 추정, OBB 작업이 필요한 프로젝트.
- 신속한 프로토타이핑 및 배포: 간소화된 Ultralytics Python API를 사용하여 데이터 수집에서 프로덕션 단계로 빠르게 전환해야 하는 팀.
Ultralytics(YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최적의 조합을 제공합니다:
- NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.
미래를 향하여: YOLO26의 등장
새로운 프로젝트를 시작하는 경우 차세대 비전 AI인 **Ultralytics YOLO26**을 고려해 보십시오. 2026년 1월에 출시된 YOLO26은 두 세계의 장점을 결합했습니다. YOLOv10에서 처음 도입된 엔드투엔드 NMS-free 디자인을 도입하여, RTDETRv2와 마찬가지로 후처리 지연 시간을 완전히 제거하면서도 CNN의 독보적인 속도를 제공합니다.
YOLO26은 LLM 학습 혁신에서 영감을 받은 MuSGD 옵티마이저를 탑재하여 매우 안정적이고 빠른 수렴을 보장하며, DFL(Distribution Focal Loss)을 제거하여 최대 43% 더 빠른 CPU 추론을 제공합니다. 소형 객체 인식 능력을 크게 향상시키는 전문화된 ProgLoss + STAL 손실 함수를 갖춘 YOLO26은 모든 현대적인 컴퓨터 비전 파이프라인을 위한 최고의 추천 모델입니다.
검증된 범용성을 위해 YOLO11을 선택하든, 어텐션 메커니즘을 위해 RTDETRv2를 선택하든, 아니면 최고의 엣지 성능을 위해 최첨단 YOLO26을 선택하든, Ultralytics 문서는 귀하의 컴퓨터 비전 여정에서 성공하는 데 필요한 모든 리소스를 제공합니다.