YOLO11 RTDETRv2: 아키텍처, 성능 및 응용 분야

컴퓨터 비전 분야의 급속한 발전 속에서 올바른 객체 탐지 모델 선택은 프로젝트 성공에 결정적입니다. 본 비교 분석은 YOLO11 ( Ultralytics)와 RTDETRv2 (Baidu)라는 두 가지 최첨단 아키텍처를 비교 분석합니다. 이 모델들은 서로 다른 패러다임으로 실시간 탐지에 접근합니다. YOLO11 CNN 기반 효율성과 사용 편의성의 정점을 YOLO11 반면, RTDETRv2는 트랜스포머 기반 탐지의 한계를 확장합니다.

일반 개요

YOLO11 YOLO11은 You Only Look Once(YOLO) 계열의 유산을 계승하여 최대 처리량과 최소 자원 소모를 위한 아키텍처를 정교화했습니다. 탐지, 분할, 자세 추정 등 다양한 비전 작업을 위한 범용 솔루션으로 설계되었습니다. 그 강점은 균형에 있습니다: 자원 제약이 있는 에지 디바이스에서도 탁월한 속도로 높은 정확도를 제공합니다.

RTDETRv2 (실시간 탐지 트랜스포머 버전 2)는 RT-DETR 진화형으로, 트랜스포머 기반 모델에서 흔히 발생하는 지연 문제를 해결하기 위해 고안되었습니다. 훈련 안정성과 성능 향상을 위해 "bag-of-freebies" 기법을 도입했습니다. 뛰어난 정확도를 달성하지만, 일반적으로 더 많은 계산 자원(특히 GPU )을 요구하여 에지 컴퓨팅보다는 고급 하드웨어 배포에 더 적합합니다.

최신 혁신: YOLO26

2026년 최첨단을 추구하는 개발자들을 위해 Ultralytics YOLO26을 Ultralytics . 이 제품은 네이티브 엔드투엔드 NMS 프리 설계, 혁신적인 MuSGD 최적화기, 최대 43% 향상된 CPU 속도를 특징으로 하여 현대 AI 애플리케이션의 최상의 선택입니다.

기술 사양 및 성능

다음 표는 COCO 두 모델의 성능 지표를 보여줍니다. YOLO11 특히 추론 속도와 매개변수 수 측면에서 뛰어난 효율성을 YOLO11 , 이는 실제 생산 환경에 매우 적합함을 의미합니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

RTDETRv2-s	640	48.1	-	5.03	20	60
RTDETRv2-m	640	51.9	-	7.51	36	100
RTDETRv2-l	640	53.4	-	9.76	42	136
RTDETRv2-x	640	54.3	-	15.03	76	259

아키텍처의 차이점

YOLO11 YOLO11은 고도로 최적화된 CNN 기반 백본과 넥을 채택하여, 적은 매개변수로도 복잡한 세부 사항을 포착할 수 있도록 특징 추출을 정교화합니다. 이 아키텍처는 속도를 위해 특별히 설계되어 효율적인 레이어 집계를 활용해 지연 시간을 최소화합니다. 이를 통해 YOLO11 강력한 클라우드 GPU부터 라즈베리 파이 장치에 이르기까지 모든 환경에서 효과적으로 YOLO11 .

반면 RTDETRv2는 하이브리드 인코더-디코더 트랜스포머 아키텍처를 기반으로 합니다. 이 모델은 어텐션 메커니즘을 활용해 글로벌 컨텍스트를 포착하는데, 이는 복잡하고 혼잡한 장면에서 물체를 탐지하는 데 유용할 수 있습니다. 그러나 이는 훈련 및 추론 과정에서 더 높은 메모리 소비를 초래합니다. 어텐션 메커니즘은 본질적으로 입력 크기에 대해 이차적인 계산 복잡도를 요구하므로, 실시간 속도를 달성하기 위해 NVIDIA A100과 같은 강력한 GPU가 필요한 경우가 많습니다.

에코시스템 및 사용 편의성

모델의 아키텍처는 이야기의 절반에 불과합니다. 그 주변의 개발자 경험이 프로토타입에서 생산 환경으로의 전환 속도를 결정합니다.

Ultralytics 장점: YOLO11 "그냥 작동한다"는 철학으로 유명한 Ultralytics 깊이 통합되어YOLO11 .

간단한 Python : 훈련, 검증 및 예측을 단 세 줄의 코드로 수행할 수 있습니다.
Ultralytics : 사용자는 Ultralytics 활용하여 클라우드에서 데이터셋 관리, 주석 자동화, 훈련 실행 모니터링을 수행할 수 있습니다.
광범위한 작업 지원: 단일 프레임워크로 객체 탐지, 인스턴스 분할, 자세 추정, OBB 및 분류를 지원합니다.
유연한 배포: 내장된 내보내기 모드 ONNX, OpenVINO, CoreML및 TFLite 모바일 및 에지 대상에 대한 배포를 TFLite .

RTDETRv2 생태계: RTDETRv2는 주로 연구 목적의 저장소입니다. 강력한 기능을 제공하지만, Ultralytics 볼 수 있는 포괄적인 툴링은 부족합니다. 사용자는 데이터 전처리 및 배포를 위해 종종 맞춤형 스크립트를 작성해야 합니다. 또한 트랜스포머 기반 모델로서, 어텐션 레이어의 복잡한 연산으로 인해 모바일 사용을 TFLite 같은 형식으로의 내보내기는 훨씬 더 어려울 수 있습니다.

YOLO11에 대해 자세히 알아보세요

훈련 및 데이터 효율성

YOLO11 훈련 효율성이 뛰어납니다. CNN 아키텍처는 빠르게 수렴하며, 트랜스포머 기반 대안보다 에포크 수가 적고 GPU 사용량이 현저히 적습니다. 이를 통해 개발자는 소비자용 하드웨어에서 더 큰 배치 크기로 훈련할 수 있습니다. 또한 이 프레임워크는 기본적으로 강력한 하이퍼파라미터 튜닝 및 데이터 증강 전략을 포함합니다.

RTDETRv2는 일반적으로 트랜스포머의 어텐션 가중치를 안정화하기 위해 더 긴 훈련 일정이 필요합니다. 메모리 사용량이 상당히 높으며, RTDETRv2-L 모델 훈련에는 대용량 VRAM을 갖춘 엔터프라이즈급 GPU가 필요한 경우가 많아 클라우드 컴퓨팅 비용이 증가할 수 있습니다.

코드 예시: 교육 YOLO11

YOLO11 훈련은 YOLO11 . 다음 코드 조각은 사전 훈련된 모델을 불러와 사용자 정의 데이터셋으로 미세 조정하는 방법을 보여줍니다:

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset (e.g., COCO8)
# Ideally, data is configured in a simple YAML file
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
for result in results:
    result.show()

실제 응용 분야

YOLO11 장점

가벼운 무게와 다용도 특성으로 인해 YOLO11 다음과 같은 분야에서 선호되는 YOLO11 :

엣지 AI 및 IoT: 컴퓨팅 성능이 제한된 기기에서 스마트 시티 모니터링에 최적화되었습니다.
실시간 스포츠 분석: 저지연이 필수인 고프레임률 비디오 스트림에서 선수와 공 추적.
제조: 조립 라인에서의 고속 결함 검출.
모바일 앱: CoreML TFLite 통해 iOS Android 직접 실행됩니다.

RTDETRv2의 적용 범위

RTDETRv2는 다음과 같은 시나리오에 가장 적합합니다:

하드웨어 제약 없음: 추론을 위한 강력한 서버급 GPU를 사용할 수 있습니다.
글로벌 컨텍스트는 매우 중요합니다: 멀리 떨어진 객체들 간의 관계가 탐지를 정의하는 복잡한 장면들(비록 YOLO11 넓은 수용 야역이 종종 이에 필적하지만).
연구: 트랜스포머 어텐션 메커니즘 실험

결론

YOLO11 RTDETRv2 모두 컴퓨터 비전 분야에 크게 기여합니다. RTDETRv2는 탐지 작업에서 트랜스포머의 잠재력을 보여줍니다. 그러나 대다수의 개발자와 상업적 응용 프로그램의 경우, YOLO11 은 속도, 정확도, 사용 편의성 사이의 탁월한 균형 덕분에 여전히 더 나은 선택입니다. 낮은 메모리 요구량, 다양한 내보내기 옵션, 그리고 Ultralytics 지원은 개발부터 배포까지의 원활한 과정을 보장합니다.

성능을 한 단계 더 끌어올리고자 하는 분들은 YOLO26으로의 업그레이드를 고려해 보십시오. 엔드투엔드 NMS 설계와 에지 디바이스 최적화를 통해 차세대 비전 AI를 구현합니다.

YOLO26에 대해 더 알아보기

모델 세부사항 및 참고 자료

YOLO11

저자: 글렌 조커와 징 치우
조직:Ultralytics
날짜:27
Docs:YOLO11 문서
GitHub:ultralyticsultralytics

RTDETRv2

작성자: Wenyu Lv, Yian Zhao, Qinyao Chang, et al.
Organization: Baidu
날짜:17
Arxiv:2304.08069
GitHub:RT-DETR 리포지토리