콘텐츠로 건너뛰기

YOLOv6.0 대 RTDETRv2: 산업용 CNN과 실시간 트랜스포머의 대결

컴퓨터 비전 분야의 급속한 발전 속에서 가장 효율적인 객체 탐지 아키텍처를 둘러싼 경쟁은 기존 컨볼루션 신경망(CNN)과 신흥 트랜스포머 기반 모델 사이에서 주로 벌어진다. 본 비교 분석은 산업용 애플리케이션에 최적화된 CNN의 강자 YOLOv6.0과 YOLO 도전하기 위해 설계된 실시간 탐지 트랜스포머 RTDETRv2를 대상으로 한다.

두 모델 모두 인상적인 성능을 제공하지만, 프로젝트에 적합한 도구를 선택하려면 각 아키텍처의 장단점을 이해하는 것이 중요합니다. 속도, 정확성, 사용 편의성이라는 두 가지 장점을 모두 갖춘 통합 솔루션을 찾는 개발자에게는 Ultralytics YOLO26과 같은 최첨단 대안을 제공합니다.

성과 지표 비교

다음 표는 모델 간 성능 차이를 보여줍니다. YOLOv6. YOLOv6 전용 하드웨어에서의 순수 처리량에 중점을 두는 반면, RTDETRv2는 트랜스포머 아키텍처를 통해 후처리 병목 현상을 제거하는 것을 목표로 합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

YOLOv6.0: 산업 전문가

메이투안 ( 美团 )이 개발하여 2023년 초에 출시한 YOLOv6. YOLOv6 단일 단계 객체 탐지 분야에서 중요한 이정표입니다. 이 모델은 공장 자동화나 물류와 같은 산업 현장에서 발생하는 하드웨어 제약 조건 하에서 NVIDIA T4와 같은 GPU의 활용도를 극대화해야 하는 산업용 애플리케이션을 위해 특별히 설계되었습니다.

아키텍처 및 설계

YOLOv6.YOLOv6 RepVGG 스타일 블록으로 강화된 양방향 경로 통합 네트워크인 RepBi-PAN 아키텍처를 도입합니다. 이 설계는 높은 추론 속도를 유지하면서 효율적인 특징 융합을 가능하게 합니다. 또한 이 모델은 수렴 안정성을 향상시키기 위해 앵커 기반 및 앵커 프리 패러다임의 장점을 결합한 하이브리드 전략인 앵커 보조 훈련(AAT)을 활용합니다.

주요 강점

  • GPU : 전용 가속기에서 "나노" 및 "소형" 변종은 놀라울 정도로 높은 프레임 속도를 제공하여 고속 영상 분석에 적합합니다.
  • 양자화 친화적: 이 아키텍처는 양자화를 고려하여 설계되어 TensorRT 사용한 에지 하드웨어로의 배포를 용이하게 합니다.
  • 산업용 초점: 분리형 헤드와 같은 기능은 지연 시간 변동성을 최소화해야 하는 특정 산업용 검사 작업에 최적화되어 있습니다.

6에 대해 자세히 알아보기

RTDETRv2: 트랜스포머 챌린저

RTDETRv2는 바이두에서 비롯되었으며, 원본을 개선한 버전입니다. RT-DETR (Real-Time DEtection TRansformer)를 발전시킨 모델입니다. 다중 스케일 특징 처리와 관련된 계산 병목 현상을 해결함으로써, 트랜스포머 기반 아키텍처가 속도와 정확도 측면에서 모두 CNN 기반 YOLO를 능가할 수 있음을 입증하고자 합니다.

아키텍처 및 설계

RTDETRv2는 다중 스케일 특징을 효율적으로 처리하는 하이브리드 인코더와 IoU 쿼리 선택 메커니즘을 결합합니다. RTDETRv2의 독특한 특징은 적응형 디코더로, 사용자가 추론 시점에 디코더 레이어 수를 조정할 수 있게 합니다. 이는 재훈련 없이도 속도와 정확도 사이의 유연한 조정이 가능하게 하여 동적 환경에서 큰 장점을 제공합니다.

주요 강점

  • NMS: 변환기인 RTDETRv2는 객체를 직접 예측하므로 비최대 억제(NMS)가 필요하지 않습니다. 이는 배포 파이프라인을 단순화하고 지연 시간 변동을 줄입니다.
  • 높은 정확도: 본 모델은 특히 COCO 인상적인 평균 정밀도(mAP)를 달성하며, 복잡한 장면에서 유사한 CNN들을 종종 능가합니다.
  • 다용도성: 추론 속도를 동적으로 조정할 수 있는 능력은 변동하는 컴퓨팅 자원에 매우 유연하게 대응할 수 있게 합니다.

RT-DETR에 대해 자세히 알아보세요.

Ultralytics : 왜 YOLO26을 선택해야 할까요?

YOLOv6.0과 RTDETRv2가 각자의 영역에서 탁월한 성능을 발휘하는 반면, Ultralytics 양쪽의 한계를 모두 해결하는 포괄적인 솔루션을 제공합니다. YOLO 최신 진화형인 YOLO26은 트랜스포머의 NMS(네트워크 모드 선택) NMS 장점과 CNN(컨볼루션 신경망)의 원초적인 효율성을 결합합니다.

통합 워크플로

Ultralytics 사용하면 아키텍처 간에 원활하게 전환할 Ultralytics . 동일한 통합 API와 데이터셋 형식을 사용하여 YOLOv6 훈련하고, RT-DETR 테스트하며, YOLO26 모델을 배포할 수 있습니다.

탁월한 효율성과 구조

YOLO26은 NMS네트워크 모듈러레이션 시스템) 가 필요 없는 원생적인 종단간 설계를 채택하며, 이는 YOLOv10에서 최초로 선보인 획기적인 기술입니다. 이를 YOLOv6 요구되던 무거운 후처리 과정을 제거하는 YOLOv6 RTDETRv2의 어텐션 메커니즘과 관련된 막대한 메모리 사용량을 피할 수 있습니다.

  • MuSGD 최적화기: 대규모 언어모델(LLM) 훈련 혁신에서 영감을 받아 개발된 새로운 MuSGD 최적화기는 안정적인 훈련과 더 빠른 수렴을 보장하며, 대규모 비전 작업에 안정성을 제공합니다.
  • 43% 더 빠른 CPU : 분포 초점 손실(DFL)을 제거하고 에지 컴퓨팅을 위해 아키텍처를 최적화함으로써, YOLO26은 YOLOv6 RTDETRv2보다 CPU에서 훨씬 더 빠른 성능을 발휘하여 모바일 및 IoT 기기에 이상적인 선택입니다.
  • ProgLoss + STAL: 고급 손실 함수는 기존 산업 모델이 종종 어려움을 겪는 핵심 영역인 소형 물체 탐지 성능을 향상시킵니다.

탁월한 다용도성

YOLOv6.0 YOLOv6 주로 탐지 전문가인 것과 달리, Ultralytics 본질적으로 다중 모달입니다. 단일 프레임워크가 다음을 지원합니다:

사용 편의성 및 에코시스템

Ultralytics "초보자부터 전문가까지"의 경험을 제공합니다. 개발자는 Ultralytics 활용하여 데이터셋 관리, 클라우드 기반 훈련, 그리고 다음과 같은 다양한 형식으로의 배포를 수행할 수 있습니다. ONNX, OpenVINO, CoreML 등 다양한 형식으로의 배포를 수행할 수 있습니다.

이 생태계는 적극적으로 유지 관리되어 여러분의 프로젝트가 최신 버전과 호환성을 유지하도록 보장합니다. Python 버전 및 하드웨어 드라이버와 호환성을 유지합니다. 이는 정적 연구 저장소를 사용할 때 종종 간과되는 중요한 요소입니다.

훈련 코드 예시

Ultralytics 사용한 최신 모델 훈련은 Ultralytics . 다음 코드 조각은 효율적인 YOLO26n 모델을 로드하고 훈련하는 방법을 보여줍니다:

from ultralytics import YOLO

# Load the YOLO26 Nano model (End-to-End, NMS-free)
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset for 100 epochs
# The system automatically handles data downloading and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")

결론

기존 하드웨어에서 산업용 GPU 엄격히 요구하는 애플리케이션의 경우, YOLOv6.0은 여전히 강력한 경쟁자입니다. 트랜스포머 기반 어텐션 메커니즘이 필요한 연구 시나리오에서는 RTDETRv2가 유연성을 제공합니다. 그러나 속도, 정확도, 낮은 메모리 사용량, 장기적 유지보수성 사이의 균형이 요구되는 대부분의 실제 배포 환경에서는 Ultralytics 더 나은 선택입니다. 엔드투엔드 설계와 CPU 통해 이전 세대에서는 달성할 수 없었던 새로운 엣지 AI 가능성을 열어줍니다.

YOLO26에 대해 더 알아보기


댓글