콘텐츠로 건너뛰기

YOLOv10과 RTDETRv2: 객체 감지를 위한 기술 비교

최적의 물체 감지 모델을 선택하는 것은 컴퓨터 비전 프로젝트에서 매우 중요한 결정입니다. Ultralytics 효율적인 Ultralytics YOLO 시리즈부터 정확도가 높은 RT-DETR 시리즈에 이르기까지 다양한 요구 사항에 맞는 모델 제품군을 제공합니다. 이 페이지에서는 물체 감지를 위한 두 가지 최첨단 모델인 YOLOv10과 RTDETRv2의 상세한 기술 비교를 통해 정보에 입각한 선택을 할 수 있도록 도와드립니다.

RTDETRv2: 높은 정확도의 실시간 탐지

RTDETRv2(실시간 감지 트랜스포머 v2)는 높은 정확도와 실시간 성능을 우선시하는 고급 객체 감지 모델입니다. 바이두에서 개발하여 2024년 7월에 발표된 아카이브 논문에서 자세히 설명한 RTDETRv2는 비전 트랜스포머(ViT) 아키텍처를 기반으로 정밀한 객체 위치 파악 및 분류가 필요한 시나리오에서 최첨단 결과를 달성합니다.

아키텍처 및 주요 기능

RTDETRv2의 아키텍처는 트랜스포머의 강점을 활용하여 자체 주의 메커니즘을 통해 이미지 내의 글로벌 컨텍스트를 캡처할 수 있습니다. 이 트랜스포머 기반 접근 방식을 통해 모델은 다양한 이미지 영역의 중요도를 평가할 수 있으므로 특히 복잡한 장면에서 특징 추출을 강화하고 정확도를 향상시킬 수 있습니다. 기존의 컨볼루션 신경망(CNN)과 달리 RTDETRv2는 이미지의 더 넓은 맥락을 이해하는 데 탁월하여 강력한 감지 기능을 제공합니다. RT-DETR GitHub 리포지토리에서 구현에 대한 자세한 내용을 확인할 수 있습니다.

성능 지표

RTDETRv2는 인상적인 mAP 점수를 보여주며, 특히 RTDETRv2-x와 같은 더 큰 변형은 54.3의 mAPval50-95를 달성합니다. 추론 속도도 경쟁력이 있어 NVIDIA T4 GPU와 같은 하드웨어 가속을 사용할 때 실시간 애플리케이션에 적합합니다. 아래 비교 표는 다양한 RTDETRv2 및 YOLO10 변형의 성능 메트릭에 대한 자세한 분석을 제공합니다.

강점 및 약점

강점:

  • 뛰어난 정확도: 트랜스포머 아키텍처는 높은 물체 감지 정확도를 지원합니다.
  • 실시간 기능: 특히 다음과 같은 추론 엔진의 하드웨어 가속을 통해 경쟁력 있는 추론 속도를 달성합니다. TensorRT.
  • 효과적인 특징 추출: 비전 트랜스포머는 이미지 내의 글로벌 컨텍스트와 복잡한 디테일을 능숙하게 캡처합니다.

약점:

  • 더 큰 모델 크기: RTDETRv2-x와 같은 모델은 더 작은 YOLO 모델에 비해 매개변수 수가 많고 FLOP이 높기 때문에 더 많은 계산 리소스를 필요로 합니다.
  • 추론 속도 제한: 실시간 지원은 가능하지만, 특히 리소스가 제한된 기기에서는 추론 속도가 가장 빠른 YOLO 모델보다 느릴 수 있습니다.

이상적인 사용 사례

RTDETRv2는 정확성이 가장 중요하고 충분한 계산 리소스를 사용할 수 있는 애플리케이션에 이상적입니다. 여기에는 다음이 포함됩니다:

  • 자율주행 차량: 자율 주행 차량의 안전과 내비게이션에 필수적인 안정적이고 정확한 환경 인식을 위한 AI.
  • 로보틱스: 로봇이 복잡한 환경에서 사물과 정확하게 상호 작용할 수 있도록 지원하여 로봇 공학에서 AI의 역할 역량을 강화합니다.
  • 의료 영상: 의료 영상에서 이상 징후를 정밀하게 감지하여 진단을 지원하고 의료 분야에서 AI의 효율성을 개선합니다.
  • 고해상도 이미지 분석: 위성 이미지 분석에 컴퓨터 비전을 사용하는 것과 유사하게 위성 이미지 또는 산업 검사와 같이 큰 이미지의 상세한 분석이 필요한 애플리케이션입니다.

RTDETRv2에 대해 자세히 알아보기

YOLOv10: 효율적이고 다양한 물체 감지 기능

YOLOv10(You Only Look Once 10)은 물체 감지의 속도와 효율성으로 잘 알려진 Ultralytics YOLO 시리즈의 최신 버전입니다. 칭화대학교의 저자들이 2024년 5월에 발표한 Arxiv 논문에 자세히 설명된 대로, YOLOv10은 이전 YOLO 버전을 기반으로 하여 정확도와 성능을 모두 향상시키는 동시에 실시간 에지를 유지합니다. 공식 GitHub 리포지토리에서 공식 PyTorch 구현을 확인할 수 있습니다.

아키텍처 및 주요 기능

YOLOv10은 효율성과 속도를 간소화하는 데 중점을 둔 단일 단계 객체 감지의 YOLO 전통을 이어갑니다. 아키텍처 혁신과 최적화를 통해 계산 중복성을 줄이고 정확도를 향상시켰습니다. 핵심 기능은 NMS가 필요 없는 접근 방식으로 엔드투엔드 배포와 추론 지연 시간을 단축할 수 있다는 점입니다. 따라서 YOLOv10은 실시간 애플리케이션과 리소스가 제한된 디바이스에 배포하는 데 특히 유리합니다.

성능 지표

YOLOv10은 속도와 정확도 사이에서 균형을 이루며, YOLOv10n부터 YOLOv10x까지 다양한 모델 크기를 제공합니다. 최고 정확도에서는 RTDETRv2보다 약간 뒤처지지만, 추론 속도와 효율성에서는 YOLOv10이 뛰어납니다. 예를 들어, YOLOv10n은 TensorRT 1.56ms의 빠른 추론 속도를 달성하므로 지연 시간에 민감한 애플리케이션에 이상적입니다. 이러한 메트릭에 대한 자세한 내용은 YOLO 성능 메트릭 가이드를 참조하세요.

강점 및 약점

강점:

  • 높은 효율성과 속도: 실시간 애플리케이션과 엣지 배포에 필수적인 빠른 추론에 최적화되어 있습니다.
  • 다용도성: 확장 가능한 성능과 리소스 사용량을 제공하는 다양한 크기(n, s, m, b, l, x)로 제공됩니다.
  • NMS 무료 교육: 엔드투엔드 배포를 가능하게 하고 추론 대기 시간을 줄입니다.
  • 더 작은 모델 크기: RTDETRv2에 비해 매개변수 수와 FLOPs가 적어 리소스가 제한된 환경에 적합합니다.

약점:

  • RTDETRv2에 비해 정확도가 낮습니다: 정확도는 높지만 복잡한 시나리오에서는 RTDETRv2의 최상위 정확도에 도달하지 못할 수 있습니다.
  • 잠재적 트레이드 오프: 극한의 속도를 달성하려면 더 크고 계산 집약적인 모델에 비해 정확도에서 약간의 트레이드 오프가 발생할 수 있습니다.

이상적인 사용 사례

YOLOv10의 효율성과 속도는 특히 리소스가 제한된 디바이스에서 실시간 객체 감지가 필요한 애플리케이션에 탁월한 선택입니다. 여기에는 다음이 포함됩니다:

YOLO10에 대해 자세히 알아보기

모델 비교 표

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4TensorRT10
(ms)
매개변수
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
RTDETRv2-s 640 48.1 - 5.03 20 60
RTDETRv2-m 640 51.9 - 7.51 36 100
RTDETRv2-l 640 53.4 - 9.76 42 136
RTDETRv2-x 640 54.3 - 15.03 76 259

결론

RTDETRv2와 YOLOv10은 각각 다른 우선순위에 맞게 설계된 강력한 물체 감지 모델입니다. RTDETRv2는 최고 수준의 정확도가 필요하고 컴퓨팅 리소스를 사용할 수 있는 경우에 탁월하므로 복잡하고 중요한 애플리케이션에 적합합니다. 반면, YOLOv10은 실시간 성능, 효율성, 리소스 제약이 있는 플랫폼에서의 배포가 가장 중요한 경우 선호되는 선택입니다.

다른 옵션을 탐색하는 사용자를 위해 Ultralytics 다양한 속도-정확도 절충안을 가진 모델을 포함한 다양한 모델 동물원을 제공합니다:

궁극적으로는 정확도, 속도 및 리소스 제약 조건의 균형을 신중하게 고려하여 컴퓨터 비전 프로젝트의 특정 요구 사항에 따라 RTDETRv2와 YOLOv10 또는 기타 Ultralytics 모델 중 하나를 선택해야 합니다. 포괄적인 정보와 구현 가이드는 Ultralytics 설명서GitHub 리포지토리를 참조하세요.

📅1 년 전 생성됨 ✏️ 1개월 전 업데이트됨

댓글