콘텐츠로 건너뛰기

YOLOv10과 YOLO: 물체 감지를 위한 상세한 기술 비교

컴퓨터 비전 애플리케이션에서 최적의 물체 감지 모델을 선택하는 것은 매우 중요한데, 모델마다 정확도, 속도, 효율성이 크게 다르기 때문입니다. 이 페이지에서는 객체 감지 환경의 두 가지 고급 모델인 YOLOv10과 YOLO 자세히 기술적으로 비교합니다. 두 모델의 아키텍처, 성능 벤치마크, 적합한 애플리케이션을 살펴보고 모델 선택 과정을 안내합니다.

YOLOv10

YOLOv10은 실시간 물체 감지 기능으로 유명한 YOLO 시리즈의 최신 버전입니다. 칭화대학교 연구진이 개발하여 2024년 5월 23일에 소개(arXiv 사전 인쇄본 arXiv:2405.14458)된 YOLOv10은 엔드투엔드 효율성과 향상된 성능을 위해 설계되었습니다. 공식 PyTorch 구현은 GitHub에서 확인할 수 있습니다.

아키텍처 및 주요 기능

YOLOv10은 아키텍처를 간소화하고 속도와 정확도 사이의 균형을 개선하는 데 중점을 둔 몇 가지 혁신을 도입하여 NMS 없는 훈련과 효율적인 모델 설계로 나아갑니다. 아키텍처의 주요 특징은 다음과 같습니다:

  • NMS 없는 훈련: 비최대 억제(NMS) 없이 훈련에 일관된 이중 할당을 사용하여 사후 처리 오버헤드와 추론 지연 시간을 줄입니다.
  • 전체적인 효율성-정확도 중심 설계: 다양한 모델 구성 요소를 종합적으로 최적화하여 계산 중복을 최소화하고 탐지 기능을 향상시킵니다.
  • 백본 및 네트워크 구조: 개선된 기능 추출 레이어와 간소화된 네트워크 구조로 파라미터 효율성과 처리 속도가 향상되었습니다.

성능 지표

YOLOv10은 다양한 모델 규모에 걸쳐 최첨단 성능을 제공하며, 다양한 계산 요구사항에 맞는 다양한 옵션을 제공합니다. COCO 데이터 세트의 성능 메트릭은 다음과 같습니다:

  • mAP: COCO 검증 데이터 세트에서 경쟁사 평균 평균 정밀도(mAP)를 달성합니다. 예를 들어, YOLOv10-S는 46.7%의 mAPval50-95를 달성합니다.
  • 추론 속도: 인상적인 추론 속도를 제공하며, YOLOv10-N은 T4 TensorRT10에서 1.56ms의 추론 시간에 도달합니다.
  • 모델 크기: 다양한 크기(N, S, M, B, L, X)로 제공되며, 모델 크기는 2.3M 파라미터의 YOLOv10-N부터 56.9M의 YOLOv10-X까지 다양합니다.

강점 및 약점

강점:

  • 실시간 성능: 속도와 효율성에 최적화되어 실시간 애플리케이션에 이상적입니다.
  • 높은 정확도: 특히 YOLOv10-X와 같은 대형 모델에서 최첨단 정확도를 달성합니다.
  • 엔드투엔드 효율성: NMS가 없는 설계로 지연 시간을 줄이고 배포를 간소화합니다.
  • 다목적성: 다양한 물체 감지 작업에 적합하며 라즈베리 파이, NVIDIA Jetson과 같은 엣지 디바이스를 비롯한 다양한 하드웨어 플랫폼에 적용할 수 있습니다.
  • 사용 편의성: Ultralytics Python 패키지와의 통합으로 교육, 검증 및 배포 워크플로가 간소화됩니다.

약점:

  • 신흥 모델: 최근 모델로서 커뮤니티 지원과 광범위한 에코시스템에서 사전 훈련된 가중치는 기존 모델에 비해 아직 개발 중일 수 있습니다.
  • 트레이드오프: 작은 모델은 속도가 우선시되므로 더 큰 변형이나 더 복잡한 모델에 비해 정확도가 다소 떨어질 수 있습니다.

사용 사례

YOLOv10은 다음과 같이 고속의 정확한 물체 감지가 필요한 애플리케이션에 적합합니다:

YOLOv10에 대해 자세히 알아보기

DAMO-YOLO

알리바바 그룹에서 개발한 YOLO 2022년에 도입된 고성능 객체 감지 모델입니다(arXiv 사전 인쇄본 arXiv:2211.15444v2). 효율적인 물체 감지를 위해 여러 가지 고급 기술을 통합하여 빠르고 정확하도록 설계되었습니다. 공식 구현과 문서는 GitHub에서 확인할 수 있습니다.

아키텍처 및 주요 기능

YOLO 속도와 정확성의 균형을 이루기 위해 몇 가지 혁신적인 구성 요소를 통합했습니다:

  • NAS 백본: 신경망 아키텍처 검색(NAS)을 활용하여 객체 감지 작업에 최적화된 효율적인 백본 네트워크를 설계합니다.
  • 효율적인 RepGFPN: 효율적인 피처 융합 및 멀티 스케일 피처 표현을 위해 RepGFPN(Reparameterized Gradient Feature Pyramid Network)을 사용합니다.
  • 제로헤드: 감지 정확도를 유지하면서 계산 오버헤드를 최소화하도록 설계된 경량 감지 헤드입니다.
  • AlignedOTA: 훈련 중 라벨 할당을 개선하기 위해 AlignedOTA(정렬된 최적 전송 할당)를 사용하여 탐지 성능을 향상시킵니다.
  • 증류 향상: 지식 증류 기법을 통합하여 모델 성능을 더욱 향상시킵니다.

성능 지표

YOLO 모델은 다양한 성능 요구 사항을 충족하기 위해 다양한 크기(소형, 소형, 중형, 대형)로 제공됩니다. 주요 성과 지표는 다음과 같습니다:

  • mAP: COCO와 같은 벤치마크 데이터 세트에서 높은 mAP를 달성합니다. 예를 들어, YOLO 50.8% mAPval50-95에 도달합니다.
  • 추론 속도: 빠른 추론 속도를 제공하여 실시간 애플리케이션에 적합하며, YOLO T4 TensorRT10에서 2.32ms의 추론 시간을 달성했습니다.
  • 모델 크기: 모델 크기는 다양하며, 8.5M 매개변수(YOLO)에서 42.1M 매개변수(YOLO)에 이르기까지 다양한 배포 시나리오에 유연하게 적용할 수 있습니다.

강점 및 약점

강점:

  • 높은 정확도: 아키텍처 혁신과 고급 훈련 기법을 통해 뛰어난 탐지 정확도를 달성합니다.
  • 빠른 추론: 속도에 초점을 맞춰 설계되어 실시간 시스템에 적합한 효율적인 추론 성능을 제공합니다.
  • 효율적인 설계: NAS 백본과 경량 헤드를 통합하여 컴퓨팅 효율성을 최적화합니다.
  • 포괄적인 기능 세트: 강력한 성능을 위해 RepGFPN 및 AlignedOTA와 같은 여러 고급 기술을 통합합니다.

약점:

  • 복잡성: NAS와 여러 고급 구성 요소의 통합으로 인해 사용자 지정 및 수정이 복잡해질 수 있습니다.
  • 리소스 요구 사항: 규모가 큰 YOLO 모델은 매우 가벼운 대안에 비해 상당한 컴퓨팅 리소스가 필요할 수 있습니다.

사용 사례

YOLO 다음과 같이 높은 정확도와 빠른 물체 감지 속도를 요구하는 애플리케이션에 적합합니다:

YOLO 대해 자세히 알아보기

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4TensorRT10
(ms)
매개변수
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
다모욜로 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

사용자는 YOLOv10 및 YOLO Ultralytics YOLO 제품군의 다른 모델과 비교하는 데에도 관심이 있을 수 있습니다:

  • YOLOv8: YOLOv8 다양성과 사용 편의성을 YOLO 비교하여 살펴보세요.
  • YOLOv9: YOLOv9와 YOLO 아키텍처 혁신에 대해 알아보세요.
  • RT-DETR: RT-DETR YOLO 엔드투엔드 탐지기를 비교합니다.
  • EfficientDet: 효율성 중심 모델과 YOLO 비교를 통해 효율성 중심 모델의 비교를 확인하세요.
  • PP-YOLO: PP-YOLO와 YOLO 같은 효율적인 대체 모델을 고려하세요.
📅1 년 전 생성됨 ✏️ 1개월 전 업데이트됨

댓글