콘텐츠로 건너뛰기

YOLOv10 YOLO: 기술 비교

최적의 물체 감지 모델을 선택하는 것은 정확도, 속도, 계산 비용 간의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 다음과 같은 기술 비교를 자세히 설명합니다. YOLOv10의 최신 고효율 모델과 알리바바 그룹의 강력한 검출기인 YOLO 자세히 비교합니다. 두 모델의 아키텍처, 성능 메트릭, 이상적인 사용 사례를 분석하여 컴퓨터 비전 프로젝트를 위한 정보에 입각한 선택을 할 수 있도록 도와드립니다.

YOLOv10: 실시간 엔드투엔드 탐지

2024년 5월 칭화대학교 연구진에 의해 소개된 YOLOv10 실시간 객체 감지의 중요한 진전을 의미합니다. 주요 혁신은 후처리 오버헤드를 줄이고 추론 지연 시간을 낮추는 비최대 억제(NMS)의 필요성을 제거하여 엔드투엔드 감지를 달성하는 것입니다.

기술 세부 정보:
저자: Ao Wang, Hui Chen, Lihao Liu 등
조직:칭화대학교
날짜: 2024-05-23
아카이브:https://arxiv.org/abs/2405.14458
깃허브:https://github.com/THU-MIG/yolov10
문서ultralytics

아키텍처 및 주요 기능

YOLOv10 강력한 Ultralytics 프레임워크를 기반으로 구축되어 사용 편의성과 강력한 에코시스템을 그대로 계승합니다. 이 아키텍처는 뛰어난 효율성과 성능을 위한 몇 가지 주요 발전 사항을 도입했습니다:

  • NMS 교육: YOLOv10 학습 중에 레이블에 일관된 이중 할당을 사용합니다. 이를 통해 NMS 후처리 단계 없이도 모델이 깨끗한 예측을 생성할 수 있으므로 배포 파이프라인을 간소화하고 진정한 엔드투엔드로 만들 수 있습니다.
  • 전체적인 효율성-정확도 설계: 모델 아키텍처는 계산 중복성을 줄이도록 포괄적으로 최적화되었습니다. 여기에는 속도와 기능을 모두 향상시키는 경량 분류 헤드와 공간-채널 분리 다운샘플링이 포함됩니다.
  • 원활한 Ultralytics 통합: Ultralytics 에코시스템의 일부인 YOLOv10 간소화된 사용자 경험의 이점을 누릴 수 있습니다. 여기에는 간단한 Python API, 광범위한 문서, 효율적인 교육 프로세스, 즉시 사용 가능한 사전 학습된 가중치 등이 포함됩니다. 이러한 통합을 통해 개발자는 매우 쉽게 모델을 시작하고 신속하게 배포할 수 있습니다.

NMS 중요한 이유

기존의 객체 감지기는 하나의 객체에 대해 여러 개의 바운딩 박스를 예측하는 경우가 많습니다. 비최대 억제NMS는 이러한 중복을 걸러내는 데 사용되는 후처리 단계입니다. YOLOv10 NMS 제거함으로써 특히 밀리초 단위가 중요한 엣지 배포 시나리오에서 추론 지연 시간과 복잡성을 크게 줄여줍니다.

YOLOv10 대해 자세히 알아보기

YOLO: NAS 중심 효율성

YOLO 알리바바 그룹에서 개발한 빠르고 정확한 물체 감지 모델입니다. 2022년 11월에 출시된 이 모델은 검색 알고리즘을 통한 아키텍처 최적화에 중점을 두고 YOLO 탐지기의 성능 한계를 뛰어넘는 몇 가지 새로운 기술을 도입했습니다.

기술 세부 정보:
저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen 등
조직:알리바바 그룹
날짜: 2022-11-23
아카이브:https://arxiv.org/abs/2211.15444
GitHubYOLO
문서YOLO

아키텍처 및 주요 기능

YOLO 속도와 정확성의 균형을 개선하기 위한 고급 기술을 탐구합니다. 이 아키텍처의 특징은 다음과 같습니다:

  • 신경망 아키텍처 검색(NAS): YOLO 백본은 NAS를 사용하여 생성되어 탐지 작업에 특별히 맞춤화된 고도로 최적화된 특징 추출 네트워크가 가능합니다.
  • 효율적인 RepGFPN 넥: 서로 다른 규모의 피처를 효율적으로 융합하는 새로운 피처 피라미드 네트워크(FPN) 설계인 RepGFPN을 통합합니다.
  • 제로헤드 및 AlignedOTA: 이 모델은 단순화된 제로 파라미터 헤드와 향상된 라벨 할당 전략인 AlignedOTA(정렬된 최적 전송 할당)를 사용하여 감지 정확도와 로컬라이제이션을 향상시킵니다.
  • 지식 증류: YOLO 지식 증류를 활용하여 대규모 교사 네트워크에서 학습함으로써 소규모 모델의 성능을 더욱 향상시킵니다.

DAMO-YOLO에 대해 자세히 알아보세요.

정면 성능 비교

다음 표는 COCO 데이터 세트에서 다양한 YOLOv10 및 YOLO 모델 크기의 성능을 비교한 것입니다. YOLOv10 지속적으로 우수한 성능을 보여주며, 더 짧은 지연 시간과 더 적은 매개변수로 더 높은 정확도를 제공합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

데이터에서 알 수 있듯이, YOLOv10 모델은 일반적으로 효율성 측면에서 YOLO 모델보다 우수합니다. 예를 들어, YOLOv10 더 높은 mAP (46.7 대 46.0)를 달성하는 동시에 훨씬 더 빠르며(2.66ms 대 3.45ms) 매개 변수가 절반 이하(7.2M 대 16.3M)입니다. 이러한 추세는 모든 모델 크기에 걸쳐 유지되며, YOLOv10 54.4의 가장 높은 mAP 도달하면서 정점을 찍습니다.

강점 및 약점 분석

YOLOv10 강점

  • 최첨단 효율성: YOLOv10 속도와 정확성의 탁월한 균형을 제공하며, 종종 더 적은 매개변수와 더 짧은 지연 시간으로 경쟁사보다 뛰어난 성능을 발휘합니다.
  • 사용 편의성: 이 모델은 Ultralytics 에코시스템과의 통합 덕분에 매우 사용자 친화적입니다.
  • 엔드투엔드 배포: NMS 필요 없는 설계로 교육부터 추론까지 전체 워크플로우를 간소화하여 엣지 디바이스의 실제 애플리케이션에 이상적입니다.
  • 메모리 요구량 감소: 더 복잡한 아키텍처에 비해 YOLOv10 훈련과 추론 모두에서 메모리 사용량이 효율적입니다.

YOLO 강점

  • 높은 성능: DAMO-YOLO는 경쟁력 있는 정확도와 속도를 달성하여 객체 감지 분야에서 강력한 경쟁자가 됩니다.
  • 혁신적인 기술: NAS와 같은 최첨단 연구 개념과 학문적 탐구에 유용한 고급 라벨 할당 전략이 통합되어 있습니다.

약점

  • YOLOv10: 물체 감지에는 탁월하지만, YOLOv10 현재 다목적인 Ultralytics YOLO11 은 세분화, 분류, 포즈 추정을 기본적으로 지원합니다.
  • YOLO: 이 모델의 아키텍처와 훈련 파이프라인은 YOLOv10 비해 더 복잡합니다. 주로 특정 연구 도구 상자 내에서만 사용할 수 있어, Ultralytics 제공하는 것과 같은 보다 통합적이고 사용자 친화적인 솔루션을 선호하는 개발자에게는 장벽이 될 수 있습니다.

Ultralytics 이점

두 모델 모두 인상적이지만, Ultralytics 모델인 YOLOv10 플래그십 모델인 YOLO11 은 개발자와 연구자에게 뚜렷한 이점을 제공합니다:

  1. 통합된 에코시스템: Ultralytics 데이터 주석, 교육 및 배포가 원활하게 이루어지는 응집력 있는 플랫폼을 제공합니다.
  2. 사용의 용이성: 간단한 Python API를 사용하면 몇 줄의 코드만으로 모델을 로드하고 추론을 실행할 수 있습니다.
  3. 다목적성: Ultralytics 인스턴스 세분화, 이미지 분류, 포즈 추정, OBB(오리엔티드 바운딩 박스) 등 다양한 작업을 지원합니다.
  4. 커뮤니티 지원: 활발한 커뮤니티와 방대한 문서가 문제 해결에 오래 걸리지 않도록 도와줍니다.

사용 예시: Ultralytics 사용한 YOLOv10

YOLOv10 실행하는 것은 Ultralytics Python 패키지를 사용하여 간단합니다. 다음은 사전 학습된 모델을 로드하고 이미지에 대해 예측을 실행하는 방법입니다:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Perform object detection on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

결론

YOLOv10 YOLO 모두 강력한 객체 감지 모델입니다. YOLO NAS 기반 아키텍처와 고급 기능 융합에 대한 연구에 훌륭한 참고 자료가 됩니다. 그러나 실제 배포 및 MLOps 효율성을 위해, YOLOv10 이 탁월한 선택입니다. NMS 필요 NMS 아키텍처와 포괄적인 Ultralytics 에코시스템이 결합되어 개념에서 프로덕션으로 더 빠르게, 더 나은 성능으로 전환할 수 있습니다.

여러 비전 작업에서 더욱 다양한 기능을 필요로 하는 사용자에게는 다음을 살펴볼 것을 적극 권장합니다. YOLO11를 살펴볼 것을 적극 권장합니다.

다른 모델 비교 살펴보기

이 모델들이 다른 주요 아키텍처와 어떻게 비교되는지 알아보려면 다음 비교표를 확인하세요:


댓글