콘텐츠로 건너뛰기

YOLOv10 YOLOv9: 종합적인 기술 비교

물체 감지의 환경은 속도와 정확성의 한계를 뛰어넘는 YOLO (You Only Look Once) 아키텍처의 연속적인 반복을 통해 빠르게 진화해 왔습니다. 최근 이 분야에서 가장 중요한 두 가지 기여는 다음과 같습니다. YOLOv10YOLOv9. 두 모델 모두 COCO 데이터 세트에서 최첨단 성능을 달성하지만, 설계 철학과 아키텍처 목표가 크게 다릅니다.

YOLOv10 비최대 억제NMS의 필요성을 제거하여 짧은 지연 시간과 엔드투엔드 효율성을 우선시하는 반면, YOLOv9 프로그래밍 가능한 그라데이션 정보(PGI)를 통해 정보 보존과 정확성을 극대화하는 데 중점을 둡니다. 이 가이드는 개발자와 연구자가 컴퓨터 비전 애플리케이션에 가장 적합한 모델을 선택할 수 있도록 상세한 기술 비교를 제공합니다.

YOLOv10: 엔드투엔드 실시간 탐지기

칭화대학교 연구진이 2024년 5월에 출시했습니다, YOLOv10 은 YOLO 계보의 패러다임 전환을 의미합니다. 주요 혁신은 전통적으로 추론 지연의 병목 현상이었던 비최대 억제(NMS) 후처리 단계를 제거한 것입니다.

기술 세부 사항:

아키텍처 및 주요 혁신

YOLOv10 일관된 이중 할당과 전체적인 효율성-정확성 중심 모델 설계의 조합을 통해 효율성을 달성합니다.

  1. NMS 교육: 기존의 YOLO 모델은 중복된 바운딩 박스를 필터링하기 위해 NMS 의존합니다. YOLOv10 모델 훈련 중에 이중 할당 전략을 활용합니다. 일대다 브랜치는 학습을 위한 풍부한 감독 신호를 제공하는 반면, 일대일 브랜치는 추론 중에 모델이 객체당 하나의 최상의 예측을 생성하도록 보장합니다. 이를 통해 NMS 없이 모델을 배포할 수 있으므로 추론 대기 시간을 크게 줄일 수 있습니다.
  2. 모델 최적화: 이 아키텍처에는 경량 분류 헤드, 공간 채널 분리형 다운샘플링, 순위 가이드 블록 설계가 포함됩니다. 이러한 기능은 계산 중복과 메모리 사용량을 줄여 리소스가 제한된 하드웨어에서 모델을 매우 효율적으로 만듭니다.

효율성 이점

YOLOv10 NMS 제거한 것은 엣지 배포에 특히 유용합니다. CPU 리소스가 부족한 디바이스에서는 수천 개의 후보 상자를 정렬하고 필터링하는 데 드는 계산 비용을 피할 수 있어 속도가 크게 향상될 수 있습니다.

YOLOv10 대해 자세히 알아보기

YOLOv9: 정보 보존 마스터하기

2024년 2월 왕치엔야오와 홍위안 마크 리아오가 소개합니다, YOLOv9 은 심층 신경망에 내재된 '정보 병목' 문제를 해결하고자 합니다. 데이터가 연속적인 레이어(특징 추출)를 통과하면서 중요한 정보가 손실될 수 있으며, 특히 작거나 detect 어려운 물체의 경우 정확도가 떨어질 수 있습니다.

기술 세부 사항:

아키텍처 및 주요 혁신

YOLOv9 네트워크가 최대한 많은 입력 정보를 유지하고 활용할 수 있도록 새로운 개념을 도입했습니다.

  1. 프로그래밍 가능한 그라데이션 정보(PGI): PGI는 네트워크 가중치 업데이트를 위해 신뢰할 수 있는 그라데이션을 생성하는 보조 감독 프레임워크를 제공합니다. 이를 통해 딥 레이어가 완전한 입력 정보를 수신하여 사라지는 그라데이션 문제를 완화하고 수렴을 개선할 수 있습니다.
  2. 일반화된 효율적인 계층 집계 네트워크(GELAN): 이 새로운 아키텍처는 이전 버전에서 사용되던 기존 ELAN을 대체합니다. GELAN은 매개변수 활용과 계산 효율성(FLOPs)을 최적화하여 YOLOv9 이전 버전과 비슷한 모델 크기로 더 높은 정확도를 달성할 수 있도록 합니다.

딥러닝 인사이트

정보 보존에 중점을 둔 YOLOv9 백본에서 다운샘플링 작업 중 특징 세부 정보가 손실될 수 있는 복잡한 장면에서 오브젝트를 감지하는 데 매우 강력합니다.

YOLOv9 대해 자세히 알아보기

성능 지표: 속도 대 정확도

이 두 모델 사이의 선택은 종종 원시 추론 속도와 탐지 정밀도 사이의 절충안으로 귀결됩니다. 아래 표는 다양한 모델 규모에 따른 성능 차이를 강조하고 있습니다.

분석:

  • 지연 시간: 지연 시간: YOLOv10 특히 더 작은 모델 크기(N 및 S)에서 지연 시간에서 YOLOv9 지속적으로 우수한 성능을 보입니다. 예를 들어, YOLOv10n은 TensorRT 1.56ms의 추론 속도를 달성하여 동급 모델보다 훨씬 빠릅니다.
  • 정확도: YOLOv9 스펙트럼의 높은 끝단에서 정확도가 뛰어납니다. YOLOv9e 모델은 55.6%의 놀라운 mAP 달성하여 정밀도가 가장 중요한 애플리케이션에 탁월한 선택이 될 수 있습니다.
  • 효율성: YOLOv10 파라미터당 뛰어난 정확도를 제공합니다. YOLOv10b는 YOLOv9c보다 낮은 지연 시간으로 52.7%의 mAP 달성하여 전체적인 설계의 효율성을 입증합니다.
모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

이상적인 사용 사례

각 모델의 강점을 이해하면 특정 프로젝트 목표에 적합한 도구를 선택하는 데 도움이 됩니다.

YOLOv10 선택해야 하는 경우

  • 엣지 AI 배포: NVIDIA Jetson이나 라즈베리 파이와 같은 디바이스에서 실행되는 애플리케이션은 CPU 오버헤드를 줄여주는 NMS 설계의 이점을 누릴 수 있습니다.
  • 고주파 비디오 분석: 교통 모니터링이나 스포츠 분석과 같이 고FPS 비디오 스트림을 처리해야 하는 시나리오.
  • 실시간 로보틱스: 내비게이션 및 장애물 회피를 위해 지연 시간이 짧은 피드백 루프에 의존하는 자율 시스템.

YOLOv9 선택해야 할 때

  • 고정밀 검사: 결함(오탐)을 놓치면 비용이 많이 드는 산업 품질 관리.
  • 작은 물체 감지: 위성 이미지 분석이나 의료 영상과 같이 물체가 작고 특징이 잘 드러나지 않는 애플리케이션.
  • 복잡한 장면: 객체를 구별하기 위해 최대한의 정보 보존이 필요한 오클루전이나 복잡성이 높은 환경입니다.

Ultralytics 함께 사용

이러한 모델을 사용할 때의 중요한 장점 중 하나는 Ultralytics 에코시스템에 통합된다는 점입니다. YOLOv10 YOLOv9 모두 동일한 통합 Python API와 명령줄 인터페이스CLI를 통해 활용할 수 있으므로 교육부터 배포까지 워크플로우를 간소화할 수 있습니다.

Python 예제

다음 코드는 두 모델을 사용하여 추론을 로드하고 실행하는 방법을 보여줍니다. ultralytics 패키지를 참조하십시오.

from ultralytics import YOLO

# Load a YOLOv10 model (NMS-free, high speed)
model_v10 = YOLO("yolov10n.pt")

# Load a YOLOv9 model (High accuracy)
model_v9 = YOLO("yolov9c.pt")

# Run inference on an image
# The API remains consistent regardless of the underlying architecture
results_v10 = model_v10("https://ultralytics.com/images/bus.jpg")
results_v9 = model_v9("https://ultralytics.com/images/bus.jpg")

# Print results
for r in results_v10:
    print(f"YOLOv10 Detections: {r.boxes.shape[0]}")

for r in results_v9:
    print(f"YOLOv9 Detections: {r.boxes.shape[0]}")

Ultralytics 이점

컴퓨터 비전 프로젝트에 Ultralytics 선택하면 모델 아키텍처 외에도 여러 가지 이점이 있습니다:

  • 사용 편의성: 사용자 친화적인 API를 통해 YOLOv9, YOLOv10 및 다음과 같은 다른 모델 간에 전환할 수 있습니다. YOLO11 와 같은 다른 모델로 전환할 수 있습니다.
  • 성능 균형: Ultralytics 구현은 실제 성능에 최적화되어 속도와 정확성의 균형을 맞춥니다.
  • 훈련 효율성: 이 프레임워크는 자동 혼합 정밀도(AMP) 및 GPU GPU 훈련과 같은 기능을 지원하므로 자체 데이터 세트에서 사용자 지정 모델을 더 쉽게 훈련할 수 있습니다.
  • 메모리 요구 사항: Ultralytics 모델은 일반적으로 트랜스포머 기반 대안에 비해 메모리 사용량이 낮기 때문에 일반 소비자용 GPU에서 쉽게 학습할 수 있습니다.

결론

모두 YOLOv10YOLOv9 은 물체 감지에 있어 중요한 이정표입니다. YOLOv10 은 속도와 효율성을 우선시하는 애플리케이션에 적합한 솔루션으로, 혁신적인 NMS 아키텍처 덕분에 확실한 승자가 되었습니다. 반대로, YOLOv9 은 최고의 정확도와 정보 보존을 요구하는 시나리오에 여전히 강력한 선택입니다.

가장 다재다능한 최신 솔루션을 찾는 개발자에게는 다음을 살펴보는 것도 좋습니다. YOLO11. YOLO11 이러한 이전 버전의 강점을 바탕으로 속도, 정확도, 감지, 세분화 및 포즈 추정 작업의 기능 간의 정교한 균형을 제공합니다.

다른 모델 살펴보기

  • Ultralytics YOLO11 - 최신 최신 모델입니다.
  • Ultralytics YOLOv8 - 다양한 비전 작업을 위한 다재다능하고 성숙한 모델입니다.
  • RT-DETR - 고정밀 애플리케이션을 위한 변압기 기반 검출기입니다.

댓글