콘텐츠로 건너뛰기

YOLOv9와 YOLOv10: 자세한 기술 비교

Ultralytics 컴퓨터 비전의 경계를 넓히기 위해 노력하고 있으며, 그 중 중요한 부분은 YOLO 모델을 개발하고 개선하는 것입니다. 이 페이지에서는 두 가지 최신 객체 감지 모델인 YOLOv9와 YOLOv10의 상세한 기술 비교를 제공합니다. 특정 컴퓨터 비전 작업에 가장 적합한 모델을 선택하는 데 도움이 되는 아키텍처 뉘앙스, 성능 벤치마크, 적합한 애플리케이션에 대해 자세히 살펴봅니다.

YOLOv9: 프로그래밍 가능한 그라데이션 정보

대만 아카데미아 시니카 정보과학연구소의 왕치엔야오와 홍위안 마크 리아오가 2024년 2월에 발표한 YOLOv9는 효율적인 물체 감지에 있어 상당한 진전을 이뤘습니다. YOLOv9의 핵심 혁신은 딥러닝 프로세스 중 정보 손실을 해결하기 위해 설계된 프로그래머블 그라데이션 정보(PGI)에 있습니다. 이는 일반화된 효율적인 계층 집계 네트워크(GELAN)와 같은 기술을 통해 달성되며, 모델이 사용자가 의도한 것을 정확하게 학습할 수 있도록 합니다.

아키텍처 및 주요 기능: YOLOv9은 GELAN을 활용하여 특징 추출을 향상시키고 네트워크 전체에서 정보 무결성을 유지합니다. 이러한 접근 방식은 정확할 뿐만 아니라 매개변수 효율이 높은 모델로 이어지므로 컴퓨팅 리소스가 제한된 배포에 적합합니다. YOLOv9은"YOLOv9: 프로그래밍 가능한 그라디언트 정보를 사용하여 학습하고자 하는 것을 학습하기" 논문에서 구현되었습니다.

성능 메트릭: YOLOv9은 COCO 데이터 세트에서 인상적인 성능을 보여줍니다. 예를 들어, YOLOv9c는 25.3M 파라미터와 102.1B FLOPs로 53.0%의 mAPval50-95를 달성했습니다. 이 모델의 아키텍처는 효율성을 위해 설계되어 이전 모델에 비해 더 적은 수의 파라미터와 계산으로 높은 정확도를 달성할 수 있습니다.

강점:

  • 높은 정확도: 최첨단 물체 감지 정확도를 달성합니다.
  • 매개변수 효율성: GELAN과 PGI를 통해 매개변수와 계산을 효과적으로 활용합니다.
  • 새로운 접근 방식: 더 나은 학습을 위해 프로그래밍 가능한 그라데이션 정보를 도입합니다.

약점:

  • 비교적 새로운 모델: 비교적 최근에 도입된 모델이기 때문에 기존 모델에 비해 커뮤니티가 작고 배포 사례가 적을 수 있습니다.

사용 사례: YOLOv9은 다음과 같이 높은 정확도와 효율성이 요구되는 애플리케이션에 적합합니다:

  • 고급 로봇 공학: 복잡한 로봇 시스템에서의 물체 감지.
  • 고해상도 이미지 분석: 대용량 이미지의 상세한 분석이 필요한 시나리오.
  • 리소스가 제한된 환경: 컴퓨팅 성능이 제한된 엣지 디바이스 및 모바일 애플리케이션.

YOLOv9에 대해 자세히 알아보기

작성자 및 리소스:

YOLOv10: 총체적인 효율성-정확성 중심 설계

2024년 5월 칭화대학교의 Ao Wang, Hui Chen, Lihao Liu 등이 발표한 YOLOv10은 실시간 엔드투엔드 객체 감지를 위해 설계되어 효율성과 속도를 극대화하는 데 중점을 두고 있습니다. YOLOv10은 정확도와 효율성을 모두 향상시키기 위한 몇 가지 주요 방법론적 개선 사항을 도입했으며, 여기에는 NMS 없는 훈련을 위한 일관된 이중 할당과 전체적인 효율성-정확도 중심 모델 설계가 포함됩니다.

아키텍처 및 주요 기능: YOLOv10의 아키텍처는 계산 중복성을 최소화하고 성능을 극대화하도록 세심하게 설계되었습니다. 경량 분류 헤드, 공간 채널 분리형 다운샘플링, 순위 가이드 블록 설계 등이 주요 효율성 향상 요소입니다. 대형 커널 컨볼루션과 부분 자체 주의(PSA)를 통해 정확도가 향상되었습니다. 이러한 혁신을 통해 YOLOv10은 정확도를 희생하지 않고도 최첨단 속도와 효율성을 달성할 수 있습니다. YOLOv10에 대한 자세한 내용은"YOLOv10: 실시간 엔드투엔드 객체 감지" 백서에서 확인할 수 있습니다.

성능 지표: YOLOv10은 실시간 물체 감지에서 새로운 벤치마크를 설정합니다. 예를 들어, YOLOv10-S는 COCO 데이터 세트에서 비슷한 AP를 사용하는 RT-DETR 1.8배 더 빠른 것으로 보고되었습니다. YOLOv10-B는 비슷한 성능 수준을 유지하면서 YOLOv9-C보다 지연 시간이 46% 짧고 매개 변수가 25% 더 적습니다. YOLOv10-N은 T4 GPU 1.84ms의 인상적인 지연 시간을 달성합니다.

강점:

  • 탁월한 효율성: 지연 시간 및 계산 비용을 최소화하도록 최적화되었습니다.
  • NMS 없는 교육: 일관된 이중 할당을 통해 비최대 억제 없이 엔드투엔드 배포가 가능하므로 추론 시간이 단축됩니다.
  • 빠른 속도: 이전 YOLO 버전 및 다른 모델에 비해 훨씬 빠른 추론 속도를 달성합니다.
  • 우수한 정확도: 효율성을 우선시하면서 경쟁력 있는 정확도를 유지합니다.

약점:

  • 아주 최근 모델: 매우 새로운 모델로서 아직 활발히 개발 중이며 커뮤니티의 지원이 증가하고 있습니다.

사용 사례: YOLOv10은 실시간 성능과 효율성이 가장 중요한 애플리케이션에 이상적입니다:

  • 엣지 컴퓨팅: 리소스가 제한된 엣지 디바이스에 배포.
  • 실시간 비디오 분석: 비디오 스트림에서 즉각적인 객체 감지가 필요한 애플리케이션.
  • 모바일 및 임베디드 시스템: 속도와 전력 소비가 중요한 모바일 앱 및 임베디드 시스템에 통합.

YOLOv10에 대해 자세히 알아보기

작성자 및 리소스:

비교 표

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4TensorRT10
(ms)
매개변수
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

결론

YOLOv9과 YOLOv10은 각각 고유한 강점을 지닌 최첨단 물체 감지 기술입니다. YOLOv9은 프로그래밍 가능한 그라데이션 정보를 통해 정확도와 매개변수 효율성이 뛰어나 복잡하고 세밀한 분석에 적합합니다. 반면 YOLOv10은 전체적인 효율성-정확도 중심 설계와 NMS가 필요 없는 트레이닝으로 속도와 실시간 성능을 우선시하므로 엣지 및 실시간 애플리케이션에 이상적입니다.

성숙도와 다재다능함의 균형을 원하는 사용자에게 적합합니다, Ultralytics YOLOv8 은 여전히 강력한 선택입니다. 최신 발전과 최고의 정확도에 관심이 있는 사용자를 위한 제품입니다, Ultralytics YOLO11 도 이전 YOLO 반복의 강점을 기반으로 하는 매력적인 옵션입니다. 궁극적으로 가장 적합한 모델은 프로젝트의 특정 요구 사항에 따라 정확도, 속도 및 리소스 제약의 균형을 맞추는 데 달려 있습니다.

📅1 년 전 생성됨 ✏️ 1개월 전 업데이트됨

댓글