콘텐츠로 건너뛰기

모델 비교: 객체 탐지를 위한 YOLOv8 vs YOLOv9

올바른 객체 감지 모델을 선택하는 것은 정확도, 속도 및 계산 리소스의 균형을 맞추는 데 매우 중요합니다. 이 페이지에서는 YOLO 시리즈의 최첨단 모델인 Ultralytics YOLOv8과 YOLOv9 간의 자세한 기술 비교를 제공합니다. YOLOv8의 다재다능성과 성숙한 생태계가 대부분의 애플리케이션에 선호되는 선택인 이유를 강조하면서 요구 사항에 가장 적합한 모델을 결정하는 데 도움이 되도록 아키텍처, 성능 및 사용 사례를 분석합니다.

Ultralytics YOLOv8: 간소화되고 다재다능함

Ultralytics YOLOv8은 Glenn Jocher, Ayush Chaurasia 및 Jing Qiu가 Ultralytics에서 개발하여 2023년 1월 10일에 출시한 매우 성공적인 모델입니다. 속도와 정확성의 균형이 뛰어나고 사용자 친화적이며 매우 다재다능한 것으로 유명합니다. YOLOv8의 주요 장점은 객체 감지를 넘어 인스턴스 분할, 포즈 추정, 이미지 분류 및 방향 경계 상자(OBB)를 모두 단일 통합 프레임워크 내에서 지원한다는 것입니다.

작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
기관: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/

YOLOv8에 대해 자세히 알아보세요

아키텍처 및 주요 기능

YOLOv8은 앵커 프리 감지 헤드 및 C2f 모듈을 특징으로 하는 수정된 CSPDarknet 백본과 같은 중요한 아키텍처 개선을 통해 이전 YOLO 버전을 기반으로 구축되었습니다. 이러한 설계 선택은 유연성과 효율성을 향상시킵니다. 그러나 가장 큰 강점은 사용 편의성과 강력한 생태계에 있습니다.

  • 사용 편의성: YOLOv8은 광범위한 설명서에서 지원하는 간단한 Python APICLI를 통해 간소화된 사용자 경험을 제공합니다. 따라서 초보자와 전문가 모두가 접근할 수 있습니다.
  • 잘 관리되는 에코시스템: 지속적인 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트, 그리고 노코드 훈련 및 MLOps 워크플로우를 위한 Ultralytics HUB와의 긴밀한 통합을 통해 이점을 얻습니다.
  • 성능 균형: 이 모델 제품군은 속도와 정확성 사이에서 강력한 균형을 달성하여 에지 장치에서 클라우드 서버에 이르기까지 다양한 실제 배포 시나리오에 적합합니다.
  • 메모리 효율성: 일반적으로 트랜스포머와 같은 더 큰 아키텍처에 비해 학습 및 추론에 필요한 CUDA 메모리가 더 적어 더 광범위한 하드웨어에서 개발이 가능합니다.
  • 다재다능함: 이는 뛰어난 기능입니다. YOLOv8은 단일 프레임워크 내에서 여러 비전 작업(감지, 분할, 분류, 자세, OBB)을 처리하는 데 탁월하며, 이는 YOLOv9와 같이 더 특화된 모델에서는 종종 부족한 기능입니다.
  • 학습 효율성: 효율적인 학습 프로세스COCO와 같은 데이터 세트에서 즉시 사용 가능한 사전 학습된 가중치를 제공하여 개발 주기를 가속화합니다.

강점과 약점

강점:

  • 다재다능한 작업 지원: 단일 모델 아키텍처로 감지, 분할, 포즈 등을 학습할 수 있어 복잡한 프로젝트 요구 사항을 단순화합니다.
  • 사용자 친화적: 포괄적인 설명서와 간단한 API는 고급 컴퓨터 비전 솔루션 개발에 대한 진입 장벽을 낮춥니다.
  • 강력한 커뮤니티 및 생태계: 최적화된 배포를 위해 TensorRTOpenVINO와 같은 광범위한 리소스 및 통합을 통해 적극적으로 유지 관리됩니다.

약점:

  • 최고 정확도: 매우 정확하지만 가장 큰 YOLOv9 모델은 순수한 객체 감지를 위해 COCO 벤치마크에서 약간 더 높은 mAP 점수를 달성할 수 있습니다.
  • 리소스 집약적 (대형 모델): 더 큰 YOLOv8 모델(L, X)은 상당한 컴퓨팅 리소스가 필요하지만, 성능 등급에 비해 효율적입니다.

YOLOv9: 새로운 기술을 통한 정확도 향상

YOLOv9는 2024년 2월 21일 대만 Academia Sinica 정보 과학 연구소의 Chien-Yao Wang과 Hong-Yuan Mark Liao에 의해 소개되었습니다. YOLOv9는 심층 신경망에서 정보 손실을 해결하여 실시간 객체 감지에서 정확도의 경계를 넓히는 것을 목표로 하는 중요한 아키텍처 혁신을 도입했습니다.

작성자: Chien-Yao Wang, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
문서: https://docs.ultralytics.com/models/yolov9/

YOLOv9에 대해 자세히 알아보세요

아키텍처 및 주요 혁신

YOLOv9의 핵심 기여는 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network)입니다.

  • 프로그래밍 가능한 기울기 정보 (PGI): 이 개념은 정보 병목 현상 문제를 완화하도록 설계되었으며, 여기서 중요한 데이터는 심층 네트워크 레이어를 통해 전파될 때 손실됩니다. PGI는 정확한 모델 업데이트를 위해 주요 정보를 유지하기 위해 안정적인 기울기를 생성하는 데 도움이 됩니다.
  • Generalized Efficient Layer Aggregation Network (GELAN): GELAN은 파라미터 활용도와 계산 효율성을 최적화하는 새로운 아키텍처입니다. 이를 통해 YOLOv9는 일부 이전 모델에 비해 더 적은 파라미터로 더 높은 정확도를 달성할 수 있습니다.

강점과 약점

강점:

  • 향상된 정확도: 실시간 객체 검출기를 위한 COCO 데이터 세트에서 새로운 최첨단 결과를 설정하여 mAP에서 다른 많은 모델을 능가합니다.
  • 향상된 효율성: GELAN 아키텍처는 매개변수당 강력한 성능 비율을 제공합니다.

약점:

  • 제한적인 활용성: YOLOv9는 주로 객체 탐지에 중점을 둡니다. YOLOv8을 포괄적인 AI 프로젝트를 위한 보다 유연하고 실용적인 솔루션으로 만드는 세분화, 포즈 추정 및 분류에 대한 기본 멀티태스크 지원이 부족합니다.
  • 학습 리소스: 해당 문서에 언급된 바와 같이 YOLOv9 모델 학습은 Ultralytics 모델에 비해 더 많은 리소스와 시간이 소요될 수 있습니다.
  • 더 새로운 아키텍처: 다른 연구 그룹에서 개발한 더 최신 모델이므로, Ultralytics YOLOv8만큼 생태계, 커뮤니티 지원 및 타사 통합이 성숙하지 않았을 수 있습니다. 따라서 학습 곡선이 더 가파르고 바로 사용할 수 있는 배포 솔루션이 더 적을 수 있습니다.

성능 및 벤치마크: YOLOv8 vs. YOLOv9

성능을 비교할 때 두 모델 모두 매우 유능하다는 것을 알 수 있습니다. YOLOv9는 순수한 감지 정확도에 대한 한계를 넓히고 있으며, 가장 큰 변형인 YOLOv9e는 가장 높은 mAP를 달성합니다. 그러나 Ultralytics YOLOv8은 더욱 강력한 전체 패키지를 제공합니다. 이 모델은 속도와 정확도 간의 탁월한 균형을 제공하며 CPU와 GPU 모두에서 잘 문서화된 추론 속도를 제공하며 이는 실제 배포 결정에 매우 중요합니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

표는 YOLOv9 모델이 파라미터 효율적이지만 YOLOv8은 다양한 하드웨어 환경에 대한 준비 상태를 입증하는 중요한 CPU 벤치마크를 포함하여 보다 완전한 성능 그림을 제공한다는 것을 보여줍니다.

이상적인 사용 사례

YOLOv8과 YOLOv9 중 선택은 프로젝트 우선순위에 크게 좌우됩니다.

YOLOv8은 다음과 같은 경우에 이상적인 선택입니다.

  • 다중 작업 애플리케이션: 로봇 공학, 헬스케어 또는 고급 보안 시스템에서와 같이 감지, 분할 및 자세 추정의 조합이 필요한 프로젝트입니다.
  • 빠른 개발 및 배포: 프로토타입에서 프로덕션으로 빠르게 전환해야 하는 개발자는 YOLOv8의 사용 편의성, 광범위한 설명서 및 통합된 에코시스템의 이점을 크게 누릴 수 있습니다.
  • 균형 잡힌 성능 필요: 소매 또는 제조 분야의 실시간 비디오 분석과 같이 절대적으로 가장 높은 mAP 점수를 달성하는 것보다 속도와 정확성 간의 강력한 균형이 더 중요한 애플리케이션에 적합합니다.

YOLOv9은 다음에 가장 적합합니다.

  • 연구 및 특수 고정밀 감지: 주요 목표가 COCO와 같은 벤치마크에서 객체 감지 정확도를 최대화하는 시나리오입니다.
  • 고정밀 산업 검사: 가능한 가장 높은 정확도로 가장 작은 결함을 탐지하는 것이 주요 관심사인 애플리케이션에 적합합니다.
  • 고급 비디오 분석: 최고 수준의 감지가 필요하고 시스템이 특정 종속성을 수용할 수 있는 스마트 시티 인프라에서 사용됩니다.

결론: 어떤 모델을 선택해야 할까요?

대다수의 개발자와 애플리케이션에게 Ultralytics YOLOv8이 더 나은 선택입니다. 비교할 수 없는 다재다능함, 사용 편의성, 성숙하고 잘 관리되는 생태계는 YOLOv9보다 상당한 이점을 제공합니다. 단일 프레임워크 내에서 여러 작업을 처리할 수 있는 기능은 개발을 단순화할 뿐만 아니라 프로덕션 환경에서 복잡성과 비용을 줄여줍니다. YOLOv9이 객체 감지에서 인상적인 정확도 향상을 제공하지만, 좁은 초점과 덜 개발된 생태계로 인해 보다 특화된 도구로 여겨집니다.

YOLOv8은 개발자가 강력하고 다면적인 AI 시스템을 효율적으로 구축할 수 있도록 지원하는 전체적인 솔루션을 나타냅니다. 안정적이고 고성능이며 유연한 모델을 찾는 사람들에게 YOLOv8은 명확한 승자입니다. 더욱 확고한 모델을 찾고 있다면 YOLOv5를 고려하거나 Ultralytics의 최신 최첨단 기술을 보려면 YOLO11을 확인하십시오.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글