YOLO 욜로v9: 자세한 기술 비교
컴퓨터 비전 작업에서는 모델마다 정확도, 속도, 효율성 면에서 고유한 이점을 제공하기 때문에 최적의 물체 감지 모델을 선택하는 것이 매우 중요합니다. 이 페이지에서는 이 분야의 두 가지 고급 모델인 YOLO YOLOv9의 기술적 비교를 제공합니다. 각 모델의 아키텍처, 성능 벤치마크, 적합한 애플리케이션을 분석하여 모델 선택에 도움을 드립니다.
DAMO-YOLO
YOLO 알리바바 그룹에서 발표했으며 2022년 11월에 소개되었습니다(arXiv). 이 기술은 속도와 정확성 사이의 균형을 강조하며 신경망 아키텍처 검색(NAS) 백본과 효율적인 네트워크 구성 요소를 통합합니다.
아키텍처 및 기능
YOLO 아키텍처는 몇 가지 주요 혁신으로 구별됩니다:
- NAS 백본: 효율적인 특징 추출을 위해 신경망 아키텍처 검색을 통해 최적화된 백본을 사용합니다.
- RepGFPN: 기능 융합을 위해 효율적인 재파라미터화된 그라디언트 기능 피라미드 네트워크(GFPN)를 활용합니다.
- 제로헤드: 계산 오버헤드를 줄이기 위해 설계된 경량 감지 헤드입니다.
- AlignedOTA: 훈련 중 라벨 할당을 개선하기 위해 정렬된 최적 전송 할당(OTA)을 구현합니다.
- 증류 강화: 지식 증류 기술을 통합하여 성능을 향상시킵니다.
성능 지표
YOLO 다양한 계산 요구 사항을 충족하기 위해 다양한 모델 크기(소형, 소형, 중형, 대형)를 제공합니다. 주요 성과 지표는 다음과 같습니다:
- mAP: COCO와 같은 데이터 세트에서 경쟁력 있는 평균 정밀도(mAP)를 달성합니다.
- 추론 속도: 빠른 추론을 위해 설계되어 실시간 객체 감지 작업에 적합합니다.
- 모델 크기: 다양한 크기로 제공되므로 유연하게 배포할 수 있습니다.
강점 및 약점
강점:
- 높은 정확도와 속도: 정확도와 효율적인 추론 속도의 균형을 맞춥니다.
- 혁신적인 아키텍처: 최적화된 성능을 위해 NAS와 효율적인 구성 요소를 통합합니다.
- 적응성: 다양한 애플리케이션 요구 사항에 맞는 다양한 모델 크기를 제공합니다.
약점:
- 복잡성: 고급 아키텍처는 단순한 모델에 비해 사용자 지정하거나 수정하기가 더 복잡할 수 있습니다.
- 제한된 문서: YOLO 시리즈와 같이 널리 채택된 모델에 비해 문서가 덜 광범위할 수 있습니다(GitHub README).
사용 사례
YOLO 다음과 같이 정확성과 속도가 조화를 이루어야 하는 애플리케이션에 적합합니다:
- 실시간 감시: 적시에 탐지하는 것이 중요한 보안 시스템 및 모니터링.
- 로봇 공학: 로봇 공학: 효율적이고 정확한 인식이 요구되는 로봇 공학 분야의 애플리케이션.
- 산업 검사: 제조 분야의 자동화된 품질 관리 프로세스.
YOLOv9
YOLOv9은 2024년 2월 대만 학술원 정보과학연구소 연구진에 의해 소개된 YOLO 시리즈의 최신 버전입니다(arXiv). YOLOv9은 딥 네트워크의 정보 손실을 해결하여 정확성과 효율성을 모두 향상시키는 데 중점을 둡니다.
아키텍처 및 기능
YOLOv9은 딥러닝 모델의 한계를 극복하기 위한 혁신적인 기술을 도입합니다:
- 프로그래밍 가능한 그라데이션 정보(PGI): 네트워크 전체에서 중요한 정보를 보존하여 정보 손실을 완화하는 핵심 혁신 기술입니다.
- 일반화된 효율적인 계층 집계 네트워크(GELAN): 효율적인 계산 및 매개변수 활용을 위해 GELAN을 사용합니다.
- 백본 및 헤드 개선: 백본과 탐지 헤드의 개선으로 더 나은 특징 추출 및 탐지가 가능합니다.
성능 지표
YOLOv9은 실시간 객체 감지 분야에서 최첨단 성능을 보여줍니다:
- mAP: COCO와 같은 벤치마크 데이터 세트에서 이전 모델을 능가하는 높은 mAP 점수를 달성합니다.
- 추론 속도: 실시간 애플리케이션에 적합한 인상적인 추론 속도를 유지합니다.
- 모델 크기: 다양한 모델 크기(소형, 소형, 중형 등)와 다양한 파라미터 수 및 FLOP을 제공합니다.
강점 및 약점
강점:
- 최첨단 정확도: 많은 실시간 물체 감지기에 비해 뛰어난 정확도를 달성합니다.
- 효율적인 설계: PGI와 GELAN은 효율성을 높이고 계산 오버헤드를 줄이는 데 기여합니다.
- 다목적성: 다양한 객체 감지 작업 및 배포 시나리오에 적용할 수 있습니다.
- Ultralytics 통합: Ultralytics Python 패키지와 포괄적인 설명서를 통해 쉽게 사용할 수 있습니다.
약점:
- 새로운 모델: 신생 모델이기 때문에 커뮤니티 지원 및 사용 가능한 리소스가 기존 모델에 비해 아직 성장하고 있을 수 있습니다.
- 컴퓨팅 수요: 규모가 큰 YOLOv9 모델은 여전히 상당한 컴퓨팅 리소스를 필요로 할 수 있습니다.
사용 사례
YOLOv9은 최고 수준의 정확도와 실시간 처리를 요구하는 애플리케이션에 이상적입니다:
- 첨단 운전자 지원 시스템(ADAS): 정밀한 물체 감지가 필요한 자율 주행 자동차 및 자율 시스템.
- 고해상도 이미지 분석: 위성 이미지 분석과 같이 고해상도 이미지에서 상세하고 정확한 감지를 통해 이점을 얻을 수 있는 애플리케이션입니다.
- 산업 자동화: 높은 정밀도와 안정성이 요구되는 복잡한 자동화 작업.
모델 비교 표
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4TensorRT10 (ms) |
매개변수 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
다모욜로 | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLO YOLOv9은 모두 물체 감지에서 상당한 발전을 이루었습니다. YOLO 효율적인 아키텍처를 통해 속도와 정확도 간의 강력한 균형을 제공하며, YOLOv9은 혁신적인 PGI 및 GELAN 기술을 통해 정확도의 한계를 뛰어넘습니다. 최첨단 정확도를 우선시하든 균형 잡힌 성능 프로필을 우선시하든 애플리케이션의 특정 요구 사항에 따라 선택할 수 있습니다.
사용자는 이러한 모델을 다음과 같은 다른 YOLO 변형과 비교하는 데에도 관심이 있을 수 있습니다. YOLOv8, YOLOv7, YOLOv5및 YOLO11와 같은 모델을 지원합니다, RT-DETR및 PP-YOLOE와 같은 모델을 통해 객체 감지 모델에 대해 자세히 알아볼 수 있습니다.