YOLOv6.0과 YOLOv9: 산업 속도와 최첨단 효율성의 만남
최적의 물체 감지 모델을 선택하는 것은 컴퓨터 비전 개발에서 중요한 결정이며 정확도, 추론 속도, 계산 효율성 간의 전략적 균형이 필요합니다. 이 비교에서는 메이투안이 산업 처리량을 위해 설계한 모델인 YOLOv6.0의 기술적 뉘앙스와 YOLOv9과 정보 보존을 통해 효율성을 재정의하는 최첨단 아키텍처의 기술적 차이점을 살펴봅니다.
YOLOv6.0: 산업용 애플리케이션에 최적화
YOLOv6.0은 하드웨어 지연이 주요 병목 현상인 실제 배포 시나리오에 중점을 두고 있습니다.
- 작성자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
- 조직:조직: 메이투안
- 날짜: 2023-01-13
- Arxiv:https://arxiv.org/abs/2301.05586
- GitHub:https://github.com/meituan/YOLOv6
- Docs:https://docs.ultralytics.com/models/yolov6/
건축 및 디자인 철학
YOLOv6.0은 하드웨어 인식 컨볼루션 신경망(CNN)으로 설계되었습니다. 이 아키텍처는 효율적인 재파라미터화 백본과 하이브리드 블록(RepBi-PAN)을 활용하여 GPU의 처리량을 극대화합니다. 특정 하드웨어 특성에 맞게 모델 구조를 조정함으로써 YOLOv6 정확도를 심각하게 저하시키지 않으면서도 빠른 추론 속도를 제공하는 것을 목표로 합니다. 실시간 처리가 불가능한 산업 자동화 및 감시에 최적화된 단일 단계 감지기 역할을 합니다.
장점과 한계
강점:
- 추론 속도: 이 모델은 지연 시간이 짧은 환경, 특히 NVIDIA T4 GPU에서 탁월한 성능을 발휘하므로 고속 제조 라인에 적합합니다.
- 하드웨어 최적화: '하드웨어 친화적인' 설계로 배포 시 메모리 대역폭과 연산 유닛을 효과적으로 활용할 수 있습니다.
약점:
- 특징 표현: YOLOv9 같은 최신 모델에서 볼 수 있는 고급 그라데이션 정보 보존 기술이 부족하여 모델 크기가 작아질수록 정확도가 급격히 떨어집니다.
- 에코시스템 지원: 효과적이기는 하지만 도구, 커뮤니티 지원 및 손쉬운 통합을 위한 주변 에코시스템은 Ultralytics 프레임워크에 비해 덜 광범위합니다.
- 제한된 활용성: 주로 바운딩 박스 감지에 중점을 두며, 다용도 Ultralytics 모델에 비해 세분화 또는 포즈 추정과 같은 복잡한 작업에 대한 기본 지원이 적습니다.
YOLOv9: 정확성 및 정보 흐름의 재정의
YOLOv9 딥 네트워크의 정보 손실이라는 근본적인 문제를 해결하는 새로운 아키텍처 개념을 도입하여 우수한 성능 지표를 달성합니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직:기관: 대만 학술원 정보 과학 연구소
- 날짜: 2024-02-21
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
- Docs:https://docs.ultralytics.com/models/yolov9/
아키텍처 PGI 및 GELAN
YOLOv9 두 가지 획기적인 혁신으로 차별화됩니다: 프로그래밍 가능한 그라데이션 정보(PGI) 와 일반화된 효율적인 레이어 집계 네트워크(GELAN)입니다.
- PGI는 심층 신경망에 내재된 정보 병목 문제를 해결합니다. PGI는 여러 레이어에 걸쳐 중요한 그라데이션 데이터를 유지함으로써 모델이 보다 신뢰할 수 있는 특징을 학습하여 정확도를 높일 수 있도록 합니다.
- GELAN은 매개변수 활용을 최적화하여 기존 아키텍처에 비해 더 적은 매개변수와 계산 비용으로 더 높은 정확도를 달성할 수 있는 모델을 제공합니다.
혁신 스포트라이트: 프로그래밍 가능한 그라데이션 정보(PGI)
딥 네트워크는 데이터가 연속적인 레이어를 통과할 때 종종 정보를 잃게 되는데, 이를 정보 병목 현상이라고 합니다. YOLOv9 PGI는 보조 감독 메커니즘으로 작동하여 대상 객체를 학습하는 데 필수적인 데이터가 네트워크 깊이 전체에 걸쳐 보존되도록 합니다. 그 결과, 특히 detect 어려운 물체의 경우 훨씬 더 나은 수렴과 정확도를 얻을 수 있습니다.
Ultralytics 에코시스템의 장점
YOLOv9 Ultralytics 에코시스템에 통합하면 개발자에게 뚜렷한 이점을 제공합니다:
- 사용 편의성: 통합된 Python API 및 CLI 교육, 검증 및 배포를 간소화합니다.
- 성능 균형: YOLOv9 , 최첨단 기술 달성 mAP 을 달성하는 동시에 경쟁력 있는 추론 속도를 유지하여 다양한 애플리케이션에 탁월한 절충안을 제공합니다.
- 메모리 효율성: Ultralytics 구현은 일부 트랜스포머 기반 모델의 높은 VRAM 요구 사항과 달리 훈련 중 메모리 사용량을 줄이도록 최적화되어 있습니다.
- 다목적성: 탐지 외에도, 강력한 커뮤니티와 빈번한 업데이트를 통해 다른 작업으로 확장할 수 있는 Ultralytics 프레임워크 내 아키텍처의 유연성을 지원합니다.
비교 성능 분석
성능 데이터는 명확한 차이를 강조합니다: YOLOv6.0은 특정 하드웨어의 원시 속도에 최적화되어 있는 반면, YOLOv9 효율성(매개변수당 정확도)에서 우위를 점하고 있습니다.
예를 들어, YOLOv9c는 25.3M의 파라미터만으로 53.0%의 mAP 달성하여 두 배 이상의 파라미터(59.6M)와 훨씬 더 높은 FLOP을 필요로 하는 YOLOv6.0l (52.8% mAP)보다 뛰어난 성능을 발휘합니다. 이는 YOLOv9 아키텍처 혁신(GELAN 및 PGI)을 통해 "적은 자원으로 더 많은 학습"이 가능하여 여전히 높은 정밀도가 요구되는 리소스 제약 환경에서 매우 효율적인 선택이 될 수 있음을 시사합니다.
반대로 YOLOv6.0n은 매우 짧은 지연 시간(1.17ms)을 제공하므로 정확도 저하(37.5% mAP)가 허용되는 초고속 실시간 추론에 사용할 수 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
교육 및 배포 워크플로
개발자 환경은 두 모델 간에 크게 다릅니다. YOLOv6.0은 일반적으로 셸 스크립트 및 수동 구성 파일을 포함하는 리포지토리별 워크플로우에 의존합니다. 이는 강력하지만 초보자에게는 학습 곡선이 더 가파르게 나타날 수 있습니다.
반면, YOLOv9 간소화된 Ultralytics 워크플로우의 이점을 누릴 수 있습니다. 최소한의 코드만으로 최첨단 모델을 학습할 수 있으며, 에코시스템은 다음과 같은 포맷으로 원활하게 내보낼 수 있도록 지원합니다. ONNX, TensorRT및 CoreML 같은 형식으로 원활하게 내보낼 수 있어 배포 호환성이 뛰어납니다.
예시: Ultralytics YOLOv9 교육하기
Ultralytics Python 인터페이스를 사용하면 몇 줄의 코드만으로 트레이닝 실행을 시작하여 데이터 증강, 로깅 및 평가를 자동으로 처리할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
배포 유연성
YOLOv9 포함한 Ultralytics 모델은 에지 AI 및 클라우드 배포에 적합한 다양한 포맷으로 원클릭 내보내기를 지원합니다. 이러한 유연성은 연구에서 프로덕션으로의 전환을 간소화합니다.
이상적인 사용 사례
YOLOv6.0
- 고속 조립 라인: 컨베이어 속도에 2ms 미만의 지연 시간이 요구되는 품질 관리 시스템.
- 전용 하드웨어: 하드웨어 인식 아키텍처가 완전히 활용되는 특정 NVIDIA GPU에서 실행되는 시나리오입니다.
YOLOv9
- 자율 시스템:자율 주행 차량과 로봇 공학은 복잡한 환경을 안전하게 탐색하기 위해 높은 정밀도를 필요로 합니다.
- 의료 영상: 종양 탐지와 같이 작은 특징(위음성)을 놓치는 것은 용납할 수 없는 애플리케이션.
- 범용 CV: 다양한 작업에 대한 우수한 문서와 커뮤니티 지원을 제공하는 강력하고 사용하기 쉬운 모델을 찾는 개발자를 대상으로 합니다.
결론
YOLOv6.0은 특정 하드웨어에서 원시 처리량을 우선시하는 특수 산업 애플리케이션을 위한 강력한 도구로 남아 있습니다, YOLOv9 은 대부분의 최신 컴퓨터 비전 프로젝트에 탁월한 선택입니다.
YOLOv9 혁신적인 PGI와 GELAN 아키텍처는 정확성과 효율성의 균형이 더욱 개선되어 매개변수당 성능 메트릭에서 YOLOv6 능가하는 경우가 많습니다. 또한, Ultralytics 에코시스템과의 통합을 통해 개발자는 간소화된 워크플로, 적극적인 유지보수, 데이터에서 배포까지의 여정을 가속화하는 도구 제품군의 이점을 누릴 수 있습니다. 미래에도 사용할 수 있는 다목적 고성능 모델을 찾고 계신다면 YOLOv9 추천합니다.
다른 모델 살펴보기
최첨단 옵션을 탐색하고 있다면, Ultralytics 라이브러리에 있는 다른 강력한 모델을 고려해 보세요:
- YOLO11: 감지, 세분화 및 포즈 추정을 위한 최첨단 성능을 제공하는 YOLO 시리즈의 최신 버전입니다.
- YOLOv8: 여러 작업에서 속도와 정확성의 균형이 잘 잡혀 있는 인기 있고 다재다능한 모델입니다.
- RT-DETR: 비최대 억제NMS가 필요 없이 정확도가 뛰어난 트랜스포머 기반 검출기입니다.