모델 비교: YOLOv9 vs. YOLOv8 객체 탐지
적합한 객체 감지 모델을 선택하는 것은 정확도, 속도 및 계산 리소스의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 다재다능하고 사용자 친화적인 모델인 Ultralytics YOLOv8과 새로운 아키텍처 발전으로 유명한 모델인 YOLOv9 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 결정할 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석합니다.
YOLOv9: 새로운 아키텍처를 통한 정확도 향상
YOLOv9는 객체 감지 분야에서 상당한 진전으로 소개되었으며, 정확도 향상을 위해 심층 신경망에서 정보 손실을 극복하는 데 주로 중점을 둡니다.
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- 문서: https://docs.ultralytics.com/models/yolov9/
아키텍처 및 주요 혁신
YOLOv9은 두 가지 주요 혁신 기술인 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network)을 도입했습니다. PGI는 손실 함수 계산을 위한 완전한 입력 정보를 제공하도록 설계되어 정보 병목 현상을 완화하고 네트워크 업데이트를 위해 보다 안정적인 기울기가 생성되도록 합니다. GELAN은 파라미터 활용률과 계산 효율성을 최적화하는 새롭고 매우 효율적인 네트워크 아키텍처입니다. 이러한 기능이 결합되어 YOLOv9은 높은 정확도를 달성할 수 있으며 종종 COCO와 같은 데이터 세트에서 새로운 최첨단 벤치마크를 설정합니다.
강점
- 최첨단 정확도: YOLOv9 모델, 특히 더 큰 변형 모델은 최고 수준의 mAP 점수를 달성하여 실시간 객체 감지 정확도의 경계를 넓힙니다.
- 높은 효율성: GELAN 아키텍처를 통해 YOLOv9는 유사한 정확도를 가진 다른 모델에 비해 더 적은 파라미터와 연산 요구 사항(FLOPs)으로 높은 성능을 제공할 수 있습니다.
- 정보 보존: PGI는 심층 네트워크에서 정보 손실 문제를 효과적으로 해결하며, 이는 매우 깊고 정확한 모델을 훈련하는 데 중요합니다.
약점
- 생태계 및 사용성: 연구 저장소의 모델이므로 YOLOv9는 Ultralytics에서 제공하는 세련되고 생산 준비가 완료된 생태계가 부족합니다. 학습 과정이 더 복잡할 수 있으며 커뮤니티 지원 및 타사 통합이 덜 성숙합니다.
- 작업 다양성: 원본 YOLOv9 구현은 주로 객체 탐지에 중점을 둡니다. Ultralytics 모델에서 표준으로 제공되는 분할, 포즈 추정 또는 분류와 같은 다른 비전 작업에 대한 기본 통합 지원을 제공하지 않습니다.
- 학습 리소스: YOLOv9 학습은 Ultralytics YOLOv8에서 제공하는 간소화된 프로세스에 비해 더 많은 리소스와 시간이 소요될 수 있습니다.
Ultralytics YOLOv8: 다재다능함과 사용 편의성
Ultralytics YOLOv8은 Ultralytics에서 개발한 최첨단 모델로, 속도, 정확성, 그리고 가장 중요한 사용 편의성과 다재다능함의 뛰어난 균형으로 유명합니다. 광범위한 비전 AI 작업을 위한 모델 학습, 검증 및 배포를 위한 완벽한 프레임워크로 설계되었습니다.
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직: Ultralytics
- 날짜: 2023-01-10
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: https://docs.ultralytics.com/models/yolov8/
아키텍처 및 주요 기능
YOLOv8은 새로운 앵커 프리 감지 헤드와 수정된 C2f(2개의 컨볼루션이 있는 CSP) 백본을 포함하여 이전 YOLO 버전의 성공을 기반으로 아키텍처를 크게 개선했습니다. 이 디자인은 성능을 향상시킬 뿐만 아니라 모델과 후처리 단계를 단순화합니다. 그러나 YOLOv8의 진정한 강점은 전체적인 생태계에 있습니다.
강점
- 탁월한 성능 균형: YOLOv8은 속도와 정확도 간에 환상적인 균형을 제공하므로 리소스가 제한된 에지 장치에서 고성능 클라우드 서버에 이르기까지 광범위한 실제 애플리케이션에 매우 적합합니다.
- 탁월한 다재다능함: YOLOv8은 진정한 멀티태스킹 프레임워크입니다. 단일 통합 프레임워크 내에서 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 oriented bounding box(OBB)를 지원합니다. 이러한 다재다능함은 YOLOv9와 같이 더 특화된 모델에 비해 큰 장점입니다.
- 사용 편의성: Ultralytics는 간소화된 사용자 경험을 우선시했습니다. 간단한 Python API 및 CLI, 광범위한 문서 및 풍부한 튜토리얼을 통해 개발자는 몇 분 만에 시작할 수 있습니다.
- 잘 관리되는 에코시스템: YOLOv8은 Ultralytics의 활발한 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트, 그리고 노코드 학습 및 MLOps 워크플로우를 위한 Ultralytics HUB와의 원활한 통합에 의해 뒷받침됩니다.
- 학습 효율성: 학습 프로세스는 매우 효율적이며, 즉시 사용 가능한 사전 학습된 가중치와 다른 많은 아키텍처, 특히 트랜스포머 기반 모델에 비해 더 낮은 메모리 요구 사항을 가집니다.
- 배포 준비 완료: YOLOv8은 ONNX, TensorRT 및 OpenVINO와 같은 다양한 형식에 대한 내장된 내보내기 지원으로 쉽게 배포할 수 있도록 설계되어 프로덕션 환경으로의 전환 경로를 간소화합니다.
약점
- 최고 정확도: 매우 정확하지만 가장 큰 YOLOv9 모델은 순수한 객체 감지 작업에서 COCO 벤치마크에서 약간 더 높은 mAP를 달성할 수 있습니다. 그러나 이는 종종 다재다능함과 사용 편의성을 희생하는 대가로 발생합니다.
정면 성능 비교: 정확도 및 속도
성능을 비교할 때는 정확도(mAP), 추론 속도, 모델 크기(파라미터), 계산 비용(FLOP)을 포함한 전체적인 그림을 살펴보는 것이 중요합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
표에서 YOLOv9-E가 가장 높은 mAP를 달성하는 것을 알 수 있습니다. 그러나 YOLOv8 모델은 특히 실시간 애플리케이션에 중요한 YOLOv8n과 같은 더 작은 변형에서 뛰어난 추론 속도를 보여줍니다. YOLOv8은 프로덕션 계획에 필수적인 잘 문서화된 속도 벤치마크를 통해 다양한 하드웨어에서 보다 완벽하고 실용적인 성능 프로필을 제공합니다.
결론: 어떤 모델을 선택해야 할까요?
YOLOv9과 YOLOv8 중 선택은 프로젝트의 우선순위에 크게 좌우됩니다.
다음의 경우 YOLOv9을 선택하세요.
- 귀하의 주요하고 유일한 목표는 COCO와 같은 벤치마크에서 절대적으로 최대 객체 감지 정확도를 달성하는 것입니다.
- PGI 및 GELAN과 같은 새로운 아키텍처 탐색이 주요 목표인 연구 환경에서 작업하고 있습니다.
- 더 복잡한 훈련 및 배포 워크플로를 관리할 수 있는 상당한 컴퓨팅 리소스와 전문 지식을 보유하고 있습니다.
다음의 경우 Ultralytics YOLOv8을 선택하세요.
- 광범위한 애플리케이션에 적합한 강력하고 안정적이며 사용하기 쉬운 모델이 필요합니다.
- 귀하의 프로젝트에는 객체 감지 외에도 인스턴스 분할, 포즈 추정 또는 분류와 같은 기능이 더 필요합니다. YOLOv8의 다재다능함은 개발 시간을 크게 절약해 줍니다.
- 훈련에서 배포에 이르기까지 빠르고 효율적인 워크플로를 우선시합니다. Ultralytics 생태계는 더 빠르게 생산에 투입할 수 있도록 설계되었습니다.
- 에지 및 클라우드 배포 모두에 적합한 속도와 정확도의 균형이 뛰어난 모델이 필요합니다.
- 강력한 커뮤니티 지원, 지속적인 업데이트 및 포괄적인 문서를 중요하게 생각합니다.
대다수의 개발자, 연구원 및 기업에게 Ultralytics YOLOv8이 권장되는 선택입니다. 강력한 성능, 놀라운 다재다능함, 사용자 친화적이고 잘 지원되는 생태계의 조합은 실제 컴퓨터 비전 솔루션을 구축하는 데 더욱 실용적이고 강력한 도구입니다.
다른 모델을 탐색하는 경우 안정성과 광범위한 채택으로 알려진 Ultralytics YOLOv5 또는 대체 트랜스포머 기반 아키텍처인 RT-DETR에도 관심이 있을 수 있습니다. 모델 비교 페이지에서 더 많은 비교를 확인할 수 있습니다.