YOLO11 vs YOLOv9: 객체 탐지를 위한 기술 비교
Ultralytics는 지속적으로 최첨단 YOLO 모델을 제공하여 실시간 객체 감지의 경계를 넓히고 있습니다. 이 페이지에서는 두 가지 고급 모델인 Ultralytics YOLO11과 YOLOv9 간의 기술적 비교를 제공합니다. 컴퓨터 비전 작업에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처 혁신, 성능 벤치마크 및 적합한 애플리케이션을 분석합니다.
Ultralytics YOLO11: 최첨단 기술
Ultralytics YOLO11은(는) Ultralytics YOLO 시리즈의 최신 버전으로, YOLOv8과 같은 이전 성공을 기반으로 구축되었습니다. YOLO11은 객체 감지, 인스턴스 분할, 이미지 분류 및 포즈 추정을 포함한 다양한 컴퓨터 비전 작업에서 향상된 정확도와 효율성을 위해 설계되었습니다.
기술 세부 사항:
- 저자: Glenn Jocher, Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: https://docs.ultralytics.com/models/yolo11/
아키텍처 및 주요 기능
YOLO11은 개선된 특징 추출과 더 빠른 처리를 위해 설계된 아키텍처를 특징으로 합니다. 이전 모델보다 더 적은 매개변수로 더 높은 정확도를 달성하여 실시간 성능을 향상시키고 NVIDIA Jetson 및 Raspberry Pi와 같은 에지 장치에서 클라우드 인프라에 이르기까지 다양한 플랫폼에 배포할 수 있습니다. YOLO11의 주요 장점은 간단한 Python API와 광범위한 문서를 통해 간소화된 사용자 경험을 제공하는 잘 관리되는 Ultralytics 생태계에 원활하게 통합된다는 것입니다. 이 생태계는 즉시 사용 가능한 사전 훈련된 가중치로 효율적인 훈련을 보장하고 GitHub 및 Discord를 통한 활발한 개발, 강력한 커뮤니티 지원 및 빈번한 업데이트의 이점을 누릴 수 있습니다. 또한 YOLO11은 경쟁 모델에서 종종 부족한 기능인 감지 외에 여러 비전 작업을 지원하여 다재다능함을 보여줍니다. 또한 일반적으로 트랜스포머와 같은 다른 모델 유형에 비해 훈련 및 추론 중에 더 낮은 메모리가 필요합니다.
강점
- 성능 균형: 속도와 정확성 간의 뛰어난 균형을 제공합니다.
- 사용 편의성: 간단한 API, 포괄적인 문서, 통합된 생태계(Ultralytics HUB)를 제공합니다.
- 다양성: 감지, 분할, 분류, 포즈 및 OBB 작업을 지원합니다.
- 효율성: 다양한 하드웨어에 최적화되어 효율적인 훈련과 낮은 메모리 공간을 제공합니다.
- 유지 관리 용이: 활발한 개발, 강력한 커뮤니티 지원 및 잦은 업데이트를 제공합니다.
약점
- 원-스테이지(one-stage) 검출기이므로 일부 투-스테이지(two-stage) 검출기에 비해 매우 작은 객체에 대한 어려움이 있을 수 있습니다.
- 더 큰 모델은 더 많은 컴퓨팅 리소스를 필요로 하지만, 일반적으로 트랜스포머 기반 모델보다는 적게 필요합니다.
이상적인 사용 사례
YOLO11은 높은 정확도와 실시간 처리를 요구하는 애플리케이션에 이상적입니다.
- 스마트 시티: 교통 관리 및 보안 시스템용.
- 헬스케어: 진단 지원을 위한 의료 영상 분석에 사용됩니다.
- 제조: 자동화된 생산 라인의 품질 관리를 위해.
- 농업: 정밀 농업을 위한 작물 건강 모니터링에 활용됩니다.
YOLOv9: 새로운 개념을 통한 정확도 향상
2024년 초에 소개된 YOLOv9은 객체 감지에 대한 중요한 학문적 기여를 나타내며, 심층 신경망에서 정보 손실을 극복하는 데 중점을 둡니다.
기술 세부 사항:
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- 문서: https://docs.ultralytics.com/models/yolov9/
아키텍처 및 주요 기능
YOLOv9은 두 가지 주요 아키텍처 혁신 기술인 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network)을 도입했습니다. PGI는 손실 함수 계산을 위한 완전한 입력 정보를 제공하도록 설계되어 심층 네트워크에서 성능을 저하시킬 수 있는 정보 병목 현상을 완화합니다. GELAN은 파라미터 활용률과 계산 효율성을 최적화하는 새롭고 매우 효율적인 네트워크 아키텍처입니다. 이러한 기능이 결합되어 YOLOv9은 COCO 데이터 세트에서 새로운 정확도 벤치마크를 설정할 수 있습니다.
강점
- 향상된 정확도: 실시간 객체 검출기에서 COCO 데이터 세트에 대한 새로운 최첨단 결과를 설정하여 mAP에서 많은 이전 모델을 능가합니다.
- 향상된 효율성: GELAN 및 PGI는 이전 모델보다 비슷하거나 더 나은 성능을 위해 더 적은 매개변수와 계산 리소스(FLOP)를 필요로 하는 모델에 기여합니다.
- 정보 보존: PGI는 더 깊고 복잡한 네트워크를 정확하게 훈련하는 데 중요한 정보 병목 현상 문제를 효과적으로 해결합니다.
약점
- 학습 리소스: YOLOv9 문서에 명시된 바와 같이 YOLOv9 모델을 학습하는 것은 Ultralytics YOLOv5에 비해 더 많은 리소스와 시간이 소요될 수 있습니다.
- 더 새로운 아키텍처: 다른 연구 그룹에서 개발한 더 최신 모델이므로, Ultralytics 생태계만큼 생태계, 커뮤니티 지원 및 타사 통합이 성숙하지 않았을 수 있습니다.
- Task Versatility: 주로 객체 탐지에 중점을 두며 YOLO11 및 YOLOv8과 같은 Ultralytics 모델에서 볼 수 있는 세분화, 분류 및 포즈 추정에 대한 기본 지원이 부족합니다.
이상적인 사용 사례
YOLOv9은 가능한 최고의 객체 감지 정확도를 달성하는 것이 주요 목표인 애플리케이션에 적합합니다.
- 고급 비디오 분석: 복잡한 장면에서 높은 정밀도로 추적 및 분석합니다.
- 고정밀 산업 검사: 제조 시 미세한 결함 감지에 적합합니다.
- 연구 및 벤치마킹: 표준 데이터 세트에서 감지 정확도의 한계를 뛰어넘습니다.
성능 비교: YOLO11 vs. YOLOv9
YOLO11과 YOLOv9는 모두 다양한 모델 크기를 제공하므로 개발자는 특정 요구 사항에 맞는 속도와 정확도 간의 적절한 균형을 찾을 수 있습니다. 다음 표는 COCO 데이터 세트에서 성능 지표를 직접 비교한 것입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
데이터에서 YOLO11 모델이 뛰어난 성능 균형을 제공한다는 것을 알 수 있습니다. 예를 들어, YOLO11s는 더 적은 FLOP으로 YOLOv9s보다 더 높은 mAP를 달성합니다. 마찬가지로 YOLO11l은 정확도에서 YOLOv9c를 능가하면서도 FLOP이 훨씬 적고 GPU 추론 속도가 더 빠릅니다. 가장 큰 YOLOv9-E 모델이 가장 높은 mAP를 달성하지만, YOLO11은 특히 Ultralytics 프레임워크에서 제공하는 포괄적인 속도 벤치마크와 쉬운 배포를 고려할 때 모델 범위에서 더 실용적인 절충안을 제공합니다.
아키텍처 및 생태계 차이점
핵심적인 차이점은 설계 철학에 있습니다. Ultralytics YOLO11은 실무자를 위해 제작되었습니다. 이 모델의 아키텍처는 성능뿐만 아니라 사용 편의성, 다재다능함, 통합성을 고려하여 최적화되었습니다. 통합 프레임워크는 여러 작업을 즉시 지원하므로 복잡한 AI 시스템의 개발 시간을 획기적으로 단축합니다. Ultralytics HUB, 광범위한 문서, 활발한 커뮤니티를 포함한 주변 에코시스템은 프로덕션 환경에 바로 배포할 수 있는 애플리케이션을 구축하고 배포하는 데 가장 적합한 선택입니다.
반면에 YOLOv9는 획기적인 학문적 개념을 도입하는 연구 중심 모델입니다. 정보 손실과 같은 딥 러닝 문제를 해결하는 새로운 접근 방식에 강점이 있습니다. 강력하지만 이러한 초점은 Ultralytics 모델을 정의하는 전체적이고 개발자 친화적인 생태계가 부족하다는 것을 의미합니다. YOLOv9를 다중 작업 파이프라인에 통합하거나 다양한 하드웨어에 배포하려면 더 많은 수동 노력과 전문 지식이 필요할 수 있습니다.
결론: 어떤 모델을 선택해야 할까요?
대다수의 개발자, 연구원 및 기업에게 Ultralytics YOLO11이 권장되는 선택입니다. 뛰어난 성능, 속도, 다재다능성 및 탁월한 사용 편의성의 조합을 제공합니다. 강력한 생태계와 적극적인 유지 관리를 통해 개념에서 생산까지 빠르고 효율적으로 이동할 수 있습니다. 단일 프레임워크 내에서 감지, 분할, 분류 등을 처리할 수 있는 기능은 강력하고 미래 지향적인 솔루션입니다.
YOLOv9는 벤치마크에서 절대적인 최대 detection 정확도를 달성하는 것이 주요 목표이며 통합된 생태계 외부에서 학습 및 배포의 추가적인 복잡성을 처리할 준비가 된 전문가 및 연구원에게 훌륭한 모델입니다.
다른 모델 살펴보기
객체 감지 분야는 끊임없이 진화하고 있습니다. YOLO11 및 YOLOv9 외에도 Ultralytics 생태계 내에서 사용 가능한 다른 강력한 모델에 관심이 있을 수도 있습니다. YOLOv10, 이전 모델인 YOLOv8 및 트랜스포머 기반 RT-DETR의 비교를 통해 프로젝트에 가장 적합한 모델을 찾아보십시오.