YOLOv9 YOLO11: 아키텍처 혁신과 생산 준비성 간의 가교 역할
실시간 객체 탐지 기술의 지형도는 정확도, 속도, 효율성의 한계를 끊임없이 확장하며 급속도로 진화하고 있습니다. 본 비교 분석은 YOLOv9의 이론적 돌파구로 알려진 YOLO11Ultralytics 비교 분석합니다.
두 모델 모두 전설적인 YOLO 비롯되었지만, 컴퓨터 비전 생태계에서 각기 다른 목적을 수행합니다. 본 가이드는 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석하여 개발자가 특정 요구 사항에 맞는 적절한 도구를 선택할 수 있도록 돕습니다.
요약: 혁신 대 생태계
YOLOv9 프로그래머블 그라디언트 정보(PGI)와 같은 새로운 아키텍처 개념을 통해 심층 신경망의 근본적인 정보 손실 문제를 해결하는 데 중점을 둡니다. 복잡한 데이터셋에서 최대한의 특징 보존이 필요한 학술 연구 및 시나리오에 탁월한 선택입니다.
YOLO11반면 YOLO11은 현실 세계를 위해 설계되었습니다. Ultralytics 핵심 구성원으로서, 단순한 탐지를 넘어 다양한 작업을 원활하게 처리할 수 있는 탁월한 사용 편의성, 에지 하드웨어에서의 우수한 추론 속도, 그리고 광범위한 작업에 대한 네이티브 지원을 제공합니다. 상용 애플리케이션을 개발하는 개발자들에게 YOLO11 훈련부터 배포까지 더욱 간소화된 경로를 YOLO11 .
기술 사양 및 성능
다음 표는 COCO 모델 간 성능 차이를 보여줍니다. YOLOv9 이론적으로 우수한 성능을 YOLOv9 반면, YOLO11 속도와 매개변수 효율성 측면에서 상당한 이점을 YOLO11 , 특히 에지 AI에 중요한 소형 모델 변종에서 두드러집니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv9: 프로그래머블 그라디언트 심층 분석
YOLOv9 심층 신경망의 '정보 병목 현상' 문제를 해결하기 위해 YOLOv9 . 신경망이 깊어질수록 입력 데이터는 예측 계층에 도달하기 전에 중요한 정보를 잃어버리는 경우가 많습니다.
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024년 2월 21일
- Arxiv:YOLOv9: 프로그래밍 가능한 기울기 정보를 사용하여 학습하고자 하는 것을 학습하기
주요 아키텍처 기능
- 프로그래머블 그라디언트 정보(PGI): PGI는 보조 감독 분기를 통해 신뢰할 수 있는 그라디언트를 생성하여, 매우 깊은 아키텍처에서도 주 분기가 견고한 특징을 학습하도록 보장합니다. 이는 그라디언트 하강 동역학 연구에 특히 유용합니다.
- GELAN(일반화된 효율적 레이어 집계 네트워크): CSPNet과 ELAN의 장점을 결합하여 매개변수 활용도를 최적화하는 새로운 아키텍처입니다. 이를 YOLOv9 기존Ultralytics 비해 상대적으로 가벼운 구조로 높은 정확도를 YOLOv9 있습니다.
YOLO11: 생산성과 다용도성을 위해 설계된
YOLO11 수백만 AI 실무자를 지원해온 Ultralytics 노하우가 집약된 YOLO11 . 실용성을 최우선으로 하여 모델이 벤치마크에서 정확할 뿐만 아니라 NVIDIA 라즈베리 파이 기기에 이르기까지 다양한 하드웨어에서 쉽게 훈련, 내보내기 및 실행될 수 있도록 보장합니다.
- 저자: Glenn Jocher, Jing Qiu
- 조직:Ultralytics
- 날짜: 2024년 9월 27일
- 리포지토리:Ultralytics
Ultralytics 이점
YOLO11 광범위한 Ultralytics 와의 통합을 통해 YOLO11 . 여기에는 다음이 포함됩니다:
- 메모리 효율성: YOLO11 트랜스포머 기반 아키텍처나 최적화되지 않은 저장소에 비해 훈련 중 CUDA 사용량을 현저히 줄이도록 YOLO11 . 이를 통해 훈련 접근성이 확대되어 사용자가 RTX 3060이나 4070과 같은 소비자용 GPU에서도 최신 모델을 미세 조정할 수 있습니다.
- 광범위한 작업 지원: 기본 저장소에서 주로 탐지에 초점을 맞춘 YOLOv9 달리, YOLO11 다음을 지원합니다:
- 수출 가능성: 원클릭으로 다음과 같은 형식으로 내보내기 ONNX, TensorRT, CoreML, TFLite 등의 형식으로 원클릭 내보내기가 TFLite YOLO11 모바일 및 임베디드 배포를 위한 YOLO11 .
Ultralytics를 통한 효율적인 교육
YOLO11 훈련에는 최소한의 상용구 코드만 YOLO11 . Python 사용하면 몇 초 만에 사용자 정의 데이터셋으로 훈련을 시작할 수 있습니다:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
실제 사용 사례
이 두 모델 중 하나를 선택하는 것은 배포 제약 조건과 프로젝트 목표에 크게 좌우됩니다.
YOLOv9의 이상적인 시나리오
- 학술적 벤치마킹: 네트워크 토폴로지와 정보 흐름을 연구하는 연구자들은 신경망 아키텍처 탐색을 위해 YOLOv9 PGI 개념이 YOLOv9 흥미로울 것이다.
- 고충실도 특징 추출: 고해상도 의료 영상에서 미세한 특징을 포착하는 것이 중요한 작업에 대해 GELAN 백본은 강력한 표현력을 제공합니다.
- 표준 GPU 배포: 지연 시간보다 mAP 마지막 0.1%를 끌어내는 것이 더 중요한 환경에서는 더 큰 YOLOv9e 모델이 강력한 후보입니다.
YOLO11의 이상적인 시나리오
- 엣지 AI와 IoT: 우수한 CPU 속도(예: GPU YOLO11n 1.5ms vs YOLOv9t 2.3ms, CPU 격차가 더욱 큼)를 자랑하는 YOLO11 드론 항법 및 스마트 카메라에 YOLO11
- 상용 SaaS: Ultralytics 안정성과 적극적인 유지보수는 상용 애플리케이션이 최신 PyTorch 함께 안전하고 최신 상태를 유지하도록 보장합니다.
- 다중 작업 파이프라인: 스포츠 분석과 같이 동시 탐지 및 추적이 필요한 애플리케이션은 YOLO11 기본 프레임워크를 변경하지 않고도 작업을 전환할 수 있는 능력으로부터 이점을 얻습니다.
- 자원 제약 환경에서의 훈련: 하드웨어가 제한된 스타트업과 학생들도 무거운 아키텍처와 관련된 높은 클라우드 비용 없이 효과적인 YOLO11 훈련할 수 있습니다.
미래: YOLO26을 향하여
YOLOv9 YOLO11 , 컴퓨터 비전 분야는 결코 멈추지 않습니다. Ultralytics 최근 2026년과 그 이후를 위한 효율성을 재정의하는 모델인 YOLO26을 Ultralytics .
YOLO NMS6은 두 아키텍처에서 얻은 교훈을 바탕으로 하지만, 최초 도입 된YOLOv10에서 최초로 도입된 원생 엔드투엔드 NMS 프리 설계를 도입합니다. 이는 비최대 억제(NMS) 후처리 작업의 필요성을 제거하여 배포 파이프라인을 크게 단순화합니다.
왜 YOLO26을 고려해야 할까요?
- 속도: 이전 세대에 비해 최대 43% 빠른 CPU 달성했으며, 이는 분포 초점 손실(DFL) 제거 및 최적화된 그래프 실행을 통해 구현되었습니다.
- 안정성: 새로운 MuSGD 최적화기를 활용합니다. 이는 SGD (Muon, 대규모 언어모델 훈련에서 영감을 얻음)의 하이브리드로, 대규모 배치 훈련의 안정성을 비전 작업에 제공합니다.
- 정밀도: 위성 영상 분석에서 흔히 발생하는 문제점인 소형 물체 인식 능력을 획기적으로 개선하는 ProgLoss + STAL 기능을 탑재했습니다.
새로운 프로젝트를 시작하는 개발자에게는 애플리케이션의 미래 대비를 위해 YOLO11 함께 YOLO26을 평가하는 것이 매우 YOLO11 .
결론
YOLOv9 YOLO11 모두 객체 탐지 역사에서 중요한 이정표를 YOLO11 . YOLOv9 심층 신경망에서의 정보 보존과 관련하여 중요한 이론적 개선을 YOLOv9 . 그러나 YOLO11 (그리고 최신 버전인 YOLO26)은 통합된 Ultralytics , 우수한 속도-정확도 비율, 그리고 쉬운 배포성 덕분에 대부분의 사용자에게 일반적으로 더 실용적인 패키지를 제공합니다.
Ultralytics 활용하면 개발자는 두 모델을 손쉽게 실험하고, 사용자 지정 데이터셋에서 성능을 비교하며, 단 몇 번의 클릭만으로 우수한 모델을 프로덕션 환경에 배포할 수 있습니다.
추가 자료
- 모델 비교: 이 모델들이 어떻게 비교되는지 확인하세요 YOLOv8 및 RT-DETR와 비교해 보세요.
- 데이터 관리: Ultralytics 사용하여 이러한 모델에 대한 데이터를 효율적으로 주석 처리하는 방법을 알아보세요.
- 배포: 모델을 TensorRT로 내보내는 방법에 대한 가이드 살펴보기 TensorRT 로 내보내는 가이드를 살펴보고 GPU 극대화하세요.