YOLOv9 YOLO11: 현대 객체 탐지 기술에 대한 심층 분석
컴퓨터 비전의 급속한 발전은 실시간 물체 탐지에서 가능한 것의 한계를 지속적으로 넓혀 왔습니다. 선도적인 아키텍처를 비교할 때, YOLOv9 와 Ultralytics YOLO11 은 각각 독특한 기술적 요구를 충족시키며 획기적인 발전을 이루었습니다. YOLOv9 딥 네트워크 훈련 중 기울기 흐름을 보존하는 새로운 방식을 YOLOv9 반면, YOLO11 타의 추종을 불허하는 효율성, 다용도성 및 사용 편의성으로 범용 비전 생태계에 YOLO11 .
이 포괄적인 기술 비교 분석은 각 모델의 아키텍처, 성능 지표, 메모리 요구 사항 및 이상적인 배포 시나리오를 분석하여 다음 AI 프로젝트에 최적의 모델을 선택하는 데 도움을 드립니다.
YOLO26으로 프로젝트의 미래 대비를 완성하세요
YOLOv9 YOLO11 , 새롭게 출시된 YOLO26은 차세대 도약을 상징합니다. 간소화된 배포를 위한 엔드투엔드 NMS 설계, 최대 43% 빠른 CPU , 그리고 빠른 수렴을 위한 혁신적인 MuSGD 최적화기를 특징으로 합니다. 모든 신규 생산 프로젝트에 YOLO26을 적극 권장합니다.
기술 사양 및 저작권
이러한 모델들의 계보를 이해하는 것은 그들의 아키텍처 결정과 프레임워크 종속성에 대한 필수적인 맥락을 제공한다.
9
YOLOv9 딥러닝 정보 병목 현상에 대한 강력한 학술적 초점을 YOLOv9 , 맞춤형 네트워크 블록을 통해 최대의 특징 충실도를 최우선으로 삼았습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직:정보 과학 연구소, 아카데미아 시니카
- 날짜: 2024년 2월 21일
- Arxiv:2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
Ultralytics YOLO11
YOLO11 생산 환경을 위해 처음부터 YOLO11 , 최상위 수준의 정확도, 실제 배포 속도, 그리고 다중 작업 유연성 간의 균형에 중점을 두었습니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜: 2024년 9월 27일
- GitHub:https://github.com/ultralytics/ultralytics
아키텍처 혁신
YOLOv9의 프로그래머블 그라디언트 정보
YOLOv9 일반화된 효율적 레이어 집계 네트워크(GELAN)와 함께 프로그래머블 그라디언트 정보(PGI) 개념을 YOLOv9 . 신경망이 깊어질수록 정보 병목 현상이 발생하여 전방 전달 과정에서 중요한 세부 정보가 손실되는 경우가 많습니다. PGI는 미세한 공간 정보를 유지하는 신뢰할 수 있는 기울기 업데이트를 제공함으로써 이 문제를 해결하고, GELAN은 매개변수 효율성을 극대화합니다. 이로 인해 YOLOv9 높은 특징 충실도가 요구되는 작업에 YOLOv9 능숙하지만, 후처리 과정에서 표준 비최대 억제(NMS)에 의존하기 때문에 에지 디바이스에서 지연이 발생할 수 있습니다.
YOLO11의 효율성 최적화
YOLO11 수년간의 기초 연구를 YOLO11 고도로 최적화된 아키텍처를 YOLO11 . 이전 버전 대비 계산 오버헤드를 줄이면서 특징 추출을 극대화하여 성능을 향상시켰습니다. CPU 저하시키는 기존 NMS 달리, YOLO11 정교한 탐지 헤드를 YOLO11 지연 시간과 정확도 사이의 놀라운 균형을 달성합니다. 또한 YOLO11 훈련 속도가 느리고 방대한 CUDA 요구하는 무거운 트랜스포머 모델에 비해 모델 훈련 및 추론 과정에서 본질적으로 낮은 메모리 사용량을 YOLO11 .
성능 지표 비교
표준 COCO 이 모델들을 비교해 보면, 두 모델 모두 놀라운 능력을 보여주지만, 순수한 매개변수 수와 실행 속도 사이에는 상충 관계가 나타난다.
아래는 YOLO 지표에 대한 상세한 분석입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
결과 분석
- 속도 및 하드웨어 효율성: YOLO11 추론 YOLOv9 YOLO11 능가합니다. 예를 들어, YOLO11n은 NVIDIA GPU 에서 GPU 놀라운 1.5ms를 달성합니다. TensorRT를 사용하여 놀라운 1.5ms를 달성하여 엄격한 실시간 파이프라인에 매우 적합합니다.
- 연산 요구 사항: YOLO11 일반적으로 더 적은 FLOPs를 필요로 합니다(예: YOLO11m의 경우 680억 FLOPs, YOLOv9m의 경우 763억 FLOPs). 이는 라즈베리 파이 또는 모바일 하드웨어와 같은 배터리 구동형 에지 장치에서 더 낮은 전력 소모로 이어집니다.
- 정확도 동등성: YOLOv9e가 절대 mAP 55.6 vs 54.7)에서 YOLO11x를 약간 앞서는 반면, YOLO11 훨씬 낮은 지연 시간(11.3ms vs 16.77ms)으로 최고 정확도에 YOLO11 실제 배포 환경에서 더 유리한 성능 균형을 보여줍니다.
에코시스템 및 사용 편의성
원시 지표도 중요하지만, 프레임워크 생태계가 프로젝트 성공을 좌우하는 경우가 많습니다. 바로 여기서 Ultralytics 진가를 발휘합니다.
원본 YOLOv9 최첨단 연구 구현을 제공하는 고도로 전문화된 플랫폼입니다. 그러나 Ultralytics 해당 오픈소스 패키지는 간소화된 사용자 경험, 간단한 API, 그리고 광범위한 문서를 제공하여 시장 출시 시간을 획기적으로 단축시킵니다.
다중 작업 유연성
YOLOv9 주로 바운딩 박스 검출에 YOLOv9 . 반면 YOLO11 다음과 같은 기능을 기본적으로 지원하는 통합형 다중 작업 처리 YOLO11 :
원활한 배포
Ultralytics 사용하면 개발자가 단 한 줄의 코드로 다양한 형식으로 모델을 원활하게 내보낼 수 있습니다. Python 코드로 모델을 다양한 형식으로 원활하게 내보낼 수 있습니다. ONNX, OpenVINO, TFLite, 또는 CoreML를 사용하면 훈련에서 생산 환경으로의 전환이 손쉽게 이루어집니다.
from ultralytics import YOLO
# Load a highly efficient YOLO11 model
model = YOLO("yolo11n.pt")
# Train rapidly on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to OpenVINO for Intel CPU acceleration
model.export(format="openvino")
이상적인 사용 사례
YOLOv9 활용할 시기
YOLOv9 하드웨어 지연 시간이 주요 제약 조건이 아닌, 극도의 특징 충실도를 우선시하는 연구 중심 환경이나 시나리오에 탁월한 YOLOv9 . 가장 미세한 픽셀 변이를 감지하는 것이 중요한 의료 영상 분석 분야에서 GELAN 아키텍처는 매우 유리할 수 있습니다.
왜 YOLO11 더 나은 선택 YOLO11
개발자, 엔지니어 및 생산 팀에게 YOLO11 강력히YOLO11 . 고속, 확장 가능한 배포가 요구되는 환경에서 탁월한 성능을 발휘합니다:
- 스마트 리테일 애널리틱스: 표준 Intel 프로세서를 활용하여 제품과 고객을 원활하게 추적합니다.
- 자율 비행 드론: 낮은 FLOP 아키텍처가 배터리 수명을 보존하면서도 여전히 강력한 소형 물체 감지 성능을 제공하는 곳.
- 동적 프로젝트: 탐지로 시작할 수 있지만, 이후 자세 추정이나 분할이 필요해지는 워크플로.
앞으로의 전망: 다음 진화
YOLO11 동시대 최고 수준을 YOLO11 , 컴퓨터 비전 분야는 계속 발전하고 있습니다. AI의 한계를 탐구하는 사용자들은 또한 YOLO26를 주목해야 합니다.
최초로 탐구된 엔드투엔드 NMS 설계의 선구자 YOLOv10에서 최초로 탐구된 엔드투엔드 NMS 프리 설계를 선도하며, YOLO26은 전례 없는 훈련 안정성을 위해 MuSGD 최적화기( SGD 하이브리드)를 도입합니다. 수출 간소화를 위한 분포 초점 손실(DFL) 제거와 ProgLoss 및 STAL과 같은 고급 손실 메커니즘을 통해 YOLO26은 최대 43% 더 빠른 CPU 달성합니다. 현대적인 프로젝트를 위해 학술적 혁신과 생산 환경에 바로 적용 가능한 안정성을 궁극적으로 결합합니다. 또한 Ultralytics YOLOv8 에서 업그레이드하는 팀은 통합된 Ultralytics 덕분에 YOLO26 또는 YOLO11 전환이 YOLO11 원활할 것입니다.