YOLO11 YOLOv9: 아키텍처와 성능에 대한 심층 분석

적절한 객체 탐지 모델을 선택하는 것은 컴퓨터 비전 애플리케이션의 속도, 정확도 및 확장성에 영향을 미치는 중요한 결정입니다. 본 가이드는 YOLO11( Ultralytics의 강력한 버전)과 YOLOv9(프로그래머블 그라디언트 정보(PGI)로 유명한 아키텍처) 간의 포괄적인 기술적 비교를 제공합니다.

두 모델 모두 비전 모델의 역사에서 중요한 도약을 나타내지만, AI 개발 환경에서 약간 다른 요구 사항을 충족시킵니다.

모델 개요

YOLO11

YOLO11 강력한 Ultralytics 기반으로 구축되어, 계산 효율성과 탐지 정확도 간의 균형을 정교하게 조정합니다. 현대적인 MLOps 워크플로우와 원활하게 통합되는 다목적의 즉시 사용 가능한 모델로 설계되었습니다.

저자: 글렌 조커와 징 치우
조직:Ultralytics
날짜: 2024년 9월
주요 특징: 실시간 속도, 사용 편의성, 광범위한 작업 지원(검출, 분할, 분류, 포즈, OBB).

YOLO11에 대해 자세히 알아보세요

9

YOLOv9 GELAN(일반화된 효율적 레이어 집계 네트워크) 및 PGI와 같은 새로운 개념을 도입하여 심층 신경망에서의 정보 손실 문제를 해결했습니다. 학술 벤치마크에서는 높은 정확도를 달성하지만, 훈련에 더 많은 계산 자원이 필요한 경우가 많습니다.

저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
Organization: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2024년 2월
초점: 딥 컨볼루션 신경망(CNN)에서 매개변수 효율 극대화 및 정보 병목 현상 감소.

9에 대해 자세히 알아보기

성능 분석

이러한 모델을 평가할 때, 지연 시간 (속도)과 mAP (정확도) 간의 균형은 가장 중요합니다. Ultralytics YOLO11 최적화하여 엣지 디바이스와 GPU 모두에서 우수한 처리량을 YOLO11 .

주요 지표 비교

다음 표는 COCO 성능 차이를 보여줍니다. YOLO11 실시간 추론 애플리케이션에 중요한 요소인 지연 시간을 현저히 낮추면서도 동등하거나 더 나은 정확도를 YOLO11 점을 주목하십시오.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

데이터 해석하기

YOLOv9e는 정확도 상한선(55.6% mAP)을 끌어올리지만, 속도(16.77ms vs YOLO11x의 11.3ms)에 상당한 대가를 치릅니다. 대부분의 상용 애플리케이션에서는 YOLO11 계열은 고프레임 비디오 스트림을 처리할 수 있는 속도로 높은 정확도를 제공하며, 보다 실용적인 "최적의 균형점"을 제시합니다.

아키텍처의 차이점

근본적인 차이는 설계 철학에 있습니다. YOLOv9 기울기 흐름에 대한 심층적인 이론적 개선에 YOLOv9 반면, YOLO11 배포와 다용도성을 위한 실용적인 엔지니어링에 YOLO11 .

YOLOv9: PGI 및 GELAN

YOLOv9 데이터가 심층 레이어를 통과할 때 의미 정보의 손실을 방지하기 위해 프로그래머블 그라디언트 정보(PGI)를 YOLOv9 . 이는 본질적으로 훈련 중 보조 감독 분기를 제공하며, 추론 시에는 제거됩니다. GELAN 아키텍처와 결합되어 모델이 가벼우면서도 정확할 수 있게 합니다. 이는 신경 아키텍처 탐색과 그라디언트 흐름을 연구하는 이들에게 흥미로운 주제로 자리매김합니다.

YOLO11: 개선된 C3k2 및 C2PSA

YOLO11 이전 버전에서 사용된 CSP 병목 구조를 개선한 C3k2 블록을YOLO11 , GPU 최적화되었습니다. 또한 C2PSA(Cross-Stage Partial with Spatial Attention)를 통합하여 복잡한 장면에서 핵심 특징에 집중하는 모델의 능력을 향상시킵니다. 이 아키텍처는 특징 추출 능력을 저하시키지 않으면서 FLOPs를 줄이도록 특별히 조정되어, 상기 인상적인 속도 지표를 달성했습니다.

교육 효율성 및 에코시스템

Ultralytics 선택할 때 가장 큰 장점 중 하나는 주변 생태계입니다.

사용 편의성과 문서화

YOLO11 훈련에는 최소한의 상용구 코드만 YOLO11 . Ultralytics Python 이 과정을 표준화하여 초보자도 쉽게 접근할 수 있게 합니다. 반면 YOLOv9 , 기본 구현 방식은 더 복잡한 구성 파일과 수동 설정이 필요할 수 있습니다.

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Train on COCO8 with just one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

메모리 요구 사항

Ultralytics 메모리 효율성으로 유명합니다. YOLO11 는 제한된 CUDA 가진 소비자 등급 하드웨어에서 훈련하도록 최적화되었습니다. 이는 역전파 단계에서 메모리 부풀림 현상을 겪는 많은 트랜스포머 기반 모델이나 구형 아키텍처에 비해 뚜렷한 장점입니다.

작업 전반에 걸친 다양한 활용성

YOLOv9 주로 객체 탐지 YOLOv9 이지만, YOLO11 은 다중 작업의 핵심 도구입니다. 동일한 프레임워크 내에서 다음을 원활하게 전환할 수 있습니다:

비전 AI의 미래: YOLO26

최첨단을 추구하는 개발자들을 위해 Ultralytics YOLO26을 Ultralytics . 이 모델은 YOLOv10 교훈을 모두 반영한 차세대 비전 AI를 구현합니다.

YOLO26은 기본적으로 엔드투엔드 NMS( NMS) 설계를 채택하여 비최대 억제(NMS) 후처리 단계가 필요하지 않습니다. 이로 인해 더 빠른 추론 속도와 단순화된 배포 파이프라인을 구현합니다. 또한 SGD )의 하이브리드인 MuSGD 최적화기를 활용하여 대규모 언어 모델(LLM) 훈련에서 볼 수 있는 것과 유사한 안정적인 훈련 역학을 보장합니다. ProgLoss + STAL과 같은 최적화된 손실 함수를 통해 YOLO26은 소형 객체 탐지에 탁월하여 2026년 이후를 위한 최상의 선택입니다.

YOLO26에 대해 더 알아보기

이상적인 사용 사례

9 선택해야 할 때

학술 연구: CNN 정보 보존 및 기울기 프로그래밍의 이론적 한계 연구에 탁월함.
정적 이미지 분석: 의료 영상(예: 종양 탐지)과 같이 추론 속도보다 단일 프레임에서 최대한의 세부 정보를 추출하는 것이 우선시되는 시나리오에서.

YOLO11 선택해야 할 때

엣지 AI 배포: TensorRT TFLite 같은 내보내기 형식이 TFLite 라즈베리 파이(Raspberry Pi)나 NVIDIA )과 같은 장치에 이상적입니다.
상업용 생산: 신뢰성, 속도 및 지원이 중요한 소매 분석, 스마트 시티 모니터링 또는 제조 품질 관리에 적합합니다.
복합 파이프라인: 단일 통합 API를 사용하여 여러 비전 작업(예: 사람 감지 후 자세 추정)이 필요한 애플리케이션의 경우.

결론

YOLO11 YOLOv9 모두 컴퓨터 비전 엔지니어의 무기고에서 탁월한 YOLOv9 . 그러나 대부분의 실제 응용 분야에서는 YOLO11 (그리고 최신 버전인 YOLO26)은 속도, 정확도, 개발자 경험의 균형에서 더 뛰어난 성능을 제공합니다. 활발한 Ultralytics 빈번한 업데이트를 바탕으로, 여러분의 프로젝트가 미래에도 대비할 수 있고 효율적으로 유지되도록 보장합니다.

추가적인 탐구를 위해, 다음 모델들과의 비교에도 관심이 있을 수 있습니다. RT-DETR 트랜스포머 기반 탐지 모델인 YOLOv10과 비교하거나 경량화된 YOLOv10 아키텍처를 살펴보는 것도 흥미로울 수 있습니다.