콘텐츠로 건너뛰기

YOLOv9 YOLO11: 아키텍처의 진화 및 성능 분석

컴퓨터 비전의 환경은 정확성, 속도, 효율성의 경계를 끊임없이 넓혀가는 모델과 함께 빠른 혁신으로 정의됩니다. 이 비교에서는 물체 감지 분야에서 중요한 두 가지 이정표를 살펴봅니다: YOLOv9새로운 아키텍처 개념을 도입한 연구 중심 모델과 Ultralytics YOLO11와 실제 활용성을 위해 설계되어 프로덕션 환경에서 바로 사용할 수 있도록 진화한 최신 모델입니다.

동안 YOLOv9 은 이론적 돌파구를 통해 딥러닝 정보 병목 현상을 해결하는 데 중점을 둡니다, Ultralytics YOLO11 은 사용성, 효율성 및 Ultralytics 에코시스템과의 원활한 통합에 중점을 두고 최첨단(SOTA) 성능을 개선합니다.

성능 지표: 속도 및 정확성

다음 표는 COCO 데이터 세트에서 평가된 주요 성능 메트릭을 직접 비교한 것입니다. 모델을 선택할 때는 평균 평균 정밀도mAP와 추론 속도 및 계산 비용(FLOPs)의 균형을 맞추는 것이 중요합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

데이터에서 알 수 있듯이 YOLO11 뛰어난 효율성을 보여줍니다. 예를 들어, YOLO11n 모델은 더 적은 FLOP을 사용하고 GPU 훨씬 빠르게 실행되면서도 YOLOv9t(38.3%)보다 더 높은 mAP (39.5%)를 달성합니다. 가장 큰 YOLOv9e 모델이 원시 정확도에서는 약간 우위에 있지만, 추론 시간이 YOLO11l의 거의 두 배에 달하므로 실시간 추론 시나리오에서는 YOLO11 더 실용적인 선택이 됩니다.

YOLOv9: 정보 병목 현상 해결

YOLOv9 데이터가 심층 신경망을 통과할 때 발생하는 정보 손실 문제를 해결하고자 하는 특정 학문적 목표를 가지고 출시되었습니다. 이 아키텍처는 훈련 중에 기울기 정보를 유지해야 하는 필요성에 크게 영향을 받았습니다.

기술 세부 정보:
저자: Chien-Yao Wang, Hong-Yuan Mark Liao
조직:대만 아카데미아 시니카 정보과학 연구소
날짜: 2024-02-21
아카이브:https://arxiv.org/abs/2402.13616
깃허브:https://github.com/WongKinYiu/yolov9
문서ultralytics

주요 아키텍처 기능

YOLOv9 핵심 혁신은 프로그래머블 그라데이션 정보(PGI)일반화된 효율적인 레이어 집계 네트워크(GELAN)입니다.

  • PGI: 이 보조 감독 프레임워크는 딥 레이어가 신뢰할 수 있는 그라데이션 정보를 수신하여 종종 딥 네트워크의 수렴을 방해하는 '정보 병목 현상'을 완화합니다.
  • GELAN: 이 아키텍처는 CSPNet과 ELAN의 강점을 결합하여 매개변수 효율성을 최적화하여 유연한 계산 확장을 가능하게 합니다.

아카데믹 포커스

YOLOv9 딥러닝 이론, 특히 컨볼루션 신경망의 기울기 흐름과 정보 보존에 관심이 있는 연구자들에게 훌륭한 사례 연구로 활용될 수 있습니다.

YOLOv9 대해 자세히 알아보기

Ultralytics YOLO11: 다목적성과 효율성의 만남

의 유산을 기반으로 구축 YOLOv8의 유산을 기반으로 한 YOLO11 프로덕션 지향 컴퓨터 비전의 정점을 나타냅니다. 벤치마크 점수뿐만 아니라 실용적인 배포 가능성, 사용 편의성, 멀티태스킹 기능을 위해 설계되었습니다.

기술 세부 정보:
저자: Glenn Jocher, Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11

주요 아키텍처 기능

YOLO11 계산 오버헤드를 최소화하면서 특징 추출을 극대화하도록 설계된 정교한 아키텍처를 도입했습니다. 이 제품은 향상된 백본 및 넥 구조를 채택하여 다양한 스케일에서 특징 통합을 향상시키며, 이는 작은 물체를 감지하는 데 매우 중요합니다.

이 모델은 또한 훈련 중 더 빠른 융합을 위해 개선된 헤드 디자인을 특징으로 합니다. 연구 중심 모델과 달리 YOLO11 감지, 세분화, 분류, 포즈 추정 및 OBB(Oriented Bounding Box)를 기본적으로 지원하는 통합 프레임워크 내에서 구축되었습니다.

YOLO11에 대해 자세히 알아보세요

자세한 비교 포인트

사용 편의성 및 에코시스템

가장 중요한 차이점 중 하나는 사용자 경험에 있습니다. Ultralytics YOLO11 은 '개발자 우선' 사고방식으로 설계되었습니다. 데이터 주석, 데이터 세트 관리 및 모델 내보내기를 위한 도구가 포함된 광범위한 Ultralytics 에코시스템과 원활하게 통합됩니다.

  • YOLO11: 를 사용하여 몇 줄의 코드로 교육, 검증 및 배포할 수 있습니다. ultralytics Python 패키지 또는 CLI. 잦은 업데이트, 방대한 문서, 방대한 커뮤니티의 이점을 누릴 수 있습니다.
  • YOLOv9: Ultralytics 라이브러리에서 지원되지만, 원래 구현 및 일부 고급 구성을 사용하려면 기초 연구 논문에 대한 깊은 이해가 필요할 수 있습니다.

메모리 요구 사항 및 교육 효율성

효율적인 리소스 활용은 Ultralytics 모델의 특징입니다. YOLO11 많은 트랜스포머 기반 대안이나 이전 YOLO 반복에 비해 훈련 중에 더 적은 CUDA 메모리를 사용하도록 최적화되어 있습니다. 따라서 개발자는 소비자급 하드웨어에서 더 큰 배치 크기를 트레이닝할 수 있어 개발 주기를 단축할 수 있습니다.

또한 YOLO11 모든 작업에 대해 즉시 사용 가능한 고품질의 사전 훈련된 가중치를 제공하여 빠르고 효과적인 전이 학습을 보장합니다. 이는 주로 COCO 탐지에 초점을 맞춘 제한된 사전 훈련된 체크포인트를 제공하는 연구 모델과는 대조적입니다.

작업의 다양성

YOLOv9 주로 객체 감지 분야에서 성과를 인정받고 있지만, YOLO11 단일 프레임워크 내에서 다양한 컴퓨터 비전 작업을 기본적으로 지원합니다:

  • 인스턴스 세분화: 오브젝트를 정밀하게 마스킹합니다.
  • 포즈 추정: 골격 키포인트 감지(예: 사람 포즈).
  • 분류: 전체 이미지를 분류합니다.
  • 오리엔티드 바운딩 박스(OBB): 회전된 물체를 감지하는 기능으로 항공 이미지에 필수적입니다.

통합 API

YOLO11 작업 간 전환은 모델 웨이트 파일을 변경하는 것만큼이나 간단합니다(예 yolo11n.pt 에 대한 탐지 yolo11n-seg.pt 세분화를 위해).

코드 예시: 실제 비교

다음 Python 코드는 서로 다른 아키텍처 테스트를 간소화하는 통합 API를 강조하면서, 두 모델을 Ultralytics 프레임워크 내에서 얼마나 쉽게 로드하고 활용할 수 있는지 보여줍니다.

from ultralytics import YOLO

# Load the research-focused YOLOv9 model (compact version)
model_v9 = YOLO("yolov9c.pt")

# Load the production-optimized YOLO11 model (medium version)
model_11 = YOLO("yolo11m.pt")

# Run inference on a local image
# YOLO11 provides a balance of speed and accuracy ideal for real-time apps
results_11 = model_11("path/to/image.jpg")

# Display results
results_11[0].show()

이상적인 사용 사례

YOLOv9 선택해야 할 때

YOLOv9 계산 비용에 관계없이 정적 이미지의 정확도를 극대화하는 것이 최우선 과제인 학술 연구 및 시나리오에 탁월한 선택입니다.

  • 연구 프로젝트: 기울기 흐름과 신경망 구조에 대한 연구.
  • 벤치마킹: mAP 모든 부분이 중요한 대회.
  • 하이엔드 서버 배포: 'E' 버전의 더 높은 FLOP을 처리할 수 있는 강력한 GPU(예: A100)를 사용할 수 있는 경우.

Ultralytics YOLO11을 선택해야 하는 경우

YOLO11 상용 애플리케이션, 엣지 컴퓨팅멀티태스크 시스템에 권장되는 제품입니다.

  • 엣지 AI: 뛰어난 속도 대비 무게 비율로 인해 NVIDIA Jetson 또는 Raspberry Pi와 같은 장치에 배포할 수 있습니다.
  • 실시간 분석: 지연 시간이 중요한 교통 모니터링, 스포츠 분석, 제조 품질 관리.
  • 복잡한 파이프라인: 감지, 세분화, 포즈 추정이 동시에 필요한 애플리케이션.
  • 신속한 프로토타이핑: 스타트업과 엔터프라이즈가 Ultralytics API를 사용하여 개념에서 배포로 빠르게 이동해야 하는 경우.

살펴볼 다른 모델

YOLOv9 YOLO11 강력한 경쟁자이지만, Ultralytics 라이브러리는 특정 요구 사항에 맞는 다양한 모델을 지원합니다:

  • YOLOv8: YOLO11 안정적인 이전 버전으로, 여전히 널리 사용되고 지원되고 있습니다.
  • RT-DETR: 정확도는 뛰어나지만 메모리가 더 많이 필요할 수 있는 트랜스포머 기반 검출기입니다.
  • YOLOv10: 특정 구성에서 지연 시간을 줄이기 위해 NMS 필요 없는 교육에 중점을 둔 차별화된 아키텍처입니다.

모델 비교 섹션에서 전체 옵션을 살펴보세요.

결론

두 아키텍처 모두 컴퓨터 비전 분야에서 중요한 업적을 남겼습니다. YOLOv9 딥 네트워크 훈련에 대한 귀중한 이론적 통찰력을 제공하며 Ultralytics YOLO11 은 이러한 발전을 종합하여 전 세계를 위한 강력하고 다재다능하며 매우 효율적인 도구로 탄생했습니다. 확장 가능한 실시간 애플리케이션을 구축하고자 하는 대부분의 개발자와 연구원에게 YOLO11 성능, 사용 편의성, 포괄적인 에코시스템 지원의 균형을 갖춘 탁월한 선택입니다.


댓글