콘텐츠로 건너뛰기

YOLOv9 YOLO26: 아키텍처와 성능 비교 분석

실시간 객체 탐지 기술의 지형도는 끊임없이 진화하고 있으며, 새로운 버전이 나올 때마다 정확도, 속도, 효율성 측면에서 상당한 개선이 이루어지고 있습니다. 본 글은 YOLOv9와 Ultralytics 차세대 에지 AI 애플리케이션을 위해 Ultralytics 최신 최첨단 모델인 YOLO26 간의 심층적인 기술적 비교를 제공합니다.

모델 개요

두 모델 모두 컴퓨터 비전 분야에서 중요한 이정표를 나타내지만, 탐지 문제에 접근하는 방식은 약간 다른 아키텍처 철학을 기반으로 합니다.

YOLOv9: 프로그래밍 가능한 그래디언트 정보

2024년 2월 대만 중앙연구원(Academia Sinica) 연구진에 의해 발표된 YOLOv9 딥 뉴럴 네트워크의 정보 손실 문제를 해결하기 위한 새로운 개념을 YOLOv9 .

  • 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
  • Organization: Institute of Information Science, Academia Sinica, Taiwan
  • 날짜: 2024년 2월 21일
  • 핵심 혁신: 프로그래머블 그라디언트 정보(PGI) 및 일반화된 효율적 레이어 집계 네트워크(GELAN).
  • 초점: 훈련 중 매개변수 활용도와 기울기 흐름을 개선하여 심층 레이어에서의 정보 보존을 극대화한다.

9에 대해 자세히 알아보기

YOLO26: 에지 네이티브 진화

Ultralytics( Ultralytics)가 2026년 1월에 출시한 YOLO26은 특히 CPU 에지 디바이스에 대한 종단 간 효율성과 간소화된 배포를 향한 패러다임 전환을 의미합니다.

  • 저자: Glenn Jocher, Jing Qiu
  • 조직:Ultralytics
  • 날짜: 2026년 1월 14일
  • 핵심 혁신: 엔드투엔드 NMS 아키텍처, MuSGD 최적화기, 그리고 분산 초점 손실(DFL) 제거.
  • 주요 목표:GPU 추론 지연 최소화, 내보내기 프로세스 간소화, 대규모 언어 모델(LLM)에서 영감을 받은 기법을 활용한 훈련 역학 안정화.

YOLO26에 대해 더 알아보기

아키텍처의 차이점

이 두 모델의 핵심적인 차이는 헤드 설계와 손실 함수 공식화에 있으며, 이는 모델의 배포 속도와 훈련 안정성에 직접적인 영향을 미친다.

YOLOv YOLOv9의 아키텍처

YOLOv9 일반화된 효율적 레이어 집계 네트워크(GELAN)를 YOLOv9 . 이 아키텍처는 속도 저하 없이 CSPNet이나 ELAN과 같은 다양한 계산 블록을 유연하게 통합할 수 있게 합니다. 프로그래머블 그라디언트 정보(PGI) 의 도입은 보조 감독 프레임워크를 제공합니다. PGI는 경량 모델에서 흔히 발생하는 문제인 심층 레이어를 통과하는 과정에서 중요한 특징 정보가 손실되지 않도록 보장합니다. 정확도 측면에서 매우 효과적이지만, 이 구조는 전통적인 앵커 기반 메커니즘과 비최대 억제(NMS) 같은 후처리 단계에 의존합니다.

YOLO26의 아키텍처

YOLO26은 기본적으로 NMS 필요 없는 엔드투엔드 설계를 채택합니다. 복잡한 후처리 없이 직접 객체를 예측함으로써, 특히 NMS 계산 병목 현상이 될 NMS 있는 에지 디바이스에서 YOLO26은 지연 시간을 크게 줄입니다.

YOLO26의 주요 아키텍처 변경 사항은 다음과 같습니다:

  • DFL 제거: 모델 그래프를 단순화하기 위해 분포 초점 손실(DFL)을 제거하여 ONNX TensorRT 같은 내보내기 형식을 TensorRT 만들고 저전력 칩에서 더 빠르게 처리할 수 있도록 했습니다.
  • ProgLoss + STAL: 새로운 손실 함수는 항공 이미지 분석 및 로봇 공학과 같은 작업에 필수적인 소형 물체 인식 성능을 향상시킵니다.
  • MuSGD 최적화기: SGD 과 뮤온(LLM 훈련에서 영감을 얻음)의 하이브리드로, 훈련 중 더 빠른 수렴성과 메모리 사용량 급증을 줄여줍니다.

NMS-Free가 중요한 이유

기존 객체 탐지기는 동일한 객체에 대해 여러 개의 경계 상자를 예측한 후 비최대 억제(NMS)를 통해 이를 필터링합니다. 이 단계는 순차적으로 수행되며 CPU에서 느리게 처리되는 경우가 많습니다. YOLO26의 종단 간 설계는 이 단계를 완전히 제거하여 CPU 속도를 최대 43%까지 향상시킵니다.

성능 비교

이러한 모델을 평가할 때 연구자들은 일반적으로 COCO 평균 정밀도(mAP)와 추론 속도를 함께 살펴본다.

벤치마크 지표

다음 표는 성능 상의 장단점을 보여줍니다. YOLOv9 높은 정확도를 YOLOv9 반면, YOLO26은 특히 CPU 우수한 속도 대비 정확도 비율을 달성합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

분석

  • 속도: YOLO26은 추론 속도에서 뚜렷한 우위를 보여줍니다. 예를 들어, YOLO26n은 이전 모델들보다 훨씬 빠르며, 이는 높은 FPS의 영상 처리에 이상적입니다.
  • 정확도: YOLO26은 mAP 측면에서 동등한 YOLOv9 능가하며, 특히 생산 환경에서 가장 흔히 사용되는 나노(n) 및 소형(s) 변종에서 두드러진 성능을 보입니다.
  • 계산: YOLO26은 더 높은 정확도를 달성하기 위해 지속적으로 더 적은 FLOPs(부동 소수점 연산)를 필요로 하며, 이는 보다 효율적인 아키텍처 설계를 시사합니다.

교육 및 사용성

개발자에게는 훈련과 배포의 용이성이 원시 지표만큼이나 중요하다.

에코시스템 및 지원

YOLO26을 포함한 Ultralytics 견고하고 잘 관리되는 생태계의 혜택을 받습니다. ultralytics Python 통합된 API를 제공합니다. 교육, 유효성 검사배치.

YOLOv9 강력하지만 주로 연구용 저장소입니다. 이를 생산 파이프라인에 통합하는 것은 Ultralytics 프레임워크의 "pip 설치 후 바로 사용" 환경에 비해 더 많은 수동 구성이 필요한 경우가 많습니다.

교육 효율성

YOLO26의 MuSGD 최적화기는 훈련 안정성을 높여 광범위한 하이퍼파라미터 튜닝의 필요성을 줄여줍니다. 또한 Ultralytics 트랜스포머 기반 대안들에 비해 훈련 중 메모리 소비량이 적은 것으로 알려져 있어, 사용자가 소비자용 GPU에서도 더 큰 배치 크기로 훈련할 수 있게 합니다.

Ultralytics 사용하여 YOLO26 모델을 얼마나 쉽게 훈련시킬 수 있는지 보여주는 예시입니다:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

이상적인 사용 사례

이러한 모델들 사이에서 선택하는 것은 귀하의 구체적인 제약 조건에 달려 있습니다.

9 선택해야 할 때

  • 연구 및 학술 연구: 귀하의 작업이 그라디언트 흐름 연구 또는 YOLOv9 에서 제시된 특정 벤치마크 재현을 포함하는 경우.
  • 특정 레거시 파이프라인: GELAN 아키텍처에 엄격하게 최적화된 기존 파이프라인이 있으며 모델 구조를 쉽게 교체할 수 없는 경우.

YOLO26을 선택해야 할 때

  • 엣지 컴퓨팅: 최대 43% 빠른 CPU 성능으로, YOLO26은 라즈베리 파이, 제트슨 나노 및 모바일 배포 환경에 최적의 선택입니다.
  • 실시간 애플리케이션: NMS 설계는 자율 주행 및 안전 모니터링 시스템에 필수적인 일관된 지연 시간을 보장합니다.
  • 복잡한 작업: YOLO26은 탐지 외에도 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB) 탐지 등 다양한 작업을 기본적으로 지원합니다.
  • 엔터프라이즈 생산: Ultralytics 제공하는 안정성, 지원 및 수출 용이성 덕분에 YOLO26은 상용 제품에 더 안전한 선택입니다.

탐지 그 이상

표준 YOLOv9 달리, YOLO26은 기본적으로 작업별 개선 사항을 제공합니다. 여기에는 마스크 정확도 향상을 위한 의미적 분할 손실과 더 정밀한 자세 추정 키포인트를 위한 잔차 로그 가능도 추정(RLE) 이 포함됩니다.

결론

YOLOv9 프로그래머블 그라디언트와 정보 보존에 관한 흥미로운 개념을 YOLOv9 , YOLO26은 이러한 아이디어를 실용적으로 발전시켜 즉시 생산 환경에 투입 가능한 강력한 솔루션으로 구현했습니다. 엔드투엔드 NMS 프리 아키텍처와 포괄적인 Ultralytics 생태계의 결합으로, 2026년 속도, 정확도, 사용 편의성의 균형을 추구하는 개발자들에게 권장되는 선택지입니다.

다른 현대적 아키텍처를 탐구하고자 하는 분들을 위해, 문서에서는 또한 다음을 다룹니다. YOLO11도 다루고 있습니다. 이 모델은 여전히 범용 컴퓨터 비전 작업에 매우 유능한 모델로 남아 있습니다.


댓글