콘텐츠로 건너뛰기

YOLO26 대 YOLOv9: 차세대 실시간 비전 AI의 문을 열다

컴퓨터 비전 분야가 가속화됨에 따라 개발자와 연구자들은 속도, 정확도, 배포 용이성의 완벽한 균형을 제공하는 모델을 끊임없이 모색하고 있습니다. 본 기술 분석에서는 Ultralytics 최신 통합 모델 패밀리인 YOLO26을YOLOv9를 비교합니다. 두 모델의 아키텍처, 성능 지표, 이상적인 사용 사례를 검토함으로써 머신러닝 프로젝트에 최적의 솔루션을 선택하는 데 도움을 드리고자 합니다.

경영진 요약

두 모델 모두 객체 탐지의 한계를 넓히고 있지만, YOLOv26은 생산 준비성과 생태계 통합 측면에서 상당한 도약을 이루었습니다. 이 모델은 네이티브 엔드투엔드(NMS 불필요) 아키텍처를 도입하여 배포 파이프라인을 획기적으로 간소화했으며, 특히 에지 디바이스에 최적화되어 CPU 속도가 최대 43% 빨라졌습니다. YOLOv9는 2024년 초 출시되어 훈련 안정성 향상을 위한 프로그래머블 그라디언트 정보(PGI) 같은 새로운 개념을 도입했으나, 여전히 NMS 필요한 전통적인 앵커 기반 탐지기로 남아 있습니다.

상세 모델 분석

Ultralytics YOLO26

저자: 글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)
소속:Ultralytics
날짜: 2026-01-14
링크:GitHub | 문서

YOLO26은 단순한 모델이 아닌 완전한 생태계 솔루션으로 설계되었습니다. 기존 앵커와 비최대 억제(NMS) 방식을 버리고 간소화된 종단간 아키텍처를 채택했습니다. 이러한 설계 선택은 후처리 단계에 숨겨진 지연 시간을 제거하여 자율주행차 및 로봇공학과 같은 실시간 애플리케이션에 이상적입니다.

주요 아키텍처 혁신에는 분산 초점 손실(DFL) 제거가 포함되며, 이는 다음과 같은 형식으로의 내보내기를 단순화합니다. TensorRT 및 CoreML 내보내기를 단순화합니다. MuSGD 최적화기는 SGD Muon(Moonshot AI의 Kimi K2에서 영감을 얻음)의 하이브리드로, 대규모 언어 모델 훈련 혁신을 비전 영역으로 가져와 훈련 안정성을 향상시킵니다. 또한 ProgLoss 및 STAL (Soft-Target Anchor Loss)의 도입은 항공 이미지와 IoT 장치에 필수적인 기능인 소형 물체 감지 성능을 크게 개선합니다.

YOLO26에 대해 더 알아보기

9

저자: 왕젠야오(Chien-Yao Wang) 및 리아오홍위안(Hong-Yuan Mark Liao)
소속기관: 대만 중앙연구원 정보과학연구원
날짜: 2024-02-21
링크:Arxiv | GitHub | Docs

YOLOv9 딥러닝 이론에 YOLOv9 , 특히 딥 네트워크의 "정보 병목 현상" 문제를 해결합니다. 핵심 기여는 입력 데이터 정보가 딥 레이어를 통과할 때 이를 보존하는 데 도움을 주는 프로그래머블 그라디언트 정보(PGI)와 일반화된 효율적 레이어 집계 네트워크(GELAN)입니다. 이러한 특징 YOLOv9 인상적인 매개변수 효율성을 YOLOv9 . 그러나 전통적인 앵커 기반 모델로서 여전히 NMS 에 의존하여 최종 예측을 수행하므로, 엔드투엔드 솔루션에 비해 제한된 하드웨어 환경에서의 배포가 복잡해질 수 있습니다.

성능 지표 비교

다음 표는 COCO 데이터셋에서의 성능 차이를 보여줍니다. YOLO26은 경쟁력 있는 또는 우수한 정확도를 유지하면서도, 특히 CPU 측면에서 뛰어난 효율성을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

주요 기술적 차이점

1. 아키텍처 및 추론 흐름

YOLO26의 NMS 설계는 패러다임 전환입니다. 모델이 기본적으로 일대일 예측을 생성하도록 훈련함으로써 추론 파이프라인은 단순한 전방 전달(forward pass)이 됩니다. 이는 FPGA나 NPU 같은 엣지 AI 장치에서 최적화하기 어려운 경험적 NMS 제거합니다. 반면 YOLOv9 기존의 예측 후 억제(predict-then-suppress) 방식을 YOLOv9 IoU 세심하게 조정해야 하며, 추론 과정에서 계산 오버헤드를 추가합니다.

2. 훈련 안정성과 수렴성

YOLO26의 MuSGD 최적화기는 훈련 역학에 대한 현대적 접근법을 구현합니다. SGD Muon) SGD 결합함으로써 YOLO26은 이전 세대보다 더 빠르게 안정적인 수렴을 달성합니다. 이는 하이퍼파라미터 조정이 자원을 많이 소모할 수 있는 맞춤형 데이터셋에서 훈련할 때 특히 유용합니다. YOLOv9 이론적으로 견고하지만 훈련 그래프의 복잡성과 역전파 단계에서의 메모리 사용량을 증가시킬 수 있는 PGI를 감독 보조에 YOLOv9 .

3. 에지 및 CPU

YOLO26의 두드러진 특징 중 하나는 최대 43% 더 빠른 CPU 성능입니다. 이는 라즈베리 파이(Raspberry Pi)나 기본 클라우드 인스턴스처럼 강력한 GPU가 없는 기기를 위해 아키텍처를 특별히 최적화함으로써 달성되었습니다. DFL(분포 초점 손실) 제거로 탐지 헤드당 필요한 수학적 연산이 더욱 감소했습니다. YOLOv9 GELAN을 통해 매개변수 효율성을 확보했으나, 이러한 CPU 중심의 특정 최적화 기능은 포함하지 않아 YOLO26이 엣지 디바이스 배포에 있어 확실한 승자로 자리매김했습니다.

Ultralytics 통한 간소화된 수출

YOLO26 모델은 단일 OpenVINO ONNX, TensorRT, OpenVINO 등의 형식으로 내보낼 수 있으며, NMS 프리 구조를 자동으로 처리하여 원활한 통합을 지원합니다.

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.export(format="onnx")  # Exports directly without NMS plugins

에코시스템 및 사용 편의성

에 지정되어 있습니다. Ultralytics 중요한 차별화 요소입니다. YOLO26은 완전히 통합되어 있습니다. ultralytics Python , 훈련, 검증 및 배포를 위한 표준화된 API를 제공합니다.

  • 단순함: 개발자는 다음과 같은 작업 간 전환이 가능합니다: 포즈 추정 또는 지향 객체 탐지(OBB) 모델 웨이트 파일을 변경하기만 하면 됩니다(예 yolo26n-pose.pt 또는 yolo26n-obb.ptYOLOv9 주로 객체 탐지 모델 YOLOv9 , 이러한 특수 작업에 대한 기본 지원은 상대적으로 부족합니다.
  • 지원: Ultralytics 포괄적인 문서, 활발한 커뮤니티 포럼 및 기업용 지원 옵션을 Ultralytics . 이를 통해 개발자가 구현 세부사항으로 인해 막히는 일이 없도록 보장합니다.
  • 다용도성: 탐지 기능을 넘어, YOLO26은 자세 추정용 잔차 로그 가능도 추정(RLE) 및 OBB 전용 각도 손실과 같은 작업별 개선 사항을 제공하여 다양한 응용 분야에서 높은 정확도를 보장합니다.

사용 사례 권장 사항

다음과 같은 경우 YOLO26을 선택하십시오:

  • 동급 최속의 CPU 필요하거나 에지 디바이스(라즈베리 파이, 제트슨 나노, 모바일)에 배포하는 경우입니다.
  • 파이프라인은 NMS 출력으로 인해 후처리 로직이 간소화됩니다.
  • 단일 통합 프레임워크 내에서 세분화, 자세 추정 또는 분류에 대한 지원이 필요합니다.
  • 귀사는 데이터셋 분석을 위한 Ultralytics 같은 도구를 통해 잘 문서화되고 활발한 생태계를 최우선으로 합니다.
  • 작은 물체 탐지 작업에서 ProgLoss + STAL이 측정 가능한 우위를 제공합니다.

YOLOv9를 선택해야 하는 경우:

  • 귀하는 프로그래머블 그라디언트 정보 또는 보조 감독 기법에 대한 학술 연구를 수행하고 있습니다.
  • 기존 인프라가 앵커 기반 후처리 파이프라인과 긴밀하게 결합되어 있어 이관하기 어렵습니다.

결론

YOLOv9 2024년에 중요한 이론적 발전을 YOLOv9 반면, YOLO26은 이러한 개념들을 2026년 이후를 위한 강력하고 즉시 활용 가능한 도구로 정교화했습니다. 엔드투엔드 설계, 상당한 CPU , 다양한 비전 작업에 대한 강력한 지원으로 YOLO26은 실제 AI 애플리케이션을 위한 더 다재다능하고 미래에도 대비할 수 있는 솔루션을 제공합니다. 스마트 시티 인프라 구축, 농업 모니터링 시스템, 첨단 로봇 공학 등 어떤 분야를 개발하든 YOLO26은 성공에 필요한 성능과 신뢰성을 제공합니다.

기존의 최첨단 모델을 탐구하고자 하는 분들을 위해, YOLO11YOLOv8 문서는 YOLO 진화에 대한 추가적인 맥락을 제공합니다.


댓글