YOLO26 대 YOLOv9: 실시간 객체 탐지의 차세대 진화
객체 탐지 아키텍처의 진화는 속도, 정확도, 효율성에 대한 끊임없는 추구가 특징입니다. YOLO26과 YOLOv9 을 비교해 보면 이러한 급속한 진전을 확인할 수 있습니다. YOLOv9 프로그래밍 가능한 기울기를 통해 정보 보존의 한계를 YOLOv9 , 최신 YOLO26은 특히 에지 성능과 대규모 CPU 위해 최적화된 엔드투엔드 방식의 NMS(Neighborhood Multiplication Step)가 필요 없는 아키텍처로 새로운 지평을 열었습니다.
모델 개요
YOLO26
YOLO26은 2026년 초 시점의 최신 비전 AI 기술을 대표합니다. Ultralytics에서 개발한 이 모델은 비최대 억제(NMS)가 필요 없는 네이티브 엔드투엔드 설계를 도입하여 배포 파이프라인을 간소화합니다. 분포 초점 손실(DFL)을 제거하고 LLM 훈련에서 영감을 받은 SGD Muon)의 하이브리드인 새로운 MuSGD 최적화기를통합함으로써, YOLO26은 최상위 정확도를 유지하면서 CPU 속도를 최대 43%까지 향상시킵니다.
- 저자: Glenn Jocher, Jing Qiu
- 조직:Ultralytics
- 날짜: 2026년 1월 14일
- 주요 기능: NMS 종단 간 탐지, MuSGD 최적화기, ProgLoss + STAL
- GitHub:Ultralytics 리포지토리
9
2024년 초 출시된 YOLOv9 프로그래머블 그라디언트 정보(PGI) 개념과 GELAN 아키텍처를 도입했습니다. 이러한 혁신은 딥 네트워크의 '정보 병목 현상' 문제를 해결하여 전방 전달 과정에서 중요한 데이터가 손실되지 않도록 했습니다. 특히 높은 매개변수 효율성이 요구되는 연구 응용 분야에 여전히 강력한 모델로 활용되고 있습니다.
- 저자: Chien-Yao Wang, Hong-Yuan Mark Liao
- 조직: 정보 과학 연구소, 아카데미아 시니카
- 날짜: 2024년 2월 21일
- 주요 기능: 프로그래머블 그라디언트 정보(PGI), GELAN 아키텍처
- Arxiv:YOLOv9
- GitHub:9 저장소
기술 아키텍처 비교
이 두 모델 간의 구조적 차이는 이론적 정보 흐름 최적화에서 실용적 배포 효율성으로의 전환을 의미한다.
YOLO26: 효율성과 에지-퍼스트 설계
YOLO26은 후처리 및 손실 계산의 계산 오버헤드 감소에 중점을 둡니다.
- 엔드투엔드 NMS: 중복 바운딩 박스를 출력하여 NMS 필요한 기존 탐지기와 달리, YOLO26은 정확한 객체 집합을 직접 예측합니다. 이로 인해 지연 시간 편차가 감소하고 ONNX TensorRT 같은 형식으로의 내보내기가 간소화됩니다. 복잡한 맞춤형 NMS 더 이상 필요하지 않기 때문입니다.
- ProgLoss + STAL: 프로그레시브 손실(Progressive Loss)과 소프트 타겟 앵커 라벨링(Soft-Target Anchor Labeling)의 도입은 드론 영상 및 로봇 검사에 필수적인 소형 물체 탐지 성능을 크게 향상시킵니다.
- MuSGD 최적화기: 대규모 언어 모델 훈련에서 얻은 혁신을 컴퓨터 비전 분야에 적용한 이 하이브리드 최적화기는 훈련 모멘텀을 안정화시켜, 하이퍼파라미터 조정을 최소화하면서도 더 빠른 수렴을 가능하게 합니다.
YOLOv9: 정보 보존
YOLOv9 아키텍처는 딥 네트워크에서 발생하는 정보 소실 문제를 해결하기 위해 설계되었습니다.
- PGI(Programmable Gradient Information): 보조 감독 분기가 네트워크 가중치 업데이트를 위한 신뢰할 수 있는 기울기를 생성하여 심층 레이어가 의미 정보를 유지하도록 보장합니다.
- GELAN(일반화된 효율적 레이어 집계 네트워크): 이 백본은 매개변수 활용도를 최적화하여 YOLOv9 일부 선행 모델보다 적은 매개변수로 높은 정확도를 YOLOv9 있게 하지만, 간소화된 YOLO26에 비해 종종 더 높은 계산 복잡도(FLOPs)를 대가로 한다.
배포 간편성
NMS 제거는 에지 배포에 있어 판도를 바꾸는 변화입니다. YOLOv9 같은 구형 모델에서는 모델이 GPU CPU NMS CPU 실행되어 병목 현상을 일으켰습니다. YOLO26의 출력은 즉시 사용 가능하여 라즈베리 파이 및 모바일 기기에서 훨씬 더 빠른 성능을 발휘합니다.
성능 지표
다음 표는 표준 벤치마크에서 모델들을 비교한 것입니다. YOLO26이 CPU 보여주는 상당한 속도 우위는 아키텍처 최적화의 직접적인 결과임을 주목하십시오.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Ultralytics 장점
YOLOv9 강력한 이론적 기반을 YOLOv9 , Ultralytics 내에서 YOLO26을 사용하면 개발자와 기업에게 뚜렷한 이점을 제공합니다.
타의 추종을 불허하는 사용 편의성
Ultralytics Python 복잡한 훈련 워크플로를 몇 줄의 코드로 변환합니다. 이 "초보자도 전문가처럼" 경험은 다른 많은 저장소의 연구 중심 설정과 대조를 이룹니다.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
작업 전반에 걸친 다양한 활용성
YOLOv9 주로 탐지에 초점을 맞춘 것과 달리, Ultralytics YOLO26은 더 광범위한 컴퓨터 비전 작업을 기본적으로 지원합니다. 이를 통해 단일 통합 API로 다음을 수행할 수 있습니다:
- 인스턴스 분할: 정밀한 픽셀 단위 객체 마스킹.
- 자세 추정: 인간 활동 분석을 위한 키포인트 탐지.
- OBB(방향성 경계 상자): 위성 영상에서 선박과 같은 회전된 물체를 탐지하는 기술.
- 분류: 전체 이미지 분류.
훈련 및 기억 효율성
Ultralytics 자원 효율성을 고려하여 설계되었습니다. YOLO26은 일반적으로 트랜스포머 기반 대안 모델에 비해 훈련 중 GPU (VRAM) 사용량이 적습니다. 이러한 효율성 덕분에 다음과 같은 이점이 있습니다:
- 소비자용 하드웨어에서 더 큰 배치 크기.
- 클라우드 컴퓨팅 비용을 낮추십시오.
- 즉시 사용 가능한 사전 훈련된 가중치를 통한 더 빠른 실험 주기.
실제 응용 분야
적합한 모델 선택은 특정 배포 제약 조건에 따라 달라집니다.
엣지 컴퓨팅과 사물인터넷
YOLO26은 엣지 디바이스 분야에서 확실한 챔피언입니다. 43% 더 빠른 CPU 성능 덕분에 라즈베리 파이나 NVIDIA Nano 같은 디바이스에서도 무거운 양자화 없이 실시간 모니터링이 가능합니다. 예를 들어, 로컬 하드웨어에서 실행되는 스마트 주차 시스템은 NMS 설계 덕분에 지연 시간 급증을 줄여 큰 이점을 얻습니다.
고고도 점검
드론을 활용한 농업 모니터링이나 인프라 점검에 있어 YOLO26은 ProgLoss + STAL 기능 덕분에 탁월한 성능을 발휘합니다. 이 기능들은 소형 물체와 까다로운 종횡비 처리에 이전 세대보다 특화되어 있어, 파이프라인의 균열이나 작물의 해충을 더 높은 재현율로 탐지할 수 있도록 보장합니다.
학술 연구
YOLOv9 학술 연구, 특히 기울기 흐름과 네트워크 아키텍처 이론에 초점을 맞춘 연구에서 여전히 강력한 후보로 남아 있습니다. 그 PGI 개념은 신경망이 정보의 깊이를 어떻게 유지하는지 탐구하는 흥미로운 길을 제공합니다.
결론
두 아키텍처 모두 컴퓨터 비전 분야에서 중요한 이정표를 세웠습니다. YOLOv9 딥 네트워크에서 기울기 정보의 중요성을 YOLOv9 . 그러나 YOLO26은 이러한 교훈을 생산 환경에 바로 적용 가능한 강력한 솔루션으로 구현했습니다. 엔드투엔드 NMS 설계, 우수한 CPU , Ultralytics 원활한 통합을 통해 YOLO26은 현대 AI 애플리케이션에 최적의 속도, 정확도, 사용 편의성 균형을 제공합니다.
최첨단을 유지하고자 하는 개발자분들께서는 최적화기 안정성과 에지 성능의 최신 발전을 활용하기 위해 YOLO26으로 마이그레이션할 것을 권장합니다.
추가 자료
Ultralytics 다른 고성능 모델에 관심이 있으시다면 YOLO11 를 일반적인 작업용으로, 또는 RT-DETR 트랜스포머 기반 실시간 탐지를 위한 모델을 확인해 보세요.