YOLO26 대 YOLOv9: 실시간 객체 탐지의 차세대 진화
컴퓨터 비전 분야는 끊임없이 발전하고 있으며, 새로운 아키텍처들이 지속적으로 속도와 정확성의 한계를 뛰어넘고 있습니다. 이 기술 비교에서는 실시간 객체 탐지 분야에서 매우 영향력 있는 두 모델인 YOLO26과 YOLOv9의 차이점을 살펴봅니다. 두 모델 모두 독자적인 아키텍처 혁신을 제공하지만, 차기 비전 프로젝트에 적합한 도구를 선택하려면 성능상의 절충점, 배포 기능 및 하드웨어 요구 사항을 이해하는 것이 중요합니다.
YOLO26: 엣지 최적화 파워하우스
2026년 초에 출시된 Ultralytics YOLO26은 배포 효율성과 모델 학습 안정성 측면에서 세대적인 도약을 의미합니다. 네이티브 엔드 투 엔드(end-to-end) 프레임워크로 설계되어, 과거 엣지 AI 애플리케이션의 발목을 잡았던 배포 병목 현상을 직접적으로 해결합니다.
모델 세부 정보:
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2026-01-14
- GitHub: Ultralytics 저장소
- 문서: YOLO26 문서
아키텍처 및 혁신
YOLO26은 엔드 투 엔드 NMS-Free 설계를 도입하여 후처리 파이프라인을 근본적으로 재설계했습니다. 비최대 억제(NMS) 과정을 제거함으로써 모델의 지연 시간 변동성을 획기적으로 낮췄습니다. 이는 특히 ONNX나 Apple CoreML과 같은 프레임워크로 내보낼 때 모바일 및 엣지 플랫폼으로의 배포를 훨씬 더 수월하게 만듭니다.
또한, 분포 초점 손실(DFL)을 제거함으로써 내보내기 프로세스가 간소화되고 저전력 마이크로컨트롤러와의 호환성이 향상되었습니다. 학습 안정성을 높이기 위해 YOLO26은 대규모 언어 모델 학습의 혁신에서 영감을 받은 Stochastic Gradient Descent(SGD)와 Muon의 하이브리드인 MuSGD 옵티마이저를 통합했습니다. 이를 통해 더 빠른 수렴과 복잡한 데이터셋 전반에 걸쳐 더욱 강력한 특징 추출이 가능해졌습니다.
아키텍처 간소화와 DFL 제거 덕분에 YOLO26은 최대 43% 더 빠른 CPU 추론을 달성했으며, 이는 Raspberry Pi나 NVIDIA Jetson Nano와 같이 자원이 제한된 엣지 장치에 이상적인 선택입니다.
드론 항공 이미지와 같이 매우 까다로운 환경에서 객체를 탐지하기 위해 YOLO26은 업데이트된 ProgLoss + STAL 손실 함수를 사용합니다. 이는 작은 객체 인식 재현율에서 현저한 향상을 제공합니다. 또한 인스턴스 분할을 위한 다중 스케일 프로토, 자세 추정을 위한 잔차 로그 우도 추정(RLE), 그리고 지향성 경계 상자(OBB) 탐지를 위한 특수 각도 손실 등 작업별 향상 기능을 자랑합니다.
YOLOv9: 프로그래밍 가능한 그래디언트 정보
2024년 초에 소개된 YOLOv9은 신경망이 학습 단계에서 그래디언트 흐름을 처리하는 방식에 이론적 발전을 가져왔으며, 파라미터 효율성과 심층 특징 유지에 중점을 두었습니다.
모델 세부 정보:
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직: 대만 아카데미아 시니카 정보과학연구소
- 날짜: 2024-02-21
- Arxiv: YOLOv9 논문
- GitHub: YOLOv9 저장소
- 문서: YOLOv9 문서
아키텍처 및 강점
YOLOv9은 프로그래밍 가능한 그래디언트 정보(PGI)와 일반화된 효율적 계층 집계 네트워크(GELAN) 개념을 중심으로 구축되었습니다. 이 개념들은 심층 신경망에서 흔히 발생하는 정보 병목 현상을 해결합니다. GELAN은 피드포워드 프로세스를 통해 핵심 정보를 보존함으로써 가중치 업데이트에 사용되는 그래디언트가 신뢰성을 유지하도록 보장합니다. 이 아키텍처는 높은 정확도를 제공하며, PyTorch 프레임워크를 사용하는 신경망 이론 및 그래디언트 경로 최적화에 관한 학술 연구에 적합한 강력한 모델입니다.
제한 사항
뛰어난 파라미터 효율성에도 불구하고, YOLOv9은 경계 상자 후처리를 위해 전통적인 NMS에 크게 의존하며, 이는 엣지 장치에서의 추론 시 계산 병목 현상을 일으킬 수 있습니다. 또한 공식 저장소는 주로 객체 탐지에 중점을 두고 있어 추적이나 자세 추정과 같은 특수 작업을 위해 적용하려면 상당한 맞춤형 엔지니어링이 필요합니다.
성능 비교
When evaluating these models for real-world deployment, balancing accuracy (mAP), inference speed, and memory usage is critical. Ultralytics models are renowned for their low memory requirements during both training and inference, requiring far less CUDA memory than transformer-based alternatives like RT-DETR.
아래는 COCO 데이터셋에서의 YOLO26과 YOLOv9 성능 직접 비교입니다. 각 열의 최고값은 굵게 표시되었습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
참고: YOLOv9의 CPU 속도는 NMS 구성에 따라 크게 달라지며 일반적으로 YOLO26의 네이티브 NMS-free 구현보다 느리기 때문에 생략되었습니다.
사용 사례 및 권장 사항
YOLO26과 YOLOv9 중 무엇을 선택할지는 특정 프로젝트 요구 사항, 배포 제약 조건 및 에코시스템 선호도에 따라 달라집니다.
YOLO26을 선택해야 하는 경우
YOLO26은 다음과 같은 경우 강력한 선택지입니다:
- NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.
YOLOv9을 선택해야 할 때
YOLOv9은 다음의 경우에 권장됩니다:
- 정보 병목 현상 연구: 프로그래밍 가능한 그래디언트 정보(PGI) 및 일반화된 효율적 계층 집계 네트워크(GELAN) 아키텍처를 연구하는 학술 프로젝트.
- 그래디언트 흐름 최적화 연구: 학습 중 심층 네트워크 계층에서의 정보 손실을 이해하고 완화하는 데 중점을 둔 연구.
- 고정확도 탐지 벤치마킹: 아키텍처 비교를 위한 참조 지점으로 YOLOv9의 강력한 COCO 벤치마크 성능이 필요한 시나리오.
Ultralytics의 강점
모델을 선택하는 것은 단순히 정확도 벤치마크를 읽는 것 이상입니다. 주변 소프트웨어 에코시스템이 데이터 수집에서 생산까지 얼마나 빠르게 도달할 수 있는지를 결정합니다.
사용 편의성 및 에코시스템
Ultralytics Python API는 원활한 "zero-to-hero" 경험을 제공합니다. 개발자는 복잡한 저장소를 복제하거나 분산 학습 스크립트를 수동으로 구성할 필요 없이 pip을 통해 패키지를 설치하고 즉시 학습을 시작할 수 있습니다. 활발하게 유지 관리되는 Ultralytics 에코시스템은 잦은 업데이트, Weights & Biases와 같은 ML 플랫폼과의 자동 통합 및 광범위한 문서를 보장합니다.
비전 작업 전반의 다재다능함
YOLOv9이 주로 탐지 엔진인 반면, YOLO26은 범용 비전 도구입니다. 단일화된 구문을 사용하여 객체 탐지에서 픽셀 단위의 이미지 분할 또는 전체 이미지 분류로 쉽게 전환할 수 있습니다. 이러한 다재다능함은 서로 다른 컴퓨터 비전 기능을 위해 여러 개의 분리된 코드베이스를 유지 관리하는 기술적 부채를 줄여줍니다.
효율적인 학습 및 배포
학습 효율성은 Ultralytics 철학의 초석입니다. YOLO26은 즉시 사용 가능한 사전 학습된 가중치를 활용하며 대규모 비전 트랜스포머에 비해 훨씬 낮은 메모리 사용량을 자랑합니다. 학습이 완료되면 내장된 내보내기 파이프라인을 통해 TensorRT나 TensorFlow Lite와 같은 최적화된 형식으로 원클릭 변환이 가능하여 생산 경로를 원활하게 합니다.
코드 예시: YOLO26 시작하기
YOLO26 구현은 매우 간단합니다. 다음 Python 스니펫은 사전 학습된 모델을 로드하고, 사용자 지정 데이터로 학습시키며, Ultralytics API를 사용하여 추론을 실행하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()YOLO26의 속도, 단순화된 아키텍처 및 강력한 에코시스템을 활용함으로써 팀은 이전보다 더 빠르고 적은 기술적 장애물로 고급 비전 AI 애플리케이션을 시장에 출시할 수 있습니다.