Link to this sectionYOLO26 대 YOLOv9#
컴퓨터 비전 분야는 급격히 발전하고 있으며, 새로운 아키텍처가 끊임없이 속도와 정확도의 한계를 뛰어넘고 있습니다. 이 기술 비교에서는 실시간 객체 탐지 분야에서 매우 영향력 있는 두 모델인 YOLO26과 YOLOv9의 차이점을 살펴봅니다. 두 모델 모두 독특한 아키텍처 혁신을 제공하지만, 차기 비전 프로젝트에 적합한 도구를 선택하려면 성능 트레이드오프, 배포 역량 및 하드웨어 요구 사항을 이해하는 것이 중요합니다.
Link to this sectionYOLO26: 엣지 최적화된 강력한 모델#
2026년 초에 출시된 Ultralytics YOLO26은 배포 효율성과 모델 학습 안정성 측면에서 세대적 도약을 보여줍니다. 네이티브 엔드 투 엔드(end-to-end) 프레임워크로 설계되었으며, 역사적으로 엣지 AI 애플리케이션을 괴롭혔던 배포 병목 현상을 직접적으로 해결합니다.
모델 세부 정보:
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2026-01-14
- GitHub: Ultralytics 리포지토리
- 문서: YOLO26 Documentation
Link to this section아키텍처 및 혁신#
YOLO26은 End-to-End NMS-Free Design을 도입하여 후처리 파이프라인을 근본적으로 재설계했습니다. NMS(Non-Maximum Suppression)의 필요성을 제거함으로써, 모델은 지연 시간 변동성을 획기적으로 낮췄습니다. 이를 통해 모바일 및 엣지 플랫폼에 대한 배포가 훨씬 쉬워졌으며, 특히 ONNX 및 Apple CoreML과 같은 프레임워크로 내보낼 때 더욱 그렇습니다.
또한 DFL(Distribution Focal Loss)을 제거하여 내보내기 프로세스를 간소화하고 저전력 마이크로컨트롤러와의 호환성을 높였습니다. 학습 안정성을 향상하기 위해 YOLO26은 SGD(Stochastic Gradient Descent)와 Muon(거대 언어 모델 학습 혁신에서 영감을 얻음)을 결합한 새로운 MuSGD Optimizer를 통합했습니다. 그 결과 더 빠른 수렴 속도를 얻고 복잡한 데이터셋 전반에서 더 강력한 특징 추출이 가능해졌습니다.
아키텍처 간소화 및 DFL 제거 덕분에 YOLO26은 최대 43% 더 빠른 CPU 추론을 달성하여, Raspberry Pi나 NVIDIA Jetson Nano와 같이 자원이 제한된 엣지 디바이스에 이상적인 선택지가 되었습니다.
드론 항공 이미지와 같은 장면에서 매우 까다로운 항목을 탐지하기 위해 YOLO26은 업데이트된 ProgLoss + STAL 손실 함수를 사용합니다. 이는 소형 객체 인식 재현율(recall)을 크게 향상시킵니다. 또한 인스턴스 세그멘테이션을 위한 멀티 스케일 proto, 포즈 추정을 위한 RLE(Residual Log-Likelihood Estimation), 지향성 경계 상자(OBB) 탐지를 위한 특수 각도 손실 등 작업별 개선 사항을 자랑합니다.
Link to this sectionYOLOv9: 프로그래밍 가능한 그래디언트 정보#
2024년 초에 소개된 YOLOv9는 학습 단계에서 신경망이 그래디언트 흐름을 처리하는 방식에 대한 이론적 발전을 가져왔으며, 파라미터 효율성과 딥 피처 유지에 중점을 두었습니다.
모델 세부 정보:
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직: 대만 중앙연구원 정보과학연구소
- 날짜: 2024-02-21
- Arxiv: YOLOv9 논문
- GitHub: YOLOv9 저장소
- 문서: YOLOv9 문서
Link to this section아키텍처 및 강점#
YOLOv9는 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network) 개념을 중심으로 구축되었습니다. 이러한 개념은 딥 뉴럴 네트워크에서 흔히 발생하는 정보 병목 현상 문제를 해결합니다. 피드 포워드(feed-forward) 프로세스를 통해 필수 정보를 보존함으로써, GELAN은 가중치 업데이트에 사용되는 그래디언트가 안정적으로 유지되도록 보장합니다. 이 아키텍처는 높은 정확도를 제공하며, YOLOv9를 PyTorch 프레임워크를 사용한 신경망 이론 및 그래디언트 경로 최적화에 대한 학술 연구의 강력한 후보로 만듭니다.
Link to this section한계점#
뛰어난 파라미터 효율성에도 불구하고 YOLOv9는 바운딩 박스 후처리를 위해 전통적인 NMS에 크게 의존하며, 이는 엣지 디바이스에서 추론할 때 계산상의 병목 현상을 유발할 수 있습니다. 또한 공식 저장소는 주로 객체 탐지에 집중되어 있어 추적이나 포즈 추정과 같은 특수 작업에 맞게 조정하려면 상당한 커스텀 엔지니어링이 필요합니다.
Link to this section성능 비교#
When evaluating these models for real-world deployment, balancing accuracy (mAP), inference speed, and memory usage is critical. Ultralytics models are renowned for their low memory requirements during both training and inference, requiring far less CUDA memory than transformer-based alternatives like RT-DETR.
아래는 COCO 데이터셋에서의 YOLO26과 YOLOv9 성능 직접 비교입니다. 각 열의 최고 값은 굵게 표시되었습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
참고: YOLOv9의 CPU 속도는 NMS 구성에 따라 크게 달라지며 일반적으로 YOLO26의 네이티브 NMS-free 구현보다 느리기 때문에 생략되었습니다.
Link to this section활용 사례 및 권장 사항#
YOLO26과 YOLOv9 중 선택하는 것은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
Link to this sectionYOLO26을 선택해야 할 때#
YOLO26은 다음에 적합한 강력한 선택입니다:
- NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.
Link to this sectionYOLOv9를 선택해야 할 때#
YOLOv9는 다음에 권장됩니다:
- 정보 병목 현상 연구: PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 연구하는 학술 프로젝트.
- 그래디언트 흐름 최적화 연구: 학습 중 심층 네트워크 계층에서의 정보 손실을 이해하고 완화하는 데 중점을 둔 연구.
- 고정밀 탐지 벤치마킹: YOLOv9의 강력한 COCO 벤치마크 성능을 아키텍처 비교를 위한 참조 지점으로 활용해야 하는 시나리오.
Link to this sectionUltralytics의 장점#
모델 선택에는 정확도 벤치마크를 읽는 것 이상의 과정이 포함됩니다. 주변 소프트웨어 생태계가 데이터 수집부터 프로덕션 단계까지 얼마나 빨리 도달할 수 있는지를 결정합니다.
Link to this section사용 편의성 및 생태계#
Ultralytics Python API는 원활한 "zero-to-hero" 경험을 제공합니다. 복잡한 저장소를 복제하거나 분산 학습 스크립트를 수동으로 구성하는 대신, 개발자는 pip를 통해 패키지를 설치하고 즉시 학습을 시작할 수 있습니다. 활발하게 유지 관리되는 Ultralytics 생태계는 빈번한 업데이트, Weights & Biases와 같은 ML 플랫폼과의 자동 통합, 광범위한 문서를 보장합니다.
Link to this section비전 작업 전반의 다재다능함#
YOLOv9는 주로 탐지 엔진이지만, YOLO26은 범용 비전 도구입니다. 단일 통합 구문을 사용하여 객체 탐지에서 픽셀 단위의 이미지 세그멘테이션 또는 전체 이미지 분류로 쉽게 전환할 수 있습니다. 이러한 다재다능함은 서로 다른 컴퓨터 비전 기능을 위해 여러 개의 분리된 코드 베이스를 유지해야 하는 기술적 부채를 줄여줍니다.
Link to this section효율적인 학습 및 배포#
학습 효율성은 Ultralytics 철학의 핵심입니다. YOLO26은 쉽게 구할 수 있는 사전 학습된 가중치를 활용하며 대규모 비전 트랜스포머에 비해 현저히 낮은 메모리 사용량을 자랑합니다. 학습이 완료되면 내장된 내보내기 파이프라인을 통해 TensorRT나 TensorFlow Lite와 같은 최적화된 형식으로 원클릭 변환이 가능하여 프로덕션으로 가는 길을 원활하게 만듭니다.
Link to this section코드 예시: YOLO26 시작하기#
YOLO26 구현은 매우 간단합니다. 다음 Python 코드 조각은 사전 학습된 모델을 로드하고, 커스텀 데이터로 학습하며, Ultralytics API를 사용하여 추론을 실행하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()YOLO26의 속도, 간소화된 아키텍처 및 강력한 생태계를 활용함으로써 팀은 그 어느 때보다 빠르게, 그리고 기술적 장애물을 줄이면서 고급 비전 AI 애플리케이션을 시장에 출시할 수 있습니다.