YOLOv9 vs. YOLO26: 현대 객체 탐지에 대한 기술적 심층 분석

실시간 객체 탐지 환경은 지난 몇 년간 크게 발전했습니다. 머신 러닝 실무자가 다양한 하드웨어 전반에 모델을 배포하고자 할 때, 올바른 아키텍처를 선택하는 것은 매우 중요합니다. 본 포괄적인 기술 가이드에서는 컴퓨터 비전 분야의 두 가지 주요 이정표를 비교합니다. 그래디언트 경로 최적화에 초점을 맞춰 2024년 초에 소개된 YOLOv9와, 2026년 초에 출시되어 엣지 추론 및 학습 안정성을 완전히 재정의한 최신 SOTA 프레임워크인 **Ultralytics YOLO26**을 비교합니다.

요약: 모델 계보 및 저자 정보

이러한 딥러닝 모델의 기원을 이해하면 아키텍처 설계 선택 및 타겟 대상과 관련된 유용한 맥락을 파악할 수 있습니다.

YOLOv9

대만 Academia Sinica 정보과학연구소의 Chien-Yao Wang과 Hong-Yuan Mark Liao가 저술한 YOLOv9는 2024년 2월 21일에 발표되었습니다. 이 모델은 이론적인 딥러닝 개념, 특히 심층 합성곱 신경망(CNN)의 정보 병목 현상 문제를 해결하는 데 집중합니다.

YOLOv9에 대해 더 알아보기

Ultralytics YOLO26

Ultralytics의 Glenn Jocher와 Jing Qiu가 저술한 YOLO26은 2026년 1월 14일에 발표되었습니다. YOLO11YOLOv8과 같은 이전 모델들의 거대한 성공을 기반으로 하는 YOLO26은 프로덕션 준비성, 엣지 배포 및 기본 end-to-end 효율성을 우선시하도록 처음부터 새로 설계되었습니다.

YOLO26에 대해 더 알아보기

지금 바로 YOLO26 사용해 보기

컴퓨터 비전 파이프라인을 업그레이드할 준비가 되셨습니까? Ultralytics Platform을 사용하면 코드를 한 줄도 작성하지 않고도 클라우드에서 YOLO26 모델을 쉽게 학습시키고 배포할 수 있습니다.

아키텍처 혁신

두 모델 모두 신경망이 시각 데이터를 처리하는 방식에 획기적인 변화를 도입했지만, 문제를 해결하는 접근 방식은 서로 다릅니다.

YOLOv9의 프로그래밍 가능한 그래디언트 정보(PGI)

YOLOv9가 해당 분야에 기여한 핵심 요소는 **PGI(Programmable Gradient Information)**와 **GELAN(Generalized Efficient Layer Aggregation Network)**의 도입입니다. 신경망이 깊어질수록 피드-포워드 과정에서 정보 손실이 발생하는 경우가 많습니다. PGI는 역전파 과정에서 가중치를 업데이트하는 데 사용되는 그래디언트가 정확하고 신뢰할 수 있도록 보장하며, 이를 통해 GELAN 아키텍처가 더 적은 파라미터로도 높은 정확도를 달성할 수 있게 합니다.

그러나 YOLOv9는 후처리를 위해 기존의 NMS(Non-Maximum Suppression)에 크게 의존하며, 이는 실제 추론 시 지연 시간의 병목 현상이 될 수 있습니다.

YOLO26의 엣지 우선 아키텍처

YOLO26은 학습부터 실시간 배포까지 전체 파이프라인을 최적화함으로써 완전히 다른 접근 방식을 취합니다. 이 모델은 YOLOv10에서 처음 도입된 End-to-End NMS-Free 설계를 기반으로 하며, NMS 후처리의 필요성을 완전히 제거했습니다. 그 결과 지연 시간이 매우 짧아져 Raspberry PiNVIDIA Jetson과 같은 엣지 장치에 최적화되었습니다.

또한 YOLO26은 DFL(Distribution Focal Loss)을 완전히 제거했습니다. 이러한 구조적 변경은 모델의 ONNX 내보내기를 단순화하며 저전력 마이크로컨트롤러와의 호환성을 크게 향상시킵니다.

학습 단계의 경우, YOLO26은 Stochastic Gradient Descent와 Muon(Moonshot AI의 Kimi K2 LLM 학습 방법론에서 영감을 받음)을 결합한 새로운 MuSGD Optimizer를 통합합니다. 이는 거대 언어 모델(LLM) 학습 혁신과 컴퓨터 비전 간의 격차를 해소하여 훨씬 더 안정적인 학습과 더 빠른 수렴 시간을 제공합니다.

성능 및 메트릭 비교

널리 사용되는 COCO 데이터셋을 기준으로 벤치마킹할 때, 두 모델 모두 뛰어난 성능을 입증하지만 실제 추론 속도와 파라미터 효율성 측면에서 Ultralytics 생태계가 더욱 돋보입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

결과 분석

  • 속도 및 효율성: YOLO26은 NMS-free 아키텍처와 단순화된 손실 함수를 사용하므로 이전 아키텍처에 비해 최대 43% 더 빠른 CPU 추론을 자랑합니다. YOLO26n 모델은 TensorRT를 사용하여 NVIDIA T4 GPU에서 1.7ms라는 놀라운 속도로 실행되므로 실시간 비디오 스트림에 최적의 선택입니다.
  • 정확도: YOLO26x 모델은 타의 추종을 불허하는 57.5 mAP를 달성하며, 가장 큰 모델인 YOLOv9e보다 뛰어난 성능을 보이면서도 더 낮은 지연 시간을 유지합니다.
  • Memory Requirements: Ultralytics models are known for their efficiency. YOLO26 requires significantly less CUDA memory during model training and inference compared to complex transformer-based vision models, allowing developers to utilize larger batch sizes on consumer-grade hardware.

생태계, 사용 편의성 및 범용성

Ultralytics 생태계의 진정한 강점은 사용자 경험에 있습니다. YOLOv9 GitHub 코드베이스를 사용하는 연구원들은 복잡한 환경 설정과 수동 스크립팅 과정을 거쳐야 하지만, YOLO26은 직관적인 Ultralytics Python API에 완전히 통합되어 있습니다.

간소화된 API 예제

최첨단 YOLO26 모델을 학습시키는 데는 단 몇 줄의 Python 코드면 충분합니다:

from ultralytics import YOLO

# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export natively to ONNX format in a single command
model.export(format="onnx")

타의 추종을 불허하는 작업 범용성

표준 객체 탐지에 주로 맞춰진 YOLOv9와 달리, YOLO26은 다양한 컴퓨터 비전 작업을 기본적으로 지원합니다. 이 아키텍처에는 다양한 애플리케이션을 위한 구체적인 개선 사항이 포함되어 있습니다:

  • 인스턴스 세그멘테이션: 완벽한 픽셀 단위 마스크를 위한 특수 의미론적 세그멘테이션 손실 함수와 다중 스케일 proto 기능을 제공합니다.
  • 포즈 추정: RLE(Residual Log-Likelihood Estimation)를 통합하여 매우 정밀하게 골격 키포인트를 추적합니다.
  • 회전 객체 탐지(OBB): 항공 이미지의 회전된 객체 탐지에서 경계 문제를 해결하기 위해 설계된 특수 각도 손실 함수가 포함되어 있습니다.
  • 이미지 분류: ImageNet 표준을 기반으로 전체 이미지를 분류하는 강력한 기능입니다.
통합 생태계

모든 YOLO26 모델은 Ultralytics Platform과의 원활한 통합을 통해 데이터셋 라벨링, 능동 학습 및 즉각적인 배포 파이프라인을 내장하고 있습니다.

실제 적용 사례

이 모델들 중 하나를 선택하는 것은 일반적으로 배포될 환경에 따라 결정됩니다.

IoT 및 엣지 로봇 공학

로봇, 자율 드론 및 스마트 홈 IoT 장치의 경우 YOLO26이 독보적인 챔피언입니다. ProgLoss + STAL의 통합은 소형 객체 인식의 괄목할 만한 개선을 가져오며, 이는 고고도 드론을 통한 농업 모니터링에 매우 중요합니다. 43% 더 빠른 CPU 추론 및 NMS-free 설계와 결합된 YOLO26은 전용 GPU 없이도 하드웨어에서 원활하게 실행될 수 있습니다.

학술 연구 및 그래디언트 분석

YOLOv9는 학계 내에서 여전히 매우 존경받는 모델입니다. 그래디언트 흐름의 이론적 경계를 연구하거나 PGI 개념을 기반으로 맞춤형 PyTorch 레이어를 구축하려는 연구원들은 YOLOv9의 코드베이스가 딥러닝 이론 탐구를 위한 훌륭한 기반임을 알게 될 것입니다.

고속 제조 파이프라인

고속 컨베이어 벨트에서의 자동화된 결함 탐지와 같은 산업 환경에서 YOLO26 모델의 엄청나게 빠른 TensorRT 속도는 프레임 누락을 방지하여 품질 보증 시스템의 처리량을 극대화합니다.

사용 사례 및 권장 사항

YOLOv9와 YOLO26 중 어떤 것을 선택할지는 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

YOLOv9을 선택해야 할 때

YOLOv9는 다음과 같은 경우에 강력한 선택입니다:

  • 정보 병목 현상 연구: 프로그래밍 가능한 그래디언트 정보(PGI) 및 일반화된 효율적 계층 집계 네트워크(GELAN) 아키텍처를 연구하는 학술 프로젝트.
  • 그래디언트 흐름 최적화 연구: 학습 중 심층 네트워크 계층에서의 정보 손실을 이해하고 완화하는 데 중점을 둔 연구.
  • 고정확도 탐지 벤치마킹: 아키텍처 비교를 위한 참조 지점으로 YOLOv9의 강력한 COCO 벤치마크 성능이 필요한 시나리오.

YOLO26을 선택해야 하는 경우

YOLO26은 다음 경우에 권장됩니다:

  • NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.

결론

두 모델 모두 오픈 소스 커뮤니티를 위한 놀라운 도약을 의미합니다. YOLOv9는 향후 수년간 아키텍처에 영감을 줄 그래디언트 흐름에 대한 중요한 이론적 개선을 도입했습니다. 그러나 속도, 정확도 및 배포 용이성의 완벽한 균형을 찾는 현대의 개발자, 스타트업 및 기업 팀에게는 Ultralytics YOLO26을 확실하게 추천합니다.

YOLO26은 NMS를 제거하고 강력한 MuSGD 옵티마이저를 도입했으며, 탐지, 세그멘테이션 및 포즈 작업 전반에 걸쳐 타의 추종을 불허하는 도구 모음을 제공함으로써 귀하의 컴퓨터 비전 프로젝트가 오늘날 사용 가능한 가장 안정적이고 미래 지향적인 프레임워크를 기반으로 구축되도록 보장합니다.

댓글