YOLO26 대 YOLO11: 비전 AI의 세대적 도약

최첨단 컴퓨터 비전 시스템을 구축할 때 정확도, 지연 시간, 자원 효율성 간의 균형을 맞추기 위해서는 올바른 모델을 선택하는 것이 중요합니다. 빠르게 진화하는 인공지능 분야에서 Ultralytics는 가능성의 경계를 끊임없이 확장하고 있습니다. 이 상세한 기술 비교에서는 성공적인 YOLO11에서 혁신적인 새로운 YOLO26으로의 전환을 살펴보고, AI 엔지니어와 연구자가 정보에 입각한 아키텍처 결정을 내리는 데 필요한 통찰력을 제공합니다.

모델 계보 및 메타데이터

두 모델 모두 Ultralytics에서 개발했지만, 객체 탐지 및 멀티태스킹 비전 모델의 타임라인에서 서로 다른 패러다임을 나타냅니다.

YOLO26 세부 정보:

YOLO26에 대해 더 알아보기

YOLO11 세부 정보:

YOLO11에 대해 더 알아보기

기타 아키텍처

YOLO26이 가장 진보된 실시간 모델이지만, 매우 특수한 하드웨어나 방대한 메모리 용량을 사용하는 사용자는 RT-DETR과 같은 Transformer 기반 아키텍처나 NMS가 필요 없는 획기적인 선구자인 YOLOv10을 살펴볼 수도 있습니다.

아키텍처 차이점 및 혁신

YOLO11에서 YOLO26으로의 도약은 모델 아키텍처와 기본 학습 체계 모두에서 근본적인 변화를 포함합니다. YOLO11이 객체 탐지 및 멀티태스킹 학습을 위한 강력한 기준을 확립했다면, YOLO26은 엣지 컴퓨팅을 위한 배포 파이프라인을 완전히 개선했습니다.

종단간(End-to-End) NMS-Free 설계

YOLO26의 가장 중요한 업그레이드 중 하나는 네이티브 종단간 아키텍처입니다. 중첩된 BBox를 필터링하기 위해 NMS(Non-Maximum Suppression) 후처리에 의존하는 YOLO11과 달리, YOLO26은 이 단계를 완전히 제거했습니다. YOLOv10에서 처음 도입된 이 개념은 지연 시간 변동성을 크게 줄이고 다양한 엣지 장치에서의 배포 로직을 단순화합니다.

엣지 효율성을 위한 DFL 제거

YOLO11은 BBox 추정을 개선하기 위해 DFL(Distribution Focal Loss)을 사용합니다. 그러나 DFL은 저전력 엣지 가속기에서 제대로 지원되지 않는 복잡한 softmax 연산에 의존합니다. YOLO26은 정확도를 희생하지 않고 DFL을 성공적으로 제거했습니다. 이러한 아키텍처 단순화는 임베디드 시스템과의 호환성을 크게 향상시키며, YOLO26이 이전 모델에 비해 최대 43% 더 빠른 CPU 추론을 달성할 수 있게 합니다.

MuSGD 옵티마이저

학습 안정성과 속도는 매우 중요합니다. YOLO26은 Moonshot AI의 Kimi K2의 LLM 학습 혁신에서 크게 영감을 받은 SGD(Stochastic Gradient Descent)와 Muon의 하이브리드인 MuSGD 옵티마이저를 도입했습니다. 이 옵티마이저는 컴퓨터 비전에 언어 모델 학습 안정성을 도입하여, 무거운 Transformer 대안보다 학습 중 메모리 점유율을 줄이고 더 빠른 수렴을 보장합니다.

ProgLoss 및 STAL

항공 이미지나 드론 애플리케이션을 다루는 연구자에게 미세한 특징을 감지하는 것은 역사적인 과제입니다. YOLO26은 ProgLoss를 STAL(Scale-Targeted Attention Loss)과 결합하여 도입함으로써, YOLO11보다 소형 객체 인식에서 현저한 개선을 제공합니다.

성능 및 메트릭 비교

모델을 직접 비교했을 때, YOLO26은 정밀도와 엣지 장치 효율성에서 명확한 우위를 점하면서도 Ultralytics 생태계 특유의 놀랍도록 낮은 메모리 요구 사항을 유지합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

참고: YOLO26 나노(YOLO26n) 모델은 YOLO11n 대비 CPU 속도가 약 31% 향상(38.9ms 대 56.1ms)되어, 엣지 우선 설계 철학을 잘 보여줍니다.

컴퓨터 비전 작업 전반의 다재다능함

두 모델 모두 통합된 Python API를 통해 비교할 수 없는 사용 편의성을 제공하는 고도로 유지 관리되는 Ultralytics 생태계의 이점을 누립니다. 이들은 단순한 객체 탐지기가 아니라 멀티태스킹의 강자입니다. 하지만 YOLO26에는 다음과 같은 작업별 개선 사항이 포함되어 있습니다:

  • 인스턴스 분할(Instance Segmentation): YOLO26은 정제된 의미론적 분할 손실(semantic segmentation loss)과 다중 스케일 프로토타이핑을 사용하여 YOLO11보다 더 선명한 마스크 경계를 생성합니다. 분할 워크플로우에 대해 더 알아보세요.
  • 자세 추정(Pose Estimation): RLE(Residual Log-Likelihood Estimation)를 통합함으로써, YOLO26은 복잡한 인간 자세에서 키포인트 정확도를 획기적으로 개선합니다. 자세 추정 기능을 살펴보세요.
  • 지향성 BBox(OBB): 특수 각도 손실 함수는 기존의 경계 불연속성 문제를 해결하여, 위성 영상에서 회전된 객체를 탐지하는 데 YOLO26을 매우 안정적으로 만듭니다. OBB 작업에 대해 읽어보세요.
  • 이미지 분류(Image Classification): 두 모델 모두 고속 분류 작업을 효율적으로 처리하며, YOLO26은 ImageNet에서 top-1 정확도가 소폭 향상되었습니다.

학습 및 추론 코드 예제

Ultralytics는 개발자 경험으로 유명합니다. SOTA 모델을 학습하거나 추론 스크립트를 실행하는 데는 몇 줄의 코드만 필요하므로, 보일러플레이트 코드를 최소화하고 생산성을 극대화합니다. 또한 YOLO 모델 학습은 대형 Transformer 네트워크보다 CUDA 메모리를 훨씬 적게 사용합니다.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

이상적인 사용 사례 및 배포 전략

YOLO26과 YOLO11 중 하나를 선택하는 것은 전적으로 프로덕션 환경의 제약 조건에 달려 있습니다.

YOLO26 배포 시기

YOLO26은 현대적인 신규 프로젝트를 위한 결정적인 선택입니다. 특히 다음과 같은 경우를 위해 제작되었습니다:

  • 엣지 컴퓨팅 및 IoT: 놀라운 CPU 성능과 DFL 제거 덕분에 Raspberry Pi, Coral NPU 및 모바일 프로세서와 같은 장치에서 최고의 성능을 발휘합니다.
  • 드론 및 항공 분석: ProgLoss + STAL의 통합으로 광범위한 풍경을 가로질러 작고 빠르게 움직이는 객체를 추적하는 데 독보적인 능력을 발휘합니다.
  • 지연 시간 결정적 애플리케이션: 자율 로봇이나 제조 품질 관리 분야에서 NMS-free 설계는 예상치 못한 후처리 급증 없이 결정론적 지연 시간을 보장합니다.

YOLO11 유지 시기

YOLO26이 더 뛰어나지만, YOLO11은 여전히 매우 유능한 모델입니다. 다음과 같은 경우 YOLO11을 유지할 수 있습니다:

  • 레거시 파이프라인: 기존 C++ 배포 인프라가 구형 아키텍처의 특정 앵커 기반 출력 및 NMS 로직과 긴밀하게 결합된 경우.
  • 학술적 기준(Baselines): 연구를 출판 중이며 새로운 알고리즘을 벤치마킹하기 위해 널리 인정받는 2024년 표준이 필요한 경우.

Ultralytics 생태계의 힘

YOLO11을 배포하든 YOLO26을 배포하든, Ultralytics 모델을 사용한다는 것은 빈번한 업데이트와 방대한 커뮤니티 지원을 갖춘 잘 관리된 생태계를 활용하는 것을 의미합니다.

엔터프라이즈 팀의 경우 Ultralytics Platform데이터 주석, 모델 학습 및 원활한 클라우드 배포를 위한 종단간 솔루션을 제공합니다. 학습된 가중치를 CoreML이나 TensorRT로 내보내는 것부터 고급 하이퍼파라미터 튜닝을 구성하는 것까지, 제공된 도구는 AI 수명 주기를 최대한 간소화합니다.

댓글