Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO 대 YOLO26#

컴퓨터 비전 분야는 높은 정확도와 낮은 지연 시간의 추론(low-latency inference) 사이의 균형을 맞추는 아키텍처에 대한 필요성에 힘입어 끊임없이 진화하고 있습니다. 이 비교 분석에서는 DAMO-YOLOUltralytics YOLO26의 기술적 세부 사항을 심층적으로 살펴보고, 각각의 아키텍처 혁신, 학습 방법론 및 이상적인 사용 사례를 탐색합니다.

비전 모델을 엣지 디바이스에 배포하든, 고처리량 클라우드 파이프라인을 구축하든, 현대 AI 개발에서 정보에 입각한 아키텍처 결정을 내리려면 이러한 모델 간의 차이점을 이해하는 것이 매우 중요합니다.

Link to this sectionDAMO-YOLO: 대규모 신경 아키텍처 탐색#

Alibaba Group에서 개발한 DAMO-YOLO는 2022년 11월 23일에 출시되었습니다. Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang 및 Xiuyu Sun이 설계한 이 모델은 신경망 구조 탐색(NAS)을 사용하여 효율적인 아키텍처를 자동 탐색하는 데 중점을 둡니다.

ArXiv 논문에서 원본 연구를 검토하거나 DAMO-YOLO GitHub 저장소에서 소스 코드를 확인할 수 있습니다.

Link to this section주요 아키텍처 특징#

DAMO-YOLO는 실시간 객체 탐지의 한계를 뛰어넘기 위해 설계된 몇 가지 기술적 혁신을 도입했습니다:

  • MAE-NAS 백본: DAMO-YOLO는 최적의 백본을 찾기 위해 다목적 진화 탐색(Multi-Objective Evolutionary search)을 활용합니다. 이 NAS 접근 방식은 특정 하드웨어에서 탐지 정확도와 추론 속도 사이의 균형을 엄격하게 맞추는 아키텍처를 찾아냅니다.
  • 효율적인 RepGFPN: 항공 영상과 같이 복잡한 장면을 분석할 때 매우 유용한 특징 융합을 크게 개선한 헤비 넥(heavy-neck) 설계입니다.
  • ZeroHead 설계: 최종 예측 레이어의 계산 복잡성을 최소화하는 고도로 단순화된 탐지 헤드입니다.
  • AlignedOTA 및 증류(Distillation): DAMO-YOLO는 레이블 할당 모호성을 해결하기 위해 AlignedOTA(Aligned Optimal Transport Assignment)를 사용하며, 더 큰 교사 네트워크를 사용하여 더 작은 학생 모델의 정확도를 높이는 강력한 지식 증류 개선 전략을 결합합니다.

DAMO-YOLO에 대해 더 알아보기

Link to this sectionUltralytics의 강점: YOLO26#

Ultralytics의 Glenn Jocher와 Jing Qiu가 2026년 1월 14일에 출시한 YOLO26은 접근 가능하고 고성능인 비전 AI의 정점을 나타냅니다. YOLO11YOLOv10의 유산을 바탕으로 구축된 YOLO26은 엣지 중심 배포, 멀티모달 범용성, 그리고 타의 추종을 불허하는 사용 편의성을 위해 처음부터 새로 설계되었습니다.

Link to this sectionYOLO26의 혁신#

Ultralytics YOLO26은 현대 컴퓨터 비전 애플리케이션을 위한 결정적인 선택으로 만드는 몇 가지 획기적인 기능을 도입했습니다:

  • 엔드투엔드 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 기본적으로 제거합니다. YOLOv10에서 처음 개척된 이 엔드투엔드 방식은 배포 파이프라인을 획기적으로 단순화하고 결정론적인 저지연 추론을 보장합니다.
  • 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅을 위해 아키텍처적으로 최적화된 YOLO26은 엣지 디바이스와 표준 CPU에서 뛰어난 속도를 제공하며, 배터리 구동식 IoT 디바이스에 완벽하게 적합합니다.
  • MuSGD 옵티마이저: LLM 학습(Moonshot AI의 Kimi K2 등)에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드를 통합합니다. 이는 컴퓨터 비전에 대규모 언어 모델 학습의 안정성을 가져와 더 빠르고 신뢰할 수 있는 수렴을 가능하게 합니다.
  • DFL 제거: DFL(Distribution Focal Loss)을 제거함으로써 모델 그래프가 단순화되어 ONNXTensorRT와 같은 형식으로 원활하게 내보낼 수 있습니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 소형 객체 인식에서 현저한 개선을 제공하며, 이는 드론 운영농업 분야에서 중요한 기능입니다.
작업별 개선 사항

YOLO26은 다중 모달리티 전반에 걸쳐 전문화된 개선 사항을 포함합니다: 인스턴스 분할을 위한 멀티 스케일 프로토, 포즈 추정을 위한 RLE(Residual Log-Likelihood Estimation), 그리고 방향성 바운딩 박스(OBB) 탐지에서 경계 문제를 완화하기 위한 고급 각도 손실(angle loss)이 있습니다.

YOLO26에 대해 자세히 알아보기

Link to this section성능 비교#

이러한 모델을 평가할 때는 정확도(mAP)와 계산 효율성(속도/FLOPs) 사이의 균형이 가장 중요합니다. 아래 표는 업계 표준 COCO 데이터셋을 사용하여 이 모델들을 어떻게 비교하는지 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

위에서 볼 수 있듯이, YOLO26은 훨씬 적은 파라미터와 FLOPs로 일관되게 더 높은 정확도를 제공하며, 결과적으로 학습과 추론 모두에 훨씬 더 효율적인 아키텍처를 제공합니다.

Link to this section학습 효율성 및 사용성#

Link to this sectionDAMO-YOLO의 복잡성#

DAMO-YOLO는 경쟁력 있는 정확도를 달성하지만, 학습 방법론이 매우 복잡합니다. NAS(신경망 구조 탐색)와 과도한 지식 증류에 대한 의존성은 커스텀 모델을 학습시키는 데 종종 상당한 GPU 리소스와 전문 지식이 필요함을 의미합니다. 거대한 교사 모델을 학습시켜 작은 학생 모델로 증류하는 이 다단계 프로세스는 커스텀 데이터셋에서 빠르게 반복하려는 민첩한 엔지니어링 팀에 병목 현상을 일으킬 수 있습니다.

Link to this section간소화된 Ultralytics 경험#

Conversely, Ultralytics YOLO26 is designed for "zero-to-hero" usability. The entire training, validation, and deployment lifecycle is abstracted behind a clean, unified Python API and CLI. Furthermore, YOLO26 requires significantly less CUDA memory during training compared to transformer-based models like RT-DETR, allowing researchers to train state-of-the-art models on consumer-grade hardware.

다음은 Ultralytics SDK를 사용하여 YOLO26 모델을 학습, 평가 및 내보내는 것이 얼마나 간단한지에 대한 예시입니다:

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the model's performance on the validation set
metrics = model.val()

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export the model to ONNX format for deployment
model.export(format="onnx")

코드 없는 환경을 선호하는 팀을 위해 Ultralytics Platform은 데이터셋 주석, 클라우드 학습 및 원활한 배포를 위한 직관적인 인터페이스를 제공합니다.

Link to this section실제 활용 사례#

올바른 아키텍처를 선택하는 것은 타겟 배포 환경과 하드웨어 제약 조건에 크게 좌우됩니다.

Link to this section산업용 품질 관리#

고속 제조 자동화의 경우, DAMO-YOLO는 전용 GPU 하드웨어에서 잘 작동할 수 있습니다. 그러나 YOLO26은 현대 조립 라인에 선호되는 선택입니다. 이 모델의 엔드투엔드 NMS-Free 설계는 결정론적이고 지터 없는 지연 시간을 보장하며, 이는 실시간으로 로봇 액추에이터와 시각 데이터를 동기화할 때 필수적입니다.

Link to this section엣지 AI 및 모바일 디바이스#

배터리 구동식 디바이스에 컴퓨터 비전을 배포하려면 극한의 효율성이 필요합니다. DAMO-YOLO는 특정 RepGFPN 넥에 의존하는 반면, YOLO26n(나노)은 엣지 컴퓨팅에 특별히 최적화되어 있습니다. DFL 제거와 43% 더 빠른 CPU 추론 덕분에 스마트 카메라, 모바일 애플리케이션 및 보안 경보 시스템을 위한 최고의 솔루션이 됩니다.

Link to this section멀티모달 프로젝트 요구 사항#

프로젝트가 단순히 객체 탐지 이상을 요구하는 경우(예: 포즈 추정을 사용하여 스포츠의 선수 동작을 분석하거나 인스턴스 분할을 사용하여 정확한 픽셀 경계를 추출하는 경우), YOLO26은 단일 통합 코드베이스 내에서 이러한 모든 작업에 대한 기본 지원을 제공합니다. DAMO-YOLO는 바운딩 박스 탐지로 엄격히 제한됩니다.

Link to this section활용 사례 및 권장 사항#

DAMO-YOLO와 YOLO26 중 무엇을 선택할지는 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionDAMO-YOLO를 선택해야 할 때#

DAMO-YOLO는 다음 상황에 적합합니다:

  • 고처리량 영상 분석: 배치-1(batch-1) 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 높은 FPS 영상 스트림을 처리할 때.
  • 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
  • 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.

Link to this sectionYOLO26을 선택해야 할 때#

YOLO26은 다음 상황에 권장됩니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section결론#

두 아키텍처 모두 딥러닝 분야에서 중요한 성과를 나타냅니다. DAMO-YOLO는 특정 하드웨어 벤치마크에 맞춰진 신경망 구조 탐색 및 증류 기술의 힘을 흥미롭게 보여줍니다.

그러나 프로덕션 수준의 솔루션을 찾는 개발자, 연구원 및 기업에게는 Ultralytics YOLO26이 단연 우월한 선택입니다. 엔드투엔드 NMS-free 설계, 대규모 CPU 추론 향상, 멀티모달 범용성, 그리고 잘 관리된 Ultralytics 생태계로의 통합은 이 모델을 오늘날 실제 컴퓨터 비전 문제를 해결하는 가장 강력하고 실용적인 도구로 만듭니다.

Ultralytics 생태계 내의 다른 모델을 탐색하는 데 관심이 있는 사용자를 위해 YOLO11, YOLOv8 및 트랜스포머 기반 RT-DETR에 대한 포괄적인 문서를 이용할 수 있습니다.

댓글