DAMO-YOLO vs. YOLO26: 차세대 실시간 객체 detect 아키텍처 분석

컴퓨터 비전 분야는 높은 정확도와 낮은 지연 시간 추론을 균형 있게 구현하는 아키텍처에 대한 요구에 힘입어 끊임없이 진화하고 있습니다. 본 비교 분석은 YOLO Ultralytics 기술적 복잡성을 심층적으로 탐구하며, 두 아키텍처의 혁신적 설계, 훈련 방법론 및 이상적인 적용 사례를 살펴봅니다.

엣지 디바이스에 비전 모델을 배포하든, 고처리량 클라우드 파이프라인을 구축하든, 이러한 모델 간의 미묘한 차이를 이해하는 것은 현대 AI 개발에서 정보에 기반한 아키텍처 결정을 내리는 데 매우 중요합니다.

YOLO: 대규모 신경망 구조 탐색

DAMO-YOLO는 Alibaba 그룹에서 개발했으며, 2022년 11월 23일에 출시되었습니다. Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun이 설계한 이 모델은 신경망 아키텍처 검색(NAS)을 사용하여 효율적인 아키텍처의 자동 발견에 크게 중점을 둡니다.

원본 연구는 ArXiv 논문에서 검토하거나 YOLO 저장소에서 소스 코드를 살펴볼 수 있습니다.

주요 아키텍처 기능

DAMO-YOLO는 실시간 객체 detect의 한계를 뛰어넘기 위해 설계된 여러 기술 혁신을 도입합니다.

MAE-NAS 백본: DAMO-YOLO는 다목적 진화 탐색(Multi-Objective Evolutionary search)을 활용하여 최적의 백본을 찾습니다. 이 NAS 접근 방식은 특정 하드웨어에서 detect 정확도와 추론(inference) 속도의 균형을 엄격하게 맞추는 아키텍처를 발견합니다.
효율적인 RepGFPN: 특징 융합을 크게 개선하는 헤비 넥 디자인으로, 항공 이미지에서 발견되는 것과 같은 복잡한 장면을 분석할 때 매우 유용합니다.
ZeroHead Design: 최종 예측 레이어의 계산 복잡성을 최소화하는 대폭 단순화된 detect 헤드입니다.
AlignedOTA 및 증류: DAMO-YOLO는 레이블 할당 모호성을 해결하기 위해 Aligned Optimal Transport Assignment (AlignedOTA)를 사용하며, 더 큰 티처 네트워크를 사용하여 더 작은 스튜던트 모델의 정확도를 높이기 위한 강력한 지식 증류 강화 전략과 결합됩니다.

DAMO-YOLO에 대해 자세히 알아보세요.

Ultralytics : YOLO26

2026년 1월 14일, 글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)가 Ultralytics에서 출시된 YOLO26은 접근성이 뛰어나면서도 고성능을 자랑하는 비전 AI의 정점을 보여줍니다. YOLO11 과 YOLOv10의 유산을 바탕으로, YOLO26은 에지 우선 배포, 다중 모드 유연성 및 비교할 수 없는 사용 편의성을 위해 처음부터 설계되었습니다.

YOLO26 혁신

Ultralytics 현대 컴퓨터 비전 애플리케이션을 위한 결정적인 선택이 되도록 하는 여러 획기적인 기능을 도입합니다:

엔드투엔드 NMS-Free 설계: YOLO26은 Non-Maximum Suppression (NMS) 후처리 과정을 기본적으로 제거합니다. YOLOv10에서 처음 개척된 이 엔드투엔드 접근 방식은 배포 파이프라인을 대폭 간소화하고 결정론적인 저지연 추론을 보장합니다.
최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅에 최적화된 아키텍처로, YOLO26은 엣지 장치 및 표준 CPU에서 탁월한 속도를 제공하여 배터리 구동 IoT 장치에 완벽합니다.
MuSGD Optimizer: LLM 훈련(예: Moonshot AI의 Kimi K2)에서 영감을 받아, YOLO26은 SGD와 Muon의 하이브리드를 통합합니다. 이는 컴퓨터 비전에 대규모 언어 모델 훈련 안정성을 제공하여 더 빠르고 신뢰할 수 있는 수렴을 가능하게 합니다.
DFL 제거: Distribution Focal Loss를 제거함으로써 모델 그래프가 단순화되어 ONNX 및 TensorRT와 같은 형식으로 원활하게 내보낼 수 있습니다.
ProgLoss + STAL: 이러한 고급 손실 함수는 작은 객체 인식에서 주목할 만한 개선을 제공하며, 이는 드론 운용 및 농업에 중요한 기능입니다.

작업별 향상 기능

YOLO26은 다중 모달리티에 걸쳐 특화된 개선 사항을 포함합니다: 인스턴스 분할을 위한 다중 스케일 프로토타입, 자세 추정을 위한 잔차 로그 가능도 추정(RLE), 그리고 방향성 경계 상자(OBB) 탐지에서 경계 문제를 완화하기 위한 고급 각도 손실 함수입니다.

YOLO26에 대해 더 알아보기

성능 비교

이러한 모델을 평가할 때 정확도(mAP)와 계산 효율성(속도/FLOPs) 간의 균형이 가장 중요합니다. 아래 표는 업계 표준 COCO 사용하여 이들 모델을 비교한 결과를 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

위에서 보듯이, YOLO26은 훨씬 적은 파라미터와 FLOPs로 지속적으로 더 높은 정확도를 제공하여 학습 및 추론 모두에서 훨씬 더 효율적인 아키텍처를 제공합니다.

훈련 효율성과 사용성

YOLO의 복잡성

YOLO 경쟁력 있는 정확도를YOLO , 그 훈련 방법론은 매우 복잡합니다. 신경망 구조 탐색(NAS)과 중대한 지식 증류에 의존한다는 것은 맞춤형 모델 훈련에 상당한 GPU 전문 지식이 필요함을 의미합니다. 거대한 교사 모델을 훈련하여 더 작은 학생 모델로 증류하는 이 다단계 과정은 맞춤형 데이터셋에서 신속한 반복을 시도하는 민첩한 엔지니어링 팀의 병목 현상이 될 수 있습니다.

간소화된 Ultralytics

반대로, Ultralytics YOLO26은 "초보자부터 전문가까지" 사용 가능한 편의성을 위해 설계되었습니다. 전체 학습, 검증 및 배포 수명 주기는 깔끔하고 통합된 python API 및 CLI 뒤에 추상화되어 있습니다. 또한 YOLO26은 RT-DETR과 같은 트랜스포머 기반 모델에 비해 학습 중 훨씬 적은 CUDA 메모리를 필요로 하므로, 연구자들이 소비자용 하드웨어에서 최첨단 모델을 학습할 수 있습니다.

Ultralytics 사용하여 YOLO26 모델을 훈련, 평가 및 내보내는 것이 얼마나 간단한지 보여주는 예시입니다:

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the model's performance on the validation set
metrics = model.val()

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export the model to ONNX format for deployment
model.export(format="onnx")

노코드 환경을 선호하는 팀을 위해 Ultralytics 데이터셋 주석 작업, 클라우드 기반 훈련, 원활한 배포를 위한 직관적인 인터페이스를 제공합니다.

실제 응용 분야

올바른 아키텍처 선택은 목표 배포 환경과 하드웨어 제약 조건에 크게 좌우됩니다.

산업 품질 관리

고속 제조 자동화를 위해 YOLO 전용 GPU 우수한 성능을 발휘할 수 있습니다. 그러나 현대식 조립 라인에는 YOLO26이 더 적합한 선택입니다. 엔드투엔드 NMS 프리 설계는 결정론적이며 지터 없는 지연 시간을 보장하는데, 이는 시각적 데이터를 로봇 액추에이터와 실시간으로 동기화할 때 필수적입니다.

엣지 AI 및 모바일 기기

배터리 구동 장치에 컴퓨터 비전을 배포하려면 극도의 효율성이 필요합니다. DAMO-YOLO가 특정 RepGFPN 넥에 의존하는 반면, YOLO26n (Nano)은 엣지 컴퓨팅에 특화되어 최적화되었습니다. DFL 제거와 43% 더 빠른 CPU 추론 성능은 스마트 카메라, 모바일 애플리케이션 및 보안 경보 시스템을 위한 최고의 솔루션입니다.

프로젝트가 단순한 객체 탐지를 넘어선 작업을 요구할 경우—예를 들어 자세 추정 기술을 활용한 스포츠 선수 동작 분석이나 인스턴스 분할을 통한 정확한 픽셀 경계 추출등—YOLO26은 단일 통합 코드베이스 내에서 이러한 모든 작업을 기본적으로 지원합니다.YOLO 경계 상자 탐지에만 엄격히YOLO .

사용 사례 및 권장 사항

DAMO-YOLO와 YOLO26 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

YOLO 선택해야 할 때

DAMO-YOLO는 다음 경우에 강력한 선택입니다.

고처리량 비디오 분석: 배치-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리합니다.
산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화된 백본이 detect 성능에 미치는 영향 연구.

YOLO26을 선택해야 할 때

YOLO26은 다음에 권장됩니다:

NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.

결론

두 아키텍처 모두 딥러닝 분야에서 중요한 성과를 나타냅니다. DAMO-YOLO는 특정 하드웨어 벤치마크에 맞춰 최적화된 신경망 아키텍처 검색(Neural Architecture Search) 및 증류(distillation) 기술의 강력한 잠재력을 흥미롭게 보여줍니다.

그러나 개발자, 연구자 및 기업용으로 즉시 생산 환경에 적용 가능한 솔루션을 찾는 이들에게는 Ultralytics 탁월한 선택으로 부각됩니다. 엔드투엔드 NMS 설계, 막대한 CPU 성능 향상, 다중 모달 유연성, 그리고 Ultralytics 통합이 결합되어 오늘날 실제 컴퓨터 비전 과제 해결을 위한 가장 견고하고 실용적인 도구로 자리매김하고 있습니다.

Ultralytics 내 다른 모델을 탐색하고자 하는 사용자를 위해, 다음에 대한 포괄적인 문서가 제공됩니다. YOLO11, YOLOv8, 그리고 트랜스포머 기반의 RT-DETR.