콘텐츠로 건너뛰기

YOLO YOLO26: 실시간 객체 탐지기의 기술적 비교

실시간 객체 탐지 기술은 속도, 정확도, 배포 효율성을 균형 있게 갖춘 모델에 대한 수요에 힘입어 급속한 발전을 이루었습니다. 본 글은 알리바바 그룹이 개발한 YOLO Ultralytics 최신 버전인 YOLO26을 종합적으로 기술적으로 비교합니다. 두 모델의 아키텍처, 성능 지표, 이상적인 사용 사례를 분석하여 개발자와 연구자가 컴퓨터 비전 프로젝트에 적합한 도구를 선택하는 데 도움을 드리고자 합니다.

DAMO-YOLO 개요

YOLO 2022년 말 알리바바 그룹 연구진이 소개한 빠르고 정확한 객체 탐지YOLO . YOLO 여러 첨단 기술을 통합하여 성능의 한계를 뛰어넘도록 설계되었습니다.YOLO 핵심 철학은 신경망 구조 탐색(NAS)을 활용해 효율적인 백본을 자동으로 발견하고, 이를 중대한 재매개변수화 넥과 결합하는YOLO .

주요 아키텍처 기능은 다음과 같습니다:

  • MAE-NAS 백본: 다양한 지연 시간 제약 조건 하에서 최적의 백본 구조를 탐색하기 위한 마스킹 자동 인코더(MAE) 접근법 활용.
  • 효율적인 RepGFPN: 추론 속도 저하 없이 특징 융합 효율을 향상시키기 위해 재매개변수화를 통해 대폭 최적화된 일반화된 특징 피라미드 네트워크(GFPN).
  • ZeroHead: 계산 오버헤드를 줄이는 경량 헤드 설계.
  • AlignedOTA: 분류 및 회귀 작업 간의 정렬 불일치 문제를 해결하는 개선된 레이블 할당 전략.
  • 증류 강화: 더 큰 교사 모델을 활용하여 소규모 모델의 정확도를 높이기 위해 견고한 증류 파이프라인을 사용합니다.

저자: 쉬샹저(Xianzhe Xu), 장이치(Yiqi Jiang), 천웨이화(Weihua Chen), 황이룬(Yilun Huang), 장위안(Yuan Zhang), 쑨시위(Xiuyu Sun)
소속:알리바바 그룹
날짜: 2022년 11월 23일
링크:Arxiv, GitHub

DAMO-YOLO에 대해 자세히 알아보세요.

YOLO26 개요

2026년 1월 출시 Ultralytics에서 출시된 YOLO26은 에지 최적화 컴퓨터 비전 분야에서 획기적인 발전을 이루었습니다. 에지 및 저전력 기기를 위해 특별히 설계된 이 모델은 배포 파이프라인을 간소화하는 동시에 소형 물체 탐지와 같은 까다로운 작업에서 정확도를 향상시키는 데 중점을 둡니다.

YOLO26은 다음과 같은 주요 혁신으로 차별화됩니다:

  • 엔드투엔드 NMS 설계: 비최대 억제(NMS) 후처리 필요성을 제거함으로써 YOLO26은 배포 로직을 단순화하고 지연 변동성을 줄입니다. 이 개념은 최초로 YOLOv10에서 처음 도입된 개념입니다.
  • DFL 제거: 분포 초점 손실(DFL)을 제거하면 모델의 출력 구조가 단순화되어 ONNXTensorRT 으로의 내보내기를 더 직관적으로 만들고 더 다양한 하드웨어와 호환되도록 합니다.
  • MuSGD 최적화기: SGD뮤온을 결합한 새로운 하이브리드 최적화기입니다. 이는 Moonshot AI의 Kimi K2에서 영감을 받은 대규모 언어 모델(LLM) 훈련 기법을 바탕으로 합니다. 이를 통해 더 안정적인 훈련 역학과 더 빠른 수렴을 달성합니다.
  • ProgLoss + STAL: 점진적 손실 균형(Progressive Loss Balancing)과 소형 대상 인식 라벨 할당(Small-Target-Aware Label Assignment, STAL)의 결합은 소형 물체에 대한 성능을 크게 향상시켜 실시간 탐지기의 일반적인 약점을 해결합니다.

저자: 글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)
소속:Ultralytics
날짜: 2026년 1월 14일
링크:Ultralytics , GitHub

YOLO26에 대해 더 알아보기

비교 분석

건축 및 디자인 철학

가장 두드러진 차이는 추론 파이프라인에 있다. YOLO 중첩된 바운딩 박스를 NMS (최소화 중복 점수)가 필요한 전통적인 탐지기 워크플로를 따른다. 효과적이긴 하지만, NMS 대량 처리 애플리케이션에서 병목 현상이 될 NMS 있으며 특정 가속기에서의 배포를 복잡하게 만든다.

반면 YOLO26은 본질적으로 엔드투엔드 방식입니다. 이 모델은 최종 경계 상자 집합을 직접 예측합니다. 이러한 NMS(최소 중복 최소 교차) NMS 설계는 추론 지연 시간을 줄일 뿐만 아니라(특히 NMS 비용이 많이 NMS CPU 에지 장치에서), 프로덕션 환경에서 모델을 실행하는 데 필요한 통합 코드도 단순화합니다.

배포 간편성

YOLO26의 NMS(Neighborhood Multi-Scale) 프리 아키텍처는 에지 디바이스에 배포할 CUDA 복잡한 후처리 로직을 구현할 필요가 없음을 의미합니다. 모델 출력이 바로 최종 탐지 결과입니다.

학습 방법론

YOLO 높은 성능을 달성하기 위해 지식 증류(Knowledge Distillation )에 크게YOLO , 특히 소형 변종 모델에서 그러합니다. 이는 강력한 교사 모델을 먼저 훈련시켜야 하므로 훈련 파이프라인에 복잡성을 더합니다.

YOLO26은 MuSGD 최적화기를 도입하여 대규모 언어 모델(LLM) 최적화와 컴퓨터 비전 간의 격차를 해소합니다. 이를 통해 YOLO26은 복잡한 지식 전수 설정에 의존하지 않으면서도 최첨단 수렴 성능을 달성할 수 있으며, Ultralytics 모드는 다양한 고급 구성을 지원합니다. 또한 YOLO26의 ProgLoss는 훈련 중 손실 가중치를 동적으로 조정하여 학습 과정을 안정화합니다.

성능 지표

COCO 성능을 비교할 때, 두 모델 모두 인상적인 결과를 보이지만 속도와 효율성 측면에서 뚜렷한 상충 관계가 나타난다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

분석:

  • 파라미터 효율성: YOLO26은 훨씬 더 우수한 매개변수 효율성을 보여줍니다. 예를 들어, YOLO26s 달성하다 48.6 mAP 오직 9.5M 매개변수반면 DAMO-YOLOs 1630만 개의 mAP 46.0 mAP 달성합니다. 이로 인해 YOLO26 모델은 저장 용량이 더 작아지고 로딩 속도가 더 빨라집니다.
  • 추론 속도: YOLO26n은 TensorRT GPU 1.7ms라는 매우 빠른 속도를 기록하며, Tiny DAMO 변형의 약 2.32ms와 비교됩니다. YOLO26의 CPU 역시 주요 장점으로, GPU가 없는 라즈베리 파이(Raspberry Pi)나 휴대폰과 같은 기기에서 특별히 최적화되었습니다.
  • 정확도: 유사한 규모(예: 중간/대형)에서 YOLO26은 고급 STAL 할당 전략과 정교화된 아키텍처 덕분에YOLO mAP 지속적으로 우수한 성능을 보입니다.

다용도성과 작업 지원

YOLO 주로 객체 탐지에 초점을YOLO 있지만, Ultralytics YOLO26이 다중 작업의 강력한 도구로 기능하도록 보장합니다.

이러한 다용도성은 개발자가 다양한 컴퓨터 비전 문제에 단일 통합 API를 사용할 수 있게 하여 학습 곡선과 기술적 부채를 줄여줍니다.

사용 편의성 및 에코시스템

YOLO26의 가장 큰 장점 중 하나는 주변의 Ultralytics .

YOLO 연구자들이 결과를 재현할 수 있는 코드베이스를 제공하지만, 제품 중심 라이브러리에서 찾아볼 수 있는 포괄적인 문서화, 유지보수 및 커뮤니티 지원이 부족할 수 있습니다.

YOLO26은 다음의 이점을 제공합니다:

  • 간단한 API: 일관된 Python CLI (yolo predict ...초보자부터 전문가까지 누구나 쉽게 학습하고 배포할 수 있도록 하는 플랫폼입니다.
  • 문서: 사용자 정의 데이터셋 훈련부터 iOS Android 모델 내보내기까지 모든 것에 대한 포괄적인 가이드.
  • 통합: 다음과 같은 도구와의 원활한 연결성 Comet, Weights & Biases, Roboflow 를 MLOps에 활용하세요.
  • 유지보수: 버그 수정 및 신규 기능 도입을 위한 빈번한 업데이트를 통해 모델의 최신성을 유지합니다.

코드 예시: YOLO2 실행

from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

사용 사례

YOLO 선택해야 할 때

  • 연구 응용 분야: 신경망 구조 탐색(NAS) 연구나 새로운 재매개변수화 기법 탐구에 종사하는 경우,YOLO 학술 연구를 위한 풍부한 토대를YOLO .
  • 특정 레거시 제약 조건: 기존 파이프라인이YOLO 특정 출력 형식 또는 앵커 할당 전략을 기반으로 엄격하게 구축되어 리팩토링이 불가능한 경우.

YOLO26을 선택해야 할 때

  • 엣지 배포: CPU 속도와 낮은 메모리 사용량이 중요한 라즈베리 파이, 모바일 기기 또는 임베디드 시스템용 애플리케이션에 적합합니다.
  • 실시간 시스템: NMS 특성 덕분에 YOLO26은 로봇공학이나 자율주행 분야의 초저지연 요구사항에 이상적입니다.
  • 다중 작업 프로젝트: 객체 탐지, 마스크 분할, 자세 추정 작업을 동시에 수행해야 하는 프로젝트라면, YOLO26이 단일 프레임워크로 모든 요소를 포괄합니다.
  • 상업적 개발: 안정성, 지원, 그리고 CoreML과 같은 형식으로의 손쉬운 내보내기 CoreMLOpenVINO 으로의 내보내기가 용이하여 생산용 소프트웨어에 최적의 선택입니다.

결론

두 모델 모두 컴퓨터 비전 분야에서 중요한 성과를 보여줍니다.YOLO NAS(네트워크 아키텍처 탐색)와 효율적인 특징 융합 분야에서 인상적인 개념을YOLO . 그러나 YOLO26은 배포 실용성, 훈련 안정성, 계산 효율성에 중점을 두어 최신 기술을 정교화했습니다. 엔드투엔드 NMS(네트워크 멤버십 서클) 프리 설계, 우수한 매개변수 효율성, 그리고 Ultralytics 지원을 바탕으로, YOLO26은 현대적인 실시간 컴퓨터 비전 애플리케이션을 위한 권장 선택지로 두각을 나타냅니다.

Ultralytics 내에서 다른 옵션을 탐색하고자 하는 분들을 위해, 다음과 같은 모델들이 있습니다. YOLO11YOLOv8 는 일반적인 탐지 작업에 여전히 강력한 대안으로 남아 있습니다.


댓글