콘텐츠로 건너뛰기

YOLOv10 YOLO26: 엔드투엔드 객체 탐지의 새로운 시대

실시간 객체 탐지 기술의 진화는 최근 몇 년간 속도, 정확도, 배포 용이성 간의 균형에 중점을 두고 급속한 발전을 이루었습니다. 본 비교는 이 여정에서 두 가지 중요한 이정표를 살펴봅니다: YOLOv10: NMS 탐지가 가능하도록 한 학계적 돌파구, 그리고 YOLO26: Ultralytics 출시한 최신 생산 환경 Ultralytics 기업급 애플리케이션을 위해 이러한 개념을 정교화한 Ultralytics

모델 개요

YOLOv10: 학계의 선구자

2024년 5월 칭화대학교 연구진이 발표한 YOLOv10 추론 과정에서 비최대 억제(NMS)의 필요성을 제거함으로써 패러다임 전환을 YOLOv10 . 이 "엔드투엔드" 접근법은 배포 파이프라인의 오랜 병목 현상을 해결했는데, 후처리 지연 시간은 장면 밀도에 따라 예측 불가능하게 변동하는 경우가 많았다.

10에 대해 자세히 알아보기

YOLO26: 산업 표준

선행 모델들이 마련한 기반 위에 구축된 YOLO26 (2026년 1월 출시)은 실제 환경에서 영향력을 발휘하도록 설계된 Ultralytics 최첨단 솔루션입니다. YOLOv10 개척한 엔드투엔드 NMS 프리 설계를 YOLOv10 더 단순화된 손실 함수, 새로운 최적화 알고리즘, 그리고 엣지 하드웨어에서의 획기적인 속도 향상을 통해 이를 YOLOv10 발전시켰습니다.

YOLO26에 대해 더 알아보기

기술적 비교

두 모델 모두 NMS 인한 지연 문제를 해결하는 것을 목표로 하지만, 최적화를 위한 접근 방식은 서로 다릅니다. YOLOv10 아키텍처 탐색과 훈련을 위한 이중 할당에 중점을 YOLOv10 반면, YOLO26은 배포의 단순성, CPU , 훈련 안정성을 우선시합니다.

아키텍처 및 설계

YOLOv10NMS 훈련하기 위한 일관된 이중 할당(Consistent Dual Assignments )을 도입했습니다. 이 방법은 훈련 중 풍부한 감독을 위한 일대다(one-to-many) 헤드와 추론을 위한 일대일(one-to-one) 헤드를 결합하여 모델이 개체당 단일 최적 박스를 출력하도록 학습하도록 보장합니다. 또한 경량 분류 헤드와 공간-채널 분리 다운샘플링을 포함한 전체적인 효율성-정확도 중심의 모델 설계를 활용했습니다.

YOLO26은 분포 초점 손실(DFL) 을 완전히 제거함으로써 이를 개선합니다. DFL은 초기 버전에서 박스 정밀도 향상에 기여했으나, 이를 제거함으로써 내보내기 그래프가 크게 단순화되어 제한된 에지 장치 및 저전력 마이크로컨트롤러에서 YOLO26 모델을 더 쉽게 실행할 수 있게 되었습니다. 또한 YOLO26은 SGD 뮤온 최적화기(LLM 훈련에서 영감을 얻음)의 하이브리드인 MuSGD 최적화기를 도입하여, 컴퓨터 비전 작업에 대규모 배치 훈련의 안정성을 최초로 제공합니다.

성능 지표

다음 표는 성능 차이를 보여줍니다. YOLO26은 CPU에서 우수한 속도를 보이며 모든 모델 규모에서, 특히 더 큰 변종에서 더 높은 정확도를 나타냅니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

CPU 기술의 획기적 발전

YOLO26은 전용 GPU가 없는 환경을 위해 특별히 최적화되었습니다. 이전 세대에 비해 최대 43% 빠른 CPU 달성하여 라즈베리 파이 및 모바일 배포에 혁신적인 변화를 가져옵니다.

사용 사례 및 실제 적용 사례

10 선택해야 할 때

YOLOv10 연구자와 특정 탐지 전용 시나리오에 YOLOv10 탁월한 선택입니다.

  • 학술 연구: 이중 할당 전략은 손실 함수 설계에 대한 심층 연구를 위한 흥미로운 주제이다.
  • 레거시 NMS 파이프라인: YOLOv10 ONNX 기반으로 이미 구축된 프로젝트의 경우, 계속해서 안정적이고 지연 시간이 짧은 감지 기능을 제공합니다.

YOLO26이 생산 환경에서 최상의 선택인 이유

대부분의 개발자에게 YOLO26은 보다 강력하고 다용도로 활용 가능한 솔루션을 제공합니다.

  • 엣지 컴퓨팅 및 IoT: 단순화된 손실 함수와 DFL 제거로 인해 YOLO26은 메모리와 연산 능력이 부족한 엣지 디바이스에 배포하기에 이상적입니다.
  • 소형 물체 탐지: ProgLoss + STAL (소프트 타겟 앵커 손실) 덕분에 YOLO26은 소형 물체 탐지에 탁월한 성능을 발휘하며, 이는 항공 촬영 및 드론 검사에 있어 핵심적인 요구 사항입니다.
  • 복합 다중 작업 처리: 기본적으로 탐지 모델인 YOLOv10 달리, YOLOv26은 동일한 프레임워크 내에서 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB) 작업을 기본적으로 지원합니다.

Ultralytics 이점

YOLO26과 같은 Ultralytics 선택하면 단순한 지표 이상의 이점을 얻을 수 있습니다. 통합된 생태계는 데이터 수집부터 최종 배포까지 프로젝트 전반에 걸친 지원을 보장합니다.

간소화된 사용자 경험

Python 제공하는 사용 편의성은 타의 추종을 불허합니다. 다른 저장소에서는 복잡한 설정 스크립트가 필요할 수 있지만, Ultralytics 최소한의 코드로 로드, 훈련 및 배포할 수 있습니다.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

포괄적인 생태계 지원

YOLO26은 Ultralytics 완벽하게 통합되어 원활한 데이터셋 관리, 원격 훈련, TensorRT, CoreML, OpenVINO 등의 형식으로의 원클릭 내보내기를 지원합니다. 이 잘 관리된 생태계는 빈번한 업데이트, 활발한 커뮤니티 포럼, 문제 해결을 위한 방대한 문서에 대한 접근을 보장합니다.

교육 효율성 및 메모리

Ultralytics tral Ultralytics 훈련 효율성으로 유명합니다. YOLO26이 MuSGD 최적화기를 사용함으로써, Transformer 기반 모델(예: RT-DETR과 같은 트랜스포머 기반 모델에 비해 더 낮은 메모리 요구 사항으로 안정적인 훈련을 가능하게 합니다. 이는 VRAM 부족 없이 소비자용 GPU로도 높은 정확도의 모델을 훈련할 수 있음을 의미하며, 고급 AI 기능에 대한 접근성을 대중화합니다.

결론

두 아키텍처 모두 컴퓨터 비전 분야에서 중요한 성과를 나타냅니다. YOLOv10 은 NMS(Neighborhood Multi-Scale)를 사용하지 않는 접근법을 대중화한 공로를 인정받아, 실시간 애플리케이션에 대한 엔드투엔드 탐지가 실행 가능함을 입증했습니다.

그러나 YOLO26은 이 개념을 2026년의 실용적 요구에 맞게 정교화했습니다. 우수한 CPU , ProgLoss를 통한 소형 물체에 대한 특화된 지원, 그리고 Ultralytics 지원을 바탕으로, YOLO26은 확장 가능하고 미래에도 대응 가능한 AI 솔루션을 구축하려는 개발자에게 권장되는 선택입니다. 스마트 리테일 분석, 자율 로봇 공학, 고속 제조 등 어떤 분야에서 작업하든 YOLO26은 성공에 필요한 성능 균형을 제공합니다.

살펴볼 다른 모델

  • YOLO11: YOLO26의 견고한 전신으로, 여전히 생산 현장에서 널리 사용되고 있습니다.
  • RT-DETR: GPU 풍부한 환경에서 높은 정확도를 제공하는 변환기 기반 대안.
  • YOLO: 텍스트 프롬프트로 클래스가 정의되는 오픈 어휘 탐지 작업에 이상적으로 적합합니다.

댓글