콘텐츠로 건너뛰기

YOLOv10 YOLO26: 엔드투엔드 객체 탐지의 진화

컴퓨터 비전 분야는 최근 몇 년간 복잡한 후처리 중심 아키텍처에서 간소화된 엔드투엔드 모델로 전환되며 놀라운 발전을 이루었습니다. 본 기술 비교는 이 여정에서 두 가지 주요 이정표인 YOLOv10 학술적 YOLOv10 최첨단 기업용 YOLO26을 심층 분석합니다. 두 모델의 아키텍처, 훈련 방법론, 실제 배포 역량을 검토함으로써 개발자는 차세대 비전 AI 애플리케이션 구축 시 정보에 기반한 의사 결정을 내릴 수 있습니다.

YOLOv10: 선구적인 엔드투엔드 객체 탐지

저자: 왕아오(王傲), 천후이(陈辉), 류리하오(刘立浩) 외
소속 기관: 칭화대학교(清华大学)
날짜: 2024-05-23
관련 링크: arXiv 논문 | GitHub 저장소

2024년 중반에 공개된 YOLOv10 실시간 객체 탐지에서 가장 지속적인 병목 현상 중 하나인 비최대 억제(NMS) 문제를 해결함으로써 학계 컴퓨터 비전 연구에 중대한 도약을 YOLOv10 . 기존 객체 탐지기는 중복 경계 상자를 걸러내기 NMS 크게 의존했는데, 이는 추론 과정에서 가변적인 지연 시간을 발생시키고 현장 배포를 복잡하게 만들었습니다.

칭화대 연구팀은 NMS 훈련이 가능한 일관된 이중 할당 전략을 도입했다. 이를 통해 모델은 후처리 필터링 단계 없이도 바운딩 박스를 정확히 예측할 수 있게 되어 추론 지연 시간을 직접 개선하고 하드웨어 가속기 배포 장벽을 낮췄다. 표준 탐지 작업에는 매우 효율적이었으나, 이 모델은 주로 바운딩 박스 예측에 집중했으며 인스턴스 분할이나 자세 추정 같은 더 복잡한 작업에 대한 기본 지원이 부족했다.

10에 대해 자세히 알아보기

YOLO26: 엣지 및 클라우드 비전 AI의 새로운 표준

저자: Glenn Jocher 및 Jing Qiu
소속 기관: Ultralytics
날짜: 2026-01-14
링크: GitHub 저장소 | Ultralytics

기존에 개척된 NMS 프리 개념을 기반으로 새롭게 출시된 YOLO26은 성능과 다용도성의 정점을 구현합니다. 학술 연구와 기업급 배포 모두를 위해 설계된 이 제품은 엔드투엔드 NMS 프리 설계를 기본적으로 통합하여, 지원되는 모든 하드웨어에서 더 빠르고 간편한 배포를 위해 NMS 완전히 제거합니다.

YOLO26은 여러 획기적인 아키텍처 개선 사항을 도입합니다. 분산 초점 손실(DFL)의 제거는 모델 내보내기 과정을 크게 단순화하고 저전력 에지 장치와의 호환성을 향상시킵니다. 이러한 구조적 변경과 함께 YOLO26은 CPU 속도를 최대 43%까지 가속화하여 GPU 불가능한 IoT 및 로봇 공학 애플리케이션에 탁월한 선택지가 됩니다.

또한, 대규모 SGD 모델(LLM) 훈련 기법에서 영감을 받은 SGD Muon)의 하이브리드인 MuSGD 최적화기를 통해 훈련 안정성과 수렴 속도가 혁신적으로 개선되었습니다. ProgLoss + STAL과 같은 고급 손실 함수와 결합된 YOLO26은 소형 객체 인식에서 눈에 띄는 개선을 자랑합니다. 또한 분할을 위한 다중 스케일 프로토타이핑, 자세 추정을 위한 잔차 로그 가능도 추정(RLE), 방향성 경계 상자(OBB) 탐지에서 경계 문제를 해결하기 위한 특수 각도 손실 등 작업별 향상된 기능을 도입했습니다.

YOLO26에 대해 더 알아보기

기업 배포

컴퓨터 비전 워크플로우 확장을 원하는 팀을 위해 Ultralytics YOLO26과의 원활한 통합을 제공하며, 직관적인 데이터 어노테이션, 자동화된 클라우드 트레이닝, 그리고 방대한 MLOps 인프라 없이도 가능한 원클릭 배포 옵션을 지원합니다.

기술 성능 비교

이러한 모델을 평가할 때 정확도, 모델 크기, 추론 속도 간의 균형이 매우 중요합니다. 아래 표는 표준 COCO 기준으로 다양한 규모에서 두 모델 계열의 성능을 비교하여 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

데이터는 새로운 아키텍처의 진화적 우위를 명확히 보여줍니다. YOLO26은 모든 크기 계층에서 더 높은 mAP 평균 정밀도) 를 달성하면서도 매우 경쟁력 있는 추론 속도를 유지합니다. 특히 YOLO26의 DFL 제거는 이전 세대가 종종 어려움을 겪었던 지표인 CPU ONNX 탁월한ONNX 내는 데 기여합니다.

학습 방법론 및 생태계

모델의 유용성은 이를 지원하는 생태계에 달려 있습니다. YOLOv10 PyTorch을 기반으로 한 탁월한 학술적 구현을 제공했지만, 기본적인 탐지 작업을 넘어서는 작업에는 종종 수동 구성이 필요했습니다.

반면 YOLO26은 잘 관리되는 Ultralytics 완전히 통합되어 있습니다. 이는 Transformer 기반 모델인 RT-DETR과 같은 트랜스포머 기반 모델에 비해 훈련 중 메모리 요구 사항을 크게 낮춰, 연구자들이 소비자 등급 하드웨어에서 최첨단 네트워크를 훈련할 수 있게 합니다. 사용 편의성은 비교할 수 없을 정도로 뛰어나며, 데이터 증강, 하이퍼파라미터 튜닝, 로깅을 자동으로 처리하는 통합 API를 제공합니다.

코드 예시: YOLO26 훈련

다재다능하고 매우 정확한 모델을 훈련하는 데는 단 몇 줄의 Python 필요합니다:

from ultralytics import YOLO

# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with automatic memory management
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
)

# Export natively to TensorRT without NMS complexities
model.export(format="engine")

실제 적용 사례 및 사용 사례

적절한 아키텍처 선택은 전적으로 배포 제약 조건에 달려 있습니다.

고속 엣지 컴퓨팅

마이크로컨트롤러, 로봇 공학 또는 구형 모바일 기기에서 신속한 배포가 필요한 애플리케이션의 경우, YOLO26의 43% 더 빠른 CPU 성능이 확실한 선택이 됩니다. NMS 및 DFL이 NMS 이 아키텍처는 다음과 같은 형식으로 원활하게 변환됩니다. OpenVINOTensorRT과 같은 포맷으로 원활하게 변환되어 스마트 시티 인프라의 실시간 영상 분석에 이상적입니다.

고급 다중 작업 비전

YOLOv10 순수한 바운딩 박스 탐지에서 YOLOv10 보이지만, 풍부한 시각적 이해가 필요한 프로젝트에는 YOLO26을 활용해야 합니다. 의료 영상의 인스턴스 분할부터 스포츠 분석을 위한 정밀한 자세 추정까지, YOLO26은 다양한 분야에서 우수한 정확도를 보장하는 작업별 손실 함수를 제공합니다.

대안 옵션

프로젝트에 강력한 오픈 어휘물체탐지가 필요하다면 YOLO 고려해 보세요. 기존 파이프라인을 유지하는 사용자의 경우, YOLO11 은 Ultralytics 내에서 완전히 지원되는 강력한 대안으로 남아 있습니다.

사용 사례 및 권장 사항

YOLOv10 YOLO26 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

10 선택해야 할 때

YOLOv10 다음에 대한 강력한 YOLOv10 :

  • NMS 실시간 감지: 비최대 억제(NMS) 없이 종단 간 감지의 이점을 제공하는 애플리케이션으로, 배포 복잡성을 줄입니다.
  • 균형 잡힌 속도-정확도 절충점: 다양한 모델 규모에 걸쳐 추론 속도와 탐지 정확도 간의 강력한 균형이 요구되는 프로젝트들.
  • 일관된 지연 시간 애플리케이션: 로봇 공학 이나 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.

YOLO26을 선택해야 할 때

YOLO26은 다음에 권장됩니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

결론

YOLOv10 전환은 학술적 개념 증명에서 생산 환경에 바로 적용 가능한 기업 솔루션으로의 중대한 전환을 보여줍니다. 선구적인 NMS(Neural Multi-Scale Detection) 프리 설계를 채택하고 MuSGD 최적화기, ProgLoss, 간소화된 에지 호환성으로 이를 강화함으로써, YOLO26은 실시간 컴퓨터 비전에서 가능한 것의 새로운 기준을 제시합니다. 속도, 정확도, 사용성의 최적 균형을 추구하는 개발자에게 YOLO26은 최고의 선택으로 손꼽힙니다.


댓글