Link to this sectionYOLOv10 대 YOLO26#
컴퓨터 비전 분야는 최근 몇 년간 복잡하고 후처리(post-processing) 작업이 많은 아키텍처에서 간소화된 엔드투엔드(end-to-end) 모델로 전환되며 놀라운 발전을 이루었습니다. 본 기술 비교에서는 이러한 여정의 두 가지 주요 이정표인 학술적 혁신을 이룬 YOLOv10과 최첨단 엔터프라이즈급 YOLO26을 심도 있게 다룹니다. 개발자는 두 모델의 아키텍처, 학습 방법론, 실제 배포 역량을 검토함으로써 차세대 비전 AI 애플리케이션을 구축할 때 정보에 입각한 결정을 내릴 수 있습니다.
Link to this sectionYOLOv10: 엔드투엔드 객체 탐지의 선구자#
저자: Ao Wang, Hui Chen, Lihao Liu 외
조직: 칭화대학교
날짜: 2024-05-23
링크: arXiv 논문 | GitHub 저장소
2024년 중반에 발표된 YOLOv10은 실시간 객체 탐지 분야의 가장 고질적인 병목 현상 중 하나인 비최대 억제(NMS) 문제를 해결함으로써 학계의 컴퓨터 비전 연구에 중요한 도약을 제시했습니다. 기존의 객체 탐지 모델은 중복된 바운딩 박스를 필터링하기 위해 NMS에 크게 의존했으며, 이는 추론 과정에서 가변적인 지연 시간을 발생시키고 엣지 배포를 복잡하게 만들었습니다.
칭화대학교 연구팀은 NMS가 필요 없는 학습을 위한 일관된 이중 할당(consistent dual assignment) 전략을 도입했습니다. 이를 통해 모델은 후처리 필터링 단계 없이도 정확하게 바운딩 박스를 예측할 수 있게 되어, 추론 지연 시간을 직접적으로 개선하고 하드웨어 가속기 기반 배포의 장벽을 낮추었습니다. 표준 탐지 작업에는 매우 효율적이나, 이 모델은 주로 바운딩 박스 예측에 초점을 맞추었으며 인스턴스 세그멘테이션이나 포즈 추정과 같은 보다 복잡한 작업에 대한 기본 지원은 부족했습니다.
Link to this sectionYOLO26: 엣지 및 클라우드 비전 AI를 위한 새로운 표준#
저자: Glenn Jocher 및 Jing Qiu
조직: Ultralytics
날짜: 2026-01-14
링크: GitHub 저장소 | Ultralytics 플랫폼
앞서 개척된 NMS-free 개념을 기반으로 새롭게 출시된 YOLO26은 성능과 범용성의 정점을 나타냅니다. 학술 연구와 엔터프라이즈급 배포를 위해 설계된 이 모델은 엔드투엔드 NMS-free 디자인을 기본적으로 통합하여 NMS 후처리 과정을 완전히 제거함으로써, 모든 지원 하드웨어에서 더 빠르고 간편한 배포를 가능하게 합니다.
YOLO26은 몇 가지 획기적인 아키텍처 개선 사항을 도입했습니다. DFL(Distribution Focal Loss)을 제거하여 모델 내보내기 과정을 획기적으로 단순화했으며 저전력 엣지 장치와의 호환성을 향상했습니다. 이러한 구조적 변화와 결합된 YOLO26은 CPU 추론 속도를 최대 43% 향상시켰으며, 이는 GPU 가속을 사용할 수 없는 IoT 및 로봇 공학 애플리케이션에 탁월한 선택지가 됩니다.
또한 LLM 학습 기법에서 영감을 받은 SGD와 Muon의 하이브리드인 MuSGD Optimizer를 사용하여 학습 안정성과 수렴 속도가 혁신적으로 개선되었습니다. ProgLoss + STAL과 같은 고급 손실 함수를 결합한 YOLO26은 소형 객체 인식에서 눈에 띄는 향상을 보여줍니다. 또한 세그멘테이션을 위한 다중 스케일 프로토타이핑, 포즈 추정을 위한 RLE(Residual Log-Likelihood Estimation), 그리고 OBB(Oriented Bounding Box) 탐지에서 경계 문제를 해결하기 위한 특수 각도 손실 등 작업별 개선 사항을 도입했습니다.
컴퓨터 비전 워크플로우를 확장하려는 팀을 위해 Ultralytics 플랫폼은 YOLO26과의 원활한 통합을 제공하며, 복잡한 MLOps 인프라 없이도 직관적인 데이터 레이블링, 자동화된 클라우드 학습 및 원클릭 배포 옵션을 지원합니다.
Link to this section기술 성능 비교#
모델을 평가할 때는 정확도, 모델 크기, 추론 속도 간의 균형이 중요합니다. 아래 표는 표준 COCO 데이터셋에서 평가된 다양한 규모의 두 모델 패밀리 성능을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
데이터는 최신 아키텍처의 진화적 이점을 분명하게 보여줍니다. YOLO26은 모든 규모 계층에서 더 높은 mAP(mean Average Precision)를 달성하면서도 매우 경쟁력 있는 추론 속도를 유지합니다. YOLO26의 DFL 제거는 특히 CPU ONNX 성능을 대폭 향상했으며, 이는 이전 세대 모델들이 종종 어려움을 겪었던 지표입니다.
Link to this section학습 방법론 및 생태계#
모델의 가치는 이를 뒷받침하는 생태계에 달려 있습니다. YOLOv10은 PyTorch를 기반으로 한 훌륭한 학술적 구현을 제공했지만, 기본적인 탐지 이상의 작업을 수행하려면 수동 설정이 필요한 경우가 많습니다.
반면 YOLO26은 잘 관리된 Ultralytics 생태계에 완벽히 통합되어 있습니다. 이는 RT-DETR과 같은 트랜스포머 기반 모델보다 학습 중 메모리 요구 사항을 현저히 낮추어 연구원들이 일반 사용자급 하드웨어에서도 최신 네트워크를 학습할 수 있게 합니다. 데이터 증강, 하이퍼파라미터 튜닝, 로깅을 자동으로 처리하는 통합 API를 제공하여 사용 편의성이 탁월합니다.
Link to this section코드 예제: YOLO26 학습#
다양하고 정확도가 높은 모델을 학습시키는 데는 단 몇 줄의 Python 코드면 충분합니다:
from ultralytics import YOLO
# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with automatic memory management
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
)
# Export natively to TensorRT without NMS complexities
model.export(format="engine")Link to this section실제 적용 및 사용 사례#
올바른 아키텍처 선택은 전적으로 배포 제약 조건에 달려 있습니다.
Link to this section고속 엣지 컴퓨팅#
마이크로컨트롤러, 로봇 공학 또는 레거시 모바일 장치에 신속한 배포가 필요한 애플리케이션의 경우 43% 더 빠른 CPU 추론 성능을 가진 YOLO26이 단연 최고의 선택입니다. NMS-free 및 DFL-free 아키텍처는 스마트 시티 인프라의 실시간 영상 분석에 이상적인 OpenVINO 및 TensorRT와 같은 형식으로 원활하게 변환됩니다.
Link to this section고급 다중 작업 비전#
YOLOv10은 순수한 바운딩 박스 탐지에 뛰어나지만, 풍부한 시각적 이해가 필요한 프로젝트는 YOLO26을 사용해야 합니다. 의료 영상 분석의 인스턴스 세그멘테이션부터 스포츠 분석을 위한 정밀 포즈 추정에 이르기까지, YOLO26은 다양한 도메인에서 우수한 정확도를 보장하는 작업별 손실 함수를 제공합니다.
프로젝트에 강력한 오픈 보카블러리(open-vocabulary) 탐지가 필요한 경우 YOLO-World 탐색을 고려하십시오. 레거시 파이프라인을 유지하는 사용자의 경우 YOLO11은 Ultralytics 프레임워크 내에서 완벽하게 지원되는 강력한 대안으로 남아 있습니다.
Link to this section활용 사례 및 권장 사항#
YOLOv10과 YOLO26 사이의 선택은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
Link to this sectionYOLOv10을 선택해야 할 때#
YOLOv10은 다음 용도에 강력한 선택지입니다:
- NMS 없는 실시간 탐지: Non-Maximum Suppression 없이 엔드 투 엔드 탐지를 수행하여 배포 복잡성을 줄이는 애플리케이션.
- 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 스케일 전반에서 추론 속도와 탐지 정확도 사이의 강력한 균형이 필요한 프로젝트.
- 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.
Link to this sectionYOLO26을 선택해야 할 때#
YOLO26은 다음 상황에 권장됩니다:
- NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.
Link to this section결론#
YOLOv10에서 YOLO26으로의 전환은 학술적 개념 증명에서 프로덕션 준비가 완료된 엔터프라이즈 솔루션으로의 중요한 변화를 강조합니다. 선구적인 NMS-free 디자인을 채택하고 MuSGD 최적화 도구, ProgLoss, 간소화된 엣지 호환성으로 이를 강화한 YOLO26은 실시간 컴퓨터 비전 분야에서 무엇이 가능한지에 대한 새로운 기준을 제시합니다. 속도, 정확도, 사용 편의성의 최상의 균형을 달성하려는 개발자에게 YOLO26은 궁극적인 추천 모델입니다.