Ultralytics YOLO26
개요
Ultralytics YOLO26은 실시간 객체 탐지기인 YOLO 시리즈의 최신 진화 버전으로, 엣지 및 저전력 장치를 위해 처음부터 설계되었습니다. 불필요한 복잡성을 제거하는 간소화된 디자인을 도입하는 동시에, 타겟팅된 혁신을 통합하여 더 빠르고 가벼우며 접근하기 쉬운 배포를 구현합니다.

Ultralytics Platform에서 YOLO26 모델을 직접 탐색하고 실행해 보십시오.
YOLO26의 아키텍처는 다음과 같은 세 가지 핵심 원칙을 기반으로 합니다:
- 단순성(Simplicity): YOLO26은 네이티브 엔드투엔드(end-to-end) 모델로서, NMS(Non-Maximum Suppression) 없이 직접 예측을 수행합니다. 이러한 후처리 단계를 제거함으로써 추론 속도가 빨라지고 모델이 더 가벼워지며 실제 시스템에 배포하기가 더 쉬워졌습니다. 이 획기적인 접근 방식은 칭화대학교의 Ao Wang이 YOLOv10에서 처음 선보였으며, YOLO26에서 더욱 발전했습니다.
- 배포 효율성(Deployment Efficiency): 엔드투엔드 설계는 파이프라인의 전체 단계를 생략하여 통합을 극적으로 단순화하고 지연 시간을 줄이며 다양한 환경에서 배포를 더욱 안정적으로 만듭니다.
- Training Innovation: YOLO26 introduces the MuSGD optimizer, a hybrid of SGD and Muon — inspired by Moonshot AI's Kimi K2 breakthroughs in LLM training. This optimizer brings enhanced stability and faster convergence, transferring optimization advances from language models into computer vision.
- 작업별 최적화(Task-Specific Optimizations): YOLO26은 전문화된 작업을 위해 타겟팅된 개선 사항을 도입했습니다. 여기에는 Segmentation을 위한 의미론적 분할 손실(semantic segmentation loss) 및 다중 스케일 프로토 모듈, 고정밀 Pose 추정을 위한 RLE(Residual Log-Likelihood Estimation), 그리고 OBB의 경계 문제를 해결하기 위한 각도 손실 최적화 디코딩이 포함됩니다.
이러한 혁신들이 결합되어 작은 객체에 대해 더 높은 정확도를 달성하고 원활한 배포를 제공하며 CPU에서 최대 43% 더 빠르게 실행되는 모델 제품군을 제공합니다. 이로써 YOLO26은 리소스가 제한된 환경에서 가장 실용적이고 배포하기 좋은 YOLO 모델 중 하나가 되었습니다.
주요 특징
-
DFL 제거
DFL(Distribution Focal Loss) 모듈은 효과적이었지만, 종종 내보내기(export) 과정을 복잡하게 만들고 하드웨어 호환성을 제한했습니다. YOLO26은 DFL을 완전히 제거하여 추론을 단순화하고 엣지 및 저전력 장치에 대한 지원 범위를 넓혔습니다. -
엔드투엔드 NMS-Free 추론
별도의 후처리 단계로 NMS에 의존하는 기존 탐지기와 달리, YOLO26은 네이티브 엔드투엔드(natively end-to-end) 모델입니다. 예측이 직접 생성되므로 지연 시간이 줄어들고 프로덕션 시스템으로의 통합이 더 빠르고 가벼우며 신뢰성이 높아집니다. -
ProgLoss + STAL
향상된 손실 함수는 탐지 정확도를 높여주며, 특히 IoT, 로봇 공학, 항공 이미지 및 기타 엣지 애플리케이션에서 중요한 요구 사항인 소형 객체 인식 분야에서 괄목할 만한 개선을 보여줍니다. -
MuSGD 옵티마이저
SGD와 Muon을 결합한 새로운 하이브리드 옵티마이저입니다. Moonshot AI의 Kimi K2에서 영감을 받은 MuSGD는 LLM 학습의 고급 최적화 방법을 컴퓨터 비전에 도입하여 더 안정적인 학습과 더 빠른 수렴을 가능하게 합니다. -
최대 43% 더 빠른 CPU 추론
엣지 컴퓨팅을 위해 특별히 최적화된 YOLO26은 CPU 추론 속도를 크게 향상시켜 GPU가 없는 장치에서도 실시간 성능을 보장합니다. -
인스턴스 분할 강화
모델 수렴을 개선하기 위한 의미론적 분할 손실(semantic segmentation loss)을 도입했으며, 더 우수한 마스크 품질을 위해 다중 스케일 정보를 활용하는 업그레이드된 프로토 모듈을 적용했습니다. -
정밀한 Pose 추정
더 정확한 키포인트 위치 파악을 위해 RLE(Residual Log-Likelihood Estimation)를 통합하고 추론 속도 향상을 위해 디코딩 과정을 최적화했습니다. -
개선된 OBB 디코딩
사각형 객체에 대한 탐지 정확도를 높이기 위해 전문화된 각도 손실(angle loss)을 도입하고, 경계 불연속성 문제를 해결하기 위해 OBB 디코딩을 최적화했습니다.

지원되는 작업 및 모드
YOLO26은 이전 Ultralytics YOLO 릴리스에서 확립된 다목적 모델 범위를 기반으로 구축되어 다양한 컴퓨터 비전 작업 전반에 걸쳐 향상된 지원을 제공합니다:
| 모델 | 파일명 | 작업 | 추론(Inference) | 검증 | 학습 | 내보내기(Export) |
|---|---|---|---|---|---|---|
| YOLO26 | yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt | Detection | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | yolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.pt | Instance Segmentation | ✅ | ✅ | ✅ | ✅ |
| YOLO26-sem | yolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.pt | Semantic Segmentation | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | yolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt | Pose/Keypoints | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | yolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt | Oriented Detection | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | yolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt | Classification | ✅ | ✅ | ✅ | ✅ |
이 통합 프레임워크는 YOLO26이 실시간 탐지, 인스턴스 분할, 의미론적 분할, 분류, Pose 추정 및 방향성 객체 탐지 전반에 걸쳐 적용될 수 있도록 보장하며, 학습, 검증, 추론 및 내보내기 지원을 모두 포함합니다.
yolo26-p2.yaml 및 yolo26-p6.yaml은 P2(소형 객체) 또는 P6(대형 입력) 탐지 헤드를 추가하며, YAML 아키텍처로만 제공됩니다. 크기별 yolo26*-p2.pt 또는 yolo26*-p6.pt 가중치는 별도로 출시되지 않습니다. YAML에서 확장 구성(예: YOLO("yolo26n-p6.yaml"))을 인스턴스화하고 필요에 따라 학습하거나 미세 조정(fine-tune)하십시오.
성능 지표
See Detection Docs for usage examples with these models trained on COCO, which include 80 pretrained classes.
| 모델 | 크기 (픽셀) | mAPval 50-95 | mAPval 50-95(e2e) | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 40.1 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 47.8 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 52.5 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 54.4 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 56.9 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 |
Params 및 FLOPs 값은 Conv와 BatchNorm 레이어를 병합하고 보조적 일대다(one-to-many) 탐지 헤드를 제거한 model.fuse() 이후의 융합된 모델 기준입니다. 사전 훈련된 체크포인트는 전체 훈련 아키텍처를 유지하므로 더 높은 수치를 보일 수 있습니다.
사용 예시
이 섹션에서는 간단한 YOLO26 훈련 및 추론 예시를 제공합니다. 이러한 모드 및 기타 modes에 대한 전체 문서는 Predict, Train, Val 및 Export 문서 페이지를 참조하십시오.
Note that the example below is for YOLO26 Detect models for object detection. For additional supported tasks, see the Segment, Semantic Segmentation, Classify, OBB, and Pose docs.
Python에서 모델 인스턴스를 생성하기 위해 PyTorch 사전 훈련된 *.pt 모델과 구성 *.yaml 파일을 YOLO() 클래스에 전달할 수 있습니다:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")YOLO26은 다양한 배포 시나리오에 유연성을 제공하는 듀얼 헤드 아키텍처를 특징으로 합니다:
- 일대일(One-to-One) 헤드 (기본값): NMS 없이 엔드투엔드 예측을 생성하며, 이미지당 최대 300개의 탐지 결과를
(N, 300, 6)형태로 출력합니다. 이 헤드는 빠른 추론과 간소화된 배포에 최적화되어 있습니다. - 일대다(One-to-Many) 헤드: NMS 후처리가 필요한 기존 YOLO 출력을 생성하며,
(N, nc + 4, 8400)을 출력합니다(여기서nc는 클래스 수). 이 헤드는 일반적으로 추가적인 처리 비용을 대가로 약간 더 높은 정확도를 달성합니다.
내보내기(export), 예측(prediction) 또는 검증(validation) 중에 헤드를 전환할 수 있습니다:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg") # inference
metrics = model.val(data="coco.yaml") # validation
model.export(format="onnx") # export
# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False) # inference
metrics = model.val(data="coco.yaml", end2end=False) # validation
model.export(format="onnx", end2end=False) # export선택은 배포 요구사항에 따라 달라집니다. 최대 속도와 단순성이 필요하면 일대일 헤드를 사용하고, 정확도가 최우선인 경우에는 일대다 헤드를 사용하십시오.
YOLOE-26: 오픈 어휘 인스턴스 세그멘테이션
YOLOE-26은 고성능 YOLO26 아키텍처와 YOLOE 시리즈의 오픈 어휘 기능을 통합합니다. 이는 텍스트 프롬프트, 시각적 프롬프트 또는 제로샷 추론을 위한 프롬프트 없는 모드를 사용하여 모든 객체 클래스를 실시간으로 탐지하고 세그멘테이션할 수 있게 해주며, 고정된 카테고리 훈련의 제약을 효과적으로 제거합니다.
YOLO26의 NMS가 없는 엔드투엔드 설계를 활용하여 YOLOE-26은 빠른 오픈 월드 추론을 제공합니다. 이는 관심 객체가 광범위하고 진화하는 어휘를 나타내는 동적 환경의 엣지 애플리케이션을 위한 강력한 솔루션이 됩니다.
See YOLOE Docs for usage examples with these models trained on Objects365v1, GQA and Flickr30k datasets.
| 모델 | 크기 (픽셀) | 프롬프트 유형 | mAPminival 50-95(e2e) | mAPminival 50-95 | mAPr | mAPc | mAPf | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|---|---|
| YOLOE-26n-seg | 640 | 텍스트/시각 | 23.7 / 20.9 | 24.7 / 21.9 | 20.5 / 17.6 | 24.1 / 22.3 | 26.1 / 22.4 | 4.8 | 6.0 |
| YOLOE-26s-seg | 640 | 텍스트/시각 | 29.9 / 27.1 | 30.8 / 28.6 | 23.9 / 25.1 | 29.6 / 27.8 | 33.0 / 29.9 | 13.1 | 21.7 |
| YOLOE-26m-seg | 640 | 텍스트/시각 | 35.4 / 31.3 | 35.4 / 33.9 | 31.1 / 33.4 | 34.7 / 34.0 | 36.9 / 33.8 | 27.9 | 70.1 |
| YOLOE-26l-seg | 640 | 텍스트/시각 | 36.8 / 33.7 | 37.8 / 36.3 | 35.1 / 37.6 | 37.6 / 36.2 | 38.5 / 36.1 | 32.3 | 88.3 |
| YOLOE-26x-seg | 640 | 텍스트/시각 | 39.5 / 36.2 | 40.6 / 38.5 | 37.4 / 35.3 | 40.9 / 38.8 | 41.0 / 38.8 | 69.9 | 196.7 |
사용 예시
YOLOE-26은 텍스트 기반 프롬프트와 시각적 프롬프트를 모두 지원합니다. 프롬프트 사용 방법은 간단하며, 아래와 같이 predict 메서드를 통해 전달하면 됩니다:
텍스트 프롬프트를 사용하면 텍스트 설명을 통해 감지하려는 클래스를 지정할 수 있습니다. 다음 코드는 YOLOE-26을 사용하여 이미지에서 사람과 버스를 감지하는 방법을 보여줍니다:
from ultralytics import YOLO
# Initialize model
model = YOLO("yoloe-26l-seg.pt") # or select yoloe-26s/m-seg.pt for different sizes
# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])
# Run detection on the given image
results = model.predict("path/to/image.jpg")
# Show results
results[0].show()프롬프팅 기법, 처음부터 학습하는 방법 및 전체 사용 예시에 대한 자세한 내용은 **YOLOE 문서**를 방문해 주십시오.
인용 및 감사의 글
Ultralytics는 모델의 급격한 발전 속도로 인해 YOLO26에 대한 공식 연구 논문을 발표하지 않았습니다. 대신, 최첨단 모델을 제공하고 이를 쉽게 사용할 수 있도록 만드는 데 집중하고 있습니다. YOLO 기능, 아키텍처 및 사용법에 대한 최신 업데이트는 당사 GitHub 저장소 및 문서를 확인해 주십시오.
귀하의 작업에 YOLO26이나 다른 Ultralytics 소프트웨어를 사용하는 경우 다음과 같이 인용해 주십시오:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2026},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}DOI 대기 중. YOLO26은 AGPL-3.0 및 Enterprise 라이선스 하에 제공됩니다.
자주 묻는 질문(FAQ)
YOLO11과 비교했을 때 YOLO26의 주요 개선 사항은 무엇인가요?
- DFL 제거: 내보내기 과정을 단순화하고 엣지 호환성을 확장합니다.
- 종단간 NMS-Free 추론: NMS를 제거하여 더 빠르고 단순한 배포를 가능하게 합니다.
- ProgLoss + STAL: 정확도, 특히 소형 객체에 대한 정확도를 향상시킵니다.
- MuSGD 옵티마이저: SGD와 Muon(Moonshot의 Kimi K2에서 영감)을 결합하여 더 안정적이고 효율적인 학습을 지원합니다.
- 최대 43% 더 빠른 CPU 추론: CPU 전용 장치에서 상당한 성능 향상을 제공합니다.
YOLO26은 어떤 작업을 지원하나요?
YOLO26은 통합 모델 제품군으로, 여러 컴퓨터 비전 작업에 대한 종단간 지원을 제공합니다:
각 크기 변형(n, s, m, l, x)은 모든 작업을 지원하며, YOLOE-26을 통해 오픈 어휘 버전도 제공합니다.
왜 YOLO26은 엣지 배포에 최적화되어 있나요?
YOLO26은 다음과 같은 기능으로 최첨단 엣지 성능을 제공합니다:
- 최대 43% 더 빠른 CPU 추론
- 모델 크기 및 메모리 점유율 감소
- 호환성을 위해 간소화된 아키텍처 (DFL 없음, NMS 없음)
- TensorRT, ONNX, CoreML, TFLite 및 OpenVINO를 포함한 유연한 내보내기 형식
YOLO26은 어떻게 시작합니까?
YOLO26 모델은 2026년 1월 14일에 출시되었으며 다운로드할 수 있습니다. ultralytics 패키지를 설치하거나 업데이트하고 모델을 로드하십시오:
from ultralytics import YOLO
# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("image.jpg")학습, 검증 및 내보내기 지침은 Usage Examples 섹션을 참조하십시오.