YOLO . YOLO26: 실시간 객체 탐지를 위한 기술적 대결
컴퓨터 비전의 진화는 효율성, 속도, 정확성에 대한 끊임없는 추구로 이끌려 왔습니다. 이 분야에서 두드러진 두 가지 이름은 알리바바 그룹이 개발한YOLO Ultralytics 최신 버전인 최첨단 YOLO26입니다.YOLO 2022년 신경망 아키텍처 검색(NAS) 분야에서 중대한 혁신을YOLO , YOLO26은 2026년 에지 배포와 생산 확장성을 위해 맞춤 설계된 엔드투엔드 방식의 NMS(Neighborhood Multi-Scale) 프리 설계로 해당 분야를 재정의하고 있습니다.
이 가이드는 두 모델의 아키텍처, 성능 지표 및 실제 적용 분야에 대한 적합성을 비교하여 심층적인 기술적 분석을 제공합니다.
YOLO: 신경망 아키텍처 검색 혁신
알리바바의 DAMO 아카데미에서 개발한 YOLO (Distillation-Enhanced Neural Architecture Search-based YOLO)는 특정 지연 시간 제약 조건 하에서 성능을 극대화하기 위해 탐지 백본의 설계를 자동화하는 데 중점을 둡니다.
주요 아키텍처 기능
YOLO 여러 첨단 기술을 통해YOLO :
- 신경망 구조 탐색(NAS): 수동으로 설계된 백본(예: CSPDarknet)과 달리,YOLO MAE-NAS(효율적인 신경망 구조 탐색 자동화 방법)YOLO 최적의 구조를 발견합니다. 이를 통해 부동소수점 연산(FLOPs)과 정확도 간의 균형을 고려하여 특별히 조정된 네트워크 토폴로지를 구현합니다.
- RepGFPN: 일반화된 특징 피라미드 네트워크(GFPN)와 재매개변수화를 결합한 헤비넥(heavy neck) 설계입니다. 이를 통해 서로 다른 스케일 간 효율적인 특징 융합이 가능해져 다양한 크기의 물체 탐지 성능이 향상됩니다.
- ZeroHead: 추론 중 계산 부담을 줄이는 단순화된 탐지 헤드.
- AlignedOTA: 훈련 중 분류 및 회귀 작업 간의 불일치를 해결하는 동적 레이블 할당 전략입니다.
성능 및 제한 사항
YOLO 2022년 획기적인 발전을YOLO , 이전 버전들인 YOLOv6 및 YOLOv7 보다 우수한 성능을 보였습니다. 그러나 복잡한 훈련 파이프라인, 특히 대규모 교사 모델을 활용한 증류 단계가 필요하다는 점은 맞춤형 데이터셋에서 신속한 반복 작업이 필요한 개발자들에게 부담이 될 수 있습니다. 또한 RepGFPN이 강력하지만, 간소화된 현대적 아키텍처에 비해 메모리 집약적일 수 있습니다.
YOLO 세부 정보:
- 저자: 쉬셴저, 장이치, 천웨이화, 황이룬, 장위안, 쑨시위
- 조직: 알리바바 그룹
- 날짜: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: YOLO
Ultralytics : 엔드투엔드 엣지 혁명
2026년 1월 출시된 Ultralytics YOLOv8 과 YOLO11의 유산을 계승하면서 탐지 처리 방식에 근본적인 변화를 가져왔습니다. 이 모델은 높은 벤치마크 점수뿐만 아니라 클라우드 서버부터 리소스가 제한된 IoT 기기에 이르기까지 모든 환경에서 실용적이고 원활한 배포를 위해 설계되었습니다.
혁신적인 건축
YOLO26은 기존 앵커 기반 또는 앵커 프리 탐지기와 차별화되는 여러 첨단 발전을 통합합니다:
- 엔드투엔드 NMS 설계: 아마도 가장 중요한 변화는 비최대 억제(NMS)의 제거일 것이다. 훈련 중 일대일 매칭 전략을 채택함으로써( YOLOv10에서 최초로 제안됨)을 통해 모델이 최종 예측을 직접 출력합니다. 이는 혼잡한 장면에서 병목 현상이 되는 NMS 인한 지연 시간 변동을 제거합니다.
- MuSGD 최적화기: Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM) 훈련의 혁신에서 영감을 받아, YOLO26은 SGD 결합한 하이브리드 최적화기를 활용합니다. 이는 컴퓨터 비전 훈련에 전례 없는 안정성을 제공하여 더 빠른 수렴을 이끌어냅니다.
- DFL 제거: 분포 초점 손실(Distribution Focal Loss)을 제거함으로써 출력 레이어가 단순화됩니다. 이로 인해 ONNX 및 TensorRT 으로의 내보내기가 훨씬 깔끔해져, 에지 디바이스 및 저전력 마이크로컨트롤러와의 호환성이 크게 향상됩니다.
- ProgLoss + STAL: 프로그레시브 손실(Progressive Loss)과 소프트 타겟 앵커 라벨링(STAL)의 통합은 항공 이미지와 로봇 공학에 필수적인 소형 물체 탐지 성능을 획기적으로 향상시킵니다.
배치 우위
YOLO26은 속도를 위해 설계되었습니다. 이전 세대에 비해 최대 43% 더 빠른 CPU 제공하여 라즈베리 파이, 모바일 CPU 또는 Intel PC에서 실행되는 애플리케이션에 이상적인 선택입니다.
YOLO26 세부 사항:
- 저자: 글렌 조커와 징 치우
- 조직: Ultralytics
- 날짜: 2026-01-14
- 문서: YOLO26 문서
- GitHub: ultralytics
비교 성능 분석
다음 표는 다양한 모델 크기에서YOLO YOLO26의 성능을 비교합니다. YOLO26은 특히 NMS 두드러지는 CPU 훨씬 낮은 지연 mAP 동등하거나 더 나은 mAP 달성하며 우수한 효율성을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
지연 시간 이점
The CPU ONNX 속도는 NMS 설계의 막대한 이점을 보여줍니다. 후처리 단계를 제거함으로써 YOLO26은 추론 시간이 결정론적이고 지속적으로 낮게 유지되도록 보장하며, 이는 실시간 영상 분석에 매우 중요합니다.
Ultralytics 이점
YOLO 아키텍처 탐색에 대한 흥미로운 학술적 통찰을YOLO 반면, Ultralytics 현대적인 개발 워크플로우를 위해 설계된 종합적인 솔루션을 제공합니다.
1. 사용 편의성과 생태계
YOLO 증류 기반 훈련은 복잡성으로 인해 진입 장벽이 될 수 있습니다. 반면 Ultralytics "초보자도 전문가처럼" 사용할 수 있는 경험을 Ultralytics . 통합된 Python 통해 개발자는 단 몇 분 만에 모델을 로드하고, 훈련시키고, 배포할 수 있습니다. Ultralytics 클라우드 훈련, 데이터셋 관리, 자동 주석 도구를 제공함으로써 이 과정을 더욱 간소화합니다.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100)
2. 작업 다용도성
YOLO 주로 객체 탐지YOLO . 반면 Ultralytics 다중 작업의 핵심입니다. 단일 프레임워크가 다음을 지원합니다:
- 인스턴스 세그멘테이션: 의미적 세그멘테이션 손실과 같은 작업 특화 개선 사항 포함.
- 자세 추정: 고정밀 키포인트를 위한 잔차 로그우도 추정(RLE) 활용
- OBB: 방향성 경계 상자(Oriented Bounding Boxes)를 위한 특수 각도 손실, 위성 영상 분석에 필수적입니다.
- 분류: 고속 이미지 분류.
3. 훈련 효율성과 기억력
YOLO26은 소비자용 하드웨어에 최적화되어 있습니다. MuSGD 최적화기 같은 기법은 메모리 집약적인 트랜스포머 하이브리드나 구형 NAS 아키텍처에 비해 더 큰 배치 크기로도 안정적인 훈련을 가능하게 합니다. 이러한 AI 훈련의 대중화는 최첨단 모델을 미세 조정하기 위해 기업용 H100 클러스터가 필요하지 않음을 의미합니다.
이상적인 사용 사례
적합한 모델 선택은 특정 제약 조건에 따라 달라지지만, 대부분의 생산 환경에서는 YOLO26이 최고의 투자 대비 효과를 제공합니다.
- YOLO 선택하십시오: 신경망 구조 탐색(Neural Architecture Search) 방법론을 특별히 연구하는 연구자이거나 tinyvision 코드베이스를 기반으로 구축된 기존 파이프라인을 보유하고 있는 경우.
- 다음과 같은 경우 Ultralytics 선택하십시오:
결론
YOLO YOLO26은 모두 객체 탐지에서 중요한 이정표를 나타냅니다.YOLO 자동화된 아키텍처 탐색의 잠재력을YOLO 2022년 당시 가능성의 한계를 뛰어넘었습니다. 그러나 YOLO26은 2026년 이후를 위한 확실한 선택지입니다. NMS 현상을 해결하고 CPU 최적화하며 MuSGD와 같은 고급 훈련 기법을 통합함으로써, Ultralytics 더 빠르고 정확할 뿐만 아니라 사용이 훨씬 용이한 모델을 Ultralytics .
개발자가 견고하고 미래에도 대응 가능한 컴퓨터 비전 애플리케이션을 구축하고자 할 때, Ultralytics 성공에 필요한 도구, 모델 및 지원을 제공합니다.
다른 고성능 아키텍처를 탐구하고자 하는 분들은 다음을 살펴보시기 바랍니다. YOLO11 를 살펴보거나 RT-DETR 트랜스포머 기반 애플리케이션용으로 살펴보시기 바랍니다.