YOLO11 YOLO26: 실시간 객체 탐지의 진화

컴퓨터 비전 분야는 끊임없이 변화하고 있으며, 새로운 모델이 등장할 때마다 속도, 정확도, 사용성의 한계를 넓혀가고 있습니다. 이 여정에서 두 가지 중요한 이정표는 YOLO11 과 획기적인 YOLO26입니다. YOLO11 2024년 말 기업 배포를 위한 견고한 기준을 YOLO11 , YOLO26은 네이티브 엔드투엔드 아키텍처와 CPU 설계로 패러다임 전환을 이루었습니다.

이 가이드는 개발자, 연구원 및 엔지니어가 특정 컴퓨터 비전 애플리케이션에 적합한 도구를 선택할 수 있도록 포괄적인 기술 비교를 제공합니다.

요약: 주요 차이점

두 모델 모두 YOLO You Only Look Once) 계열의 기초 원리를 바탕으로 구축되었지만, 아키텍처 철학 측면에서는 상당히 차이가 있습니다.

YOLO11: 다용도성과 생태계 통합을 위해 설계되었습니다. 비최대 억제(NMS)와 같은 전통적인 후처리 기법에 의존하지만, 다양한 작업에 대해 매우 안정적이고 잘 지원되는 프레임워크를 제공합니다.
YOLO26: 에지 컴퓨팅과 미래 대비를 위해 설계되었습니다. 복잡한 후처리 단계를 제거하는 네이티브 엔드투엔드 NMS( NMS) 설계를 도입했습니다. 혁신적인 MuSGD 최적화기를 탑재했으며, 특히 CPU 위해 특별히 설계되어 라즈베리 파이 같은 장치에서 최대 43% 더 빠른 성능을 제공합니다.

상세한 성능 분석

세대 간 성능 차이는 종종 밀리초 단위와 평균 정밀도(mAP) 백분율 포인트로 측정됩니다. 아래 표는 속도와 정확도 향상을 보여줍니다. 특히 YOLO26의 CPU 시간이 크게 감소한 점을 주목하십시오. 이는 엣지 AI 배포에 있어 핵심 지표입니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLO11: 다재다능한 표준

YOLO11
저자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2024-09-27
GitHub: Ultralytics

YOLO11 YOLO 주요 YOLO11 , 특징 추출 효율성에 중점을 두었습니다. 이는 YOLOv8 보다 C3k2 블록을 최적화하고 SPPF(Superimposed Pixel Pooling Filter) 개선 사항을 도입함으로써 성능을 향상시켰습니다.

강점:

검증된 견고성: 산업계에서 널리 채택되었으며, 방대한 커뮤니티 플러그인과 지원을 제공합니다.
GPU : NVIDIA (T4, A100)에서 TensorRT를 사용하여 매우 높은 효율성 구현 TensorRT를 사용하여 클라우드 기반 추론에 탁월합니다.
작업 다용도성: 탐지, 분할 및 자세 추정에 걸쳐 우수한 성능을 발휘합니다.

약점:

NMS : 비최대 억제(NMS) 후처리가 필요하며, 이는 지연 변동성을 유발하고 배포 파이프라인을 복잡하게 만들 수 있습니다.
더 높은 FLOPs: 최신 아키텍처보다 계산 비용이 약간 더 높습니다.

YOLO11에 대해 자세히 알아보세요

YOLO26: 가장 먼저 혁신을 주도하는 기업

YOLO26
저자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2026-01-14
GitHub: Ultralytics

YOLO26은 상용 하드웨어에서 효율성을 최우선으로 하는 미래 지향적 아키텍처입니다. NMS 신경망 관리 시스템)의 필요성을 제거하고 CPU 세트를 최적화함으로써, 기존에는 현대 AI에 너무 느리다고 여겨졌던 장치에서도 실시간 성능을 구현합니다.

주요 혁신:

엔드투엔드 NMS 프리: 일대일 매칭을 직접 예측함으로써 YOLO26은 NMS 현상을 제거합니다. 이는 ONNX 또는 CoreML 내보내기를 CoreML 단순화합니다.
DFL 제거: 분산 초점 손실 제거는 출력 헤드를 간소화하여 저전력 에지 장치와의 호환성을 향상시킵니다.
MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법(특히 Moonshot AI의 Kimi K2)에서 영감을 받은 이 하이브리드 최적화기는 SGD 과 뮤온(Muon)을 결합하여 더 빠른 수렴성과 안정성을 제공합니다.
ProgLoss + STAL: 새로운 손실 함수가 소형 물체 탐지 성능을 향상시킵니다. 이는 항공 촬영 및 로봇 공학 분야에서 핵심적인 요구 사항입니다.

YOLO26에 대해 더 알아보기

심층적인 아키텍처 분석

YOLO11 전환은 단순히 매개변수 수의 문제가 아닙니다. 이는 모델이 학습하고 예측하는 방식에 대한 근본적인 변화입니다.

훈련 방법론과 효율성

Ultralytics 두드러진 특징 중 하나는 훈련 효율성입니다. 두 모델 모두 통합 Ultralytics 혜택을 받으며, 이를 통해 원활한 데이터셋 관리와 클라우드 훈련이 가능합니다.

그러나 YOLO26은 표준 SGD 시각 모델의 복잡한 손실 지형을 더 효과적으로 처리하기 위해 모멘텀 업데이트를 조정하는 MuSGD 최적화기를 도입합니다. 이로 인해 모델이 더 빠르게 수렴하여 귀중한 GPU 시간을 절약하고 훈련 과정의 탄소 발자국을 줄입니다.

또한 YOLO26은 개선된 작업별 손실 함수를 활용합니다:

세분화: 향상된 의미적 세분화 손실 및 다중 스케일 프로토 모듈.
Pose: 잔차 로그우도 추정(RLE)을 통한 보다 정확한 키포인트 위치 추정.
OBB: 방향성 경계 상자(Oriented Bounding Box ) 작업에서 경계 불연속성을 해결하기 위한 특수 각도 손실

메모리 요구 사항

Ultralytics YOLO Transformer 기반 아키텍처와 비교해 메모리 사용량이 적은 것으로 유명합니다. RT-DETR 이나 SAM 같은 트랜스포머 기반 아키텍처에 비해 낮은 메모리 사용량으로 유명합니다.

메모리 최적화

YOLO11 소비자용 GPU(예: NVIDIA 3060 또는 4070)에서 훈련하도록 설계되었습니다. 24GB 이상의 VRAM을 요구하는 대규모 트랜스포머 모델과 달리, 효율적인 YOLO 적절한 배치 크기를 사용하여 8GB VRAM만 있는 장치에서도 종종 미세 조정될 수 있습니다.

실제 사용 사례

YOLO11 YOLO26 사이의 선택은 종종 배포 하드웨어와 특정 애플리케이션 요구사항에 따라 결정됩니다.

YOLO11의 이상적인 시나리오

클라우드 API 서비스: 강력한 GPU를 활용할 수 있으며, 단일 이미지 처리 지연 시간보다 높은 처리량(배치 처리)이 더 중요한 경우.
레거시 통합: NMS 파이프라인을 중심으로 구축된 기존 시스템으로, 후처리 로직 변경이 불가능한 경우.
범용 분석: 표준 GPU 활용하는 소매점 히트맵 분석 또는 고객 계수.

YOLO26의 이상적인 시나리오

IoT 및 에지 디바이스: 라즈베리 파이, NVIDIA 나노 또는 모바일 폰에서 객체 감지 실행. 43%의 CPU 여기서 판도를 바꿀 만한 성과입니다.
로봇공학: 제어 루프에 있어 지연 시간 변동은 치명적이다. NMS 설계는 자율 주행에 필수적인 결정론적 추론 시간을 보장한다.
항공 측량: ProgLoss 함수는 소형 물체 인식 능력을 크게 향상시켜, 드론 영상 분석에 YOLO26이 탁월한 성능을 발휘하게 합니다.
임베디드 시스템: NMS(네트워크 관리 시스템) 실행 중 수천 개의 후보 박스를 정렬하는 오버헤드를 감당할 수 없는 제한된 연산 능력을 가진 장치들.

코드 구현

두 모델 모두 Ultralytics 정의하는 동일한 사용 편의성을 공유합니다. YOLO11 전환하려면 모델 문자열만 변경하면 됩니다.

from ultralytics import YOLO

# Load the latest YOLO26 model (NMS-free, CPU optimized)
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Process results
for result in results:
    result.show()  # Display to screen
    result.save(filename="result.jpg")  # Save to disk

이 통합된 API는 개발자가 전체 코드베이스를 다시 작성하지 않고도 다양한 아키텍처를 실험할 수 있도록 보장합니다.

결론

두 아키텍처 모두 Ultralytics 오픈소스 컴퓨터 비전 분야의 선두주자로 Ultralytics 있는 이유를 보여줍니다. YOLO11 은 기업 데이터 센터에 완벽한 성숙하고 다재다능하며 GPU 솔루션을 제공합니다. 반면 YOLO26은 에지 AI의 미래를 대표하며, 전통적인 병목 현상을 제거한 간소화된 엔드투엔드 파이프라인과 함께 놀라울 정도로 빠른 CPU 제공합니다.

대부분의 신규 프로젝트—특히 에지 배포, 모바일 앱 또는 로봇 공학 관련 프로젝트—에서는 우수한 속도 대비 정확도 비율과 현대적인 아키텍처 설계로 인해YOLO26이 권장 선택입니다.

살펴볼 다른 모델

YOLOv10: YOLO NMS(Neighborhood Multi-Scale) NMS 접근법의 선구자.
RT-DETR: 변압기 기반 검출기로, 속도가 부차적인 상황에서 높은 정확도를 제공합니다.
YOLOv8: 방대한 리소스 라이브러리 덕분에 여전히 널리 사용되는 매우 신뢰할 수 있는 클래식 모델입니다.