YOLOv5 YOLO26: 실시간 객체 탐지의 진화
물체 탐지 기술의 진화는 속도, 정확도, 사용 편의성 측면에서 상당한 도약을 이루었습니다. 본 비교 분석은 YOLOv5, 비전 AI를 대중화시킨 전설적인 모델과 차세대 엣지 효율성과 엔드투엔드 성능을 위해 Ultralytics 최신 최첨단 아키텍처인 YOLO26을 비교 분석합니다.
두 모델 모두 컴퓨터 비전 역사에서 중대한 전환점을 상징합니다. YOLOv5 2020년 사용성과 커뮤니티 채택의 YOLOv5 , YOLO26은 2026년 엔드투엔드 NMS 아키텍처, 대규모 언어 모델(LLM)에서 영감을 받은 최적화, 그리고 타의 추종을 불허하는 CPU 새로운 지평을 열었습니다.
YOLOv5: 커뮤니티가 가장 선호하는 모델
YOLOv5 2020년 6월 Ultralytics 출시된 YOLOv5는 PyTorch 네이티브 개발로의 전환을 알렸습니다. 성능뿐만 아니라 비교할 수 없는 사용 편의성으로 유명세를 타며, 전 세계 개발자와 연구자들에게 고급 컴퓨터 비전 기술을 쉽게 접할 수 있게 했습니다.
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜:26
- GitHub:https://github.com/ultralytics/yolov5
- 문서:5
아키텍처 및 강점
YOLOv5 AI의 "사용자 경험"에 초점을 맞춘 간소화된 아키텍처를 YOLOv5 . CSP-Darknet53 백본과 경로 집계 네트워크(PANet) 넥을 활용하여 서로 다른 스케일 간 특징 전파를 개선했습니다.
주요 기능은 다음과 같습니다:
- 모자이크 데이터 증강: 네 장의 이미지를 하나로 결합하는 훈련 기법으로, 모델의 detect 객체 detect 능력과 새로운 환경에 대한 일반화 능력을 크게 향상시킵니다.
- 자동 학습 앵커 박스: 모델은 훈련 시작 전에 사용자 지정 데이터셋에 대한 최적의 앵커 박스 크기를 자동으로 학습합니다.
- 배포 용이성: ONNX, CoreML, TFLite 덕분에 모바일 및 에지 애플리케이션의 필수 선택지가 되었습니다.
YOLO26: 효율성의 새로운 기준
2026년 1월 출시된 YOLO26은 전작들의 유산을 계승하면서도 근본적인 아키텍처 변화를 도입했습니다. 최근 몇 년간 달성한 정확도 향상을 저해하지 않으면서 CPU 속도를 최우선으로 하는, 진정한 '에지 우선' 모델로 설계되었습니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜:14
- GitHub:https://github.com/ultralytics/ultralytics
- 문서:ultralytics
혁신적인 기능
YOLO26은 기존 YOLOv5 차별화되는 여러 첨단 혁신 기술을 통합합니다:
- 네이티브 엔드투엔드(NMS): 후처리 과정에서 중첩된 박스를 필터링하기 위해 비최대 억제(NMS)가 필요한 YOLOv5 달리, YOLO26은 네이티브 엔드투엔드 방식입니다. 이는 NMS 인한 지연 시간 변동을 제거하여 로봇공학 및 자율주행 분야의 실시간 제어 시스템에 필수적인 일관된 추론 시간을 보장합니다.
- MuSGD 최적화기: Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM)의 훈련 안정성에서 영감을 받아, YOLO26은 SGD 결합한 하이브리드 최적화기를 활용합니다. 이는 LLM의 수렴 특성을 비전 작업에 적용합니다.
- DFL 제거: 분산 초점 손실(Distribution Focal Loss)을 제거함으로써 모델 구조가 단순화되어, 더 깔끔한 출력 결과와 저전력 에지 디바이스 및 Coral Edge TPU 같은 가속기와의 향상된 호환성을 제공합니다.
- ProgLoss + STAL: 새로운 손실 함수(ProgLoss 및 STAL)는 많은 실시간 탐지기의 전통적인 약점인 소형 물체 인식에서 상당한 개선을 제공합니다.
성능 균형
YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 제공하면서도 높은 정확도를 유지하는 놀라운 균형을 달성합니다. 이는 GPU 부족하거나 사용할 수 없는 장치에 이상적입니다.
기술 비교: 성능 지표
다음 표는 YOLOv5 성능 차이를 보여줍니다. YOLOv5 유능한 모델인 반면, YOLO26은 모든 모델 규모에서 더 뛰어난 효율성과 정확도를 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
참고: CPU ONNX)에서 YOLO26의 극적인 속도 향상은 간소화된 아키텍처와 복잡한 후처리 단계의 제거 덕분입니다.
학습 방법론 및 생태계
Ultralytics 선택의 주요 장점은 공유 생태계입니다. YOLOv5 전환은 두 모델 모두 동일한 생태계에서 지원되므로 원활하게 이루어집니다. ultralytics Python Ultralytics Platform.
사용 편의성 및 API
두 모델 모두 AI 라이프사이클 전체를 단순화하는 통합 API를 활용합니다. CLI 를 사용하든 Python 사용 CLI 구문은 직관적으로 유지됩니다.
from ultralytics import YOLO
# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt") # Switch to 'yolov5s.pt' seamlessly
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
교육 효율성
YOLOv5 효율적인 훈련의 기준을 제시하며, GPU 극대화하는 'AutoBatch' 같은 기능을 도입했습니다. YOLO26은 MuSGD 최적화기를 통해 이를 한 단계 발전시켰습니다. 훈련 동역학을 안정화함으로써 YOLO26은 종종 더 빠르게 수렴하여 최고 정확도에 도달하는 데 필요한 에포크 수가 줄어듭니다. 이는 연구자들에게 클라우드 컴퓨팅 비용 절감과 더 빠른 반복 주기로 이어집니다.
또한 YOLO26의 메모리 요구량 감소로 인해 소비자용 하드웨어에서 트랜스포머 기반 아키텍처(예: RT-DETR와 같은 트랜스포머 중심 아키텍처에 비해 더 큰 배치 크기를 사용할 수 있게 합니다
실제 응용 분야
이러한 모델 간의 선택은 종종 배포 하드웨어와 특정 사용 사례 요구 사항에 따라 달라집니다.
엣지 컴퓨팅과 사물인터넷
라즈베리 파이 또는 휴대폰에서 실행되는 애플리케이션의 경우 YOLO26이 확실한 승자입니다. 최대 43% 빠른 CPU 속도와 NMS 제거로 스마트 주차 관리나 휴대용 재고 스캐닝 같은 작업에서 놀라울 정도로 반응성이 NMS . 분포 초점 손실(DFL) 제거로 마이크로컨트롤러용 정수 양자화 변환도 단순화되었습니다.
로봇공학 및 자율 시스템
로봇공학에서 지연 시간 일관성은 핵심 요소입니다. YOLO26의 종단 간 NMS 설계는 추론 시간이 결정론적임을 보장하여 장면이 복잡해질 NMS 발생하는 가변적 처리 시간을 방지합니다. 이러한 신뢰성은 자율 주행 및 충돌 회피 시스템에 매우 중요합니다.
레거시 시스템 지원
YOLOv5YOLOv5 중심으로 배포 파이프라인이 이미 엄격하게 정의된 레거시 시스템(예: 구형 FPGA 비트스트림이 요구하는 특정 tensor )에서는 여전히 강력한 선택지입니다. 방대한 커뮤니티 지원과 수년간의 실전 검증을 거친 덕분에 거의 모든 특수 사례에 대한 해결책이 포럼과 GitHub 이슈에서 쉽게 찾아볼 수 있습니다.
다용도성: 탐지를 넘어
YOLOv5 후속 버전(v7.0)에서 분할 기능을 지원하도록 YOLOv5 반면, YOLO26은 처음부터 다중 작업 학습 모델로 설계되었습니다.
- 인스턴스 분할: YOLO26은 의미적 분할 손실 및 다중 스케일 프로토 모듈과 같은 작업 특화 개선 사항을 포함하여 의료 영상 분석과 같은 작업에서 마스크 품질을 향상시킵니다.
- 자세 추정: 잔차 로그 가능도 추정(RLE)을 통해 YOLO26은 스포츠 분석 분야에서 인간 자세 추정에 대한 우수한 키포인트 정확도를 제공합니다.
- 방향성 경계 상자(OBB): 항공 촬영 이미지와 위성 데이터의 경우, YOLO26의 특수 각도 손실 함수는 회전된 물체 탐지에서 흔히 발생하는 경계 문제를 해결하여 OBB 작업에 탁월한 성능을 발휘합니다.
결론
YOLOv5 YOLO26 모두 Ultralytics AI를 쉽고 빠르며 정확하게 만드는 데 Ultralytics 보여줍니다. YOLOv5 은 여전히 업계에서 막대한 영향력을 가진 클래식하고 신뢰할 수 있는 핵심 모델입니다. 그러나 2026년 신규 프로젝트를 위해서는 YOLO26이 매력적인 업그레이드 경로를 제공합니다.
NMS 필요 없는 설계, MuSGD 최적화기, 탁월한 CPU 갖춘 YOLO26은 단순한 점진적 업데이트가 아닌 엣지 AI의 도약입니다. Ultralytics 탐지, 분할, 자세 추정, 분류를 하나의 효율적인 프레임워크로 통합함으로써 개발자들이 미래의 컴퓨터 비전 과제를 오늘 해결할 수 있는 최적의 도구를 확보 Ultralytics .
다른 현대적 아키텍처를 탐구하고자 하는 개발자들을 위해, YOLO11 모델도 뛰어난 성능을 제공하지만, 속도와 차세대 기능의 균형으로 인해 YOLO26이 최우선 추천 모델입니다.