Link to this sectionYOLOv5 대 YOLO11#
새로운 프로젝트를 위한 올바른 컴퓨터 비전 아키텍처를 선택할 때는 최신 모델의 진화 과정을 이해하는 것이 매우 중요합니다. 초기 아키텍처에서 현대적인 통합 프레임워크로의 발전은 알고리즘 효율성과 개발자 경험 측면에서 모두 상당한 도약을 이뤄냈습니다. 본 가이드는 Ultralytics가 개발한 두 가지 획기적인 모델인 선구적인 YOLOv5와 매우 정교해진 YOLO11을 심도 있게 기술적으로 비교합니다.
Link to this section모델 소개#
두 아키텍처 모두 실시간 객체 탐지 분야에서 중요한 이정표를 제시하며, 배포 환경 및 기존 요구 사항에 따라 각기 다른 장점을 제공합니다.
Link to this sectionYOLOv5: 업계의 핵심 모델#
2020년 여름에 출시된 YOLOv5는 네이티브 PyTorch 구현을 통해 학습 및 배포의 진입 장벽을 대폭 낮추며 빠르게 업계 표준으로 자리 잡았습니다. 이는 이전 모델의 복잡한 Darknet C 프레임워크에서 벗어나 모델 구축에 대한 Pythonic한 접근 방식을 제공했습니다.
- 저자: Glenn Jocher
- 조직: Ultralytics
- 날짜: 2020-06-26
- GitHub: ultralytics/yolov5
- 문서: YOLOv5 문서
YOLOv5는 사용 편의성에 대한 강력한 기준을 확립했으며, 고급 모자이크 데이터 증강 및 자동 앵커링(auto-anchoring)을 포함한 강력한 학습 방법론을 도입했습니다. 잘 문서화되고 철저하게 테스트된 코드베이스를 기반으로 개발하는 연구자들 사이에서 여전히 매우 인기가 높습니다.
Link to this sectionYOLO11: 통합 비전 프레임워크#
수년간의 피드백과 아키텍처 연구를 바탕으로 도입된 YOLO11은 다중 비전 작업을 네이티브로 처리할 수 있는 통합 프레임워크의 일부입니다. 단순한 경계 상자(bounding box)를 넘어, 최대의 다재다능함과 효율성을 위해 처음부터 설계되었습니다.
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: ultralytics/ultralytics
- 문서: YOLO11 문서
YOLO11은 ultralytics Python 패키지를 통해 간소화된 사용자 경험을 제공하며, 객체 탐지, 인스턴스 세그멘테이션, 분류, 자세 추정 및 회전 경계 상자(OBB)를 통합하는 단순한 API를 자랑합니다. 속도와 정확도 간에 매우 유리한 균형을 달성하여 다양한 실제 배포 시나리오에 이상적입니다.
두 모델 모두 Ultralytics Platform에서 제공하는 잘 관리된 생태계의 이점을 누릴 수 있습니다. 이 통합 환경은 데이터셋 라벨링, 클라우드 학습 및 다양한 하드웨어 대상에 대한 모델 내보내기를 간소화합니다.
Link to this section성능 및 지표 비교#
이 모델들을 직접 비교해 보면 아키텍처의 개선이 어떻게 실질적인 성능 향상으로 이어지는지 알 수 있습니다. 아래 표는 COCO dataset에서 평가된 평균 정밀도(mAP)와 함께 CPU 및 GPU 추론 속도와 파라미터 수를 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this section결과 분석#
지표들을 보면 YOLO11이 달성한 성능 균형의 확실한 도약을 알 수 있습니다. 예를 들어, YOLO11n(nano) 모델은 YOLOv5n의 28.0% 대비 39.5%의 mAP를 달성하면서도 ONNX를 통해 내보낼 때 CPU 추론 시간을 단축합니다. 또한 YOLO11은 무거운 Transformer 기반 모델과 비교하여 학습 중 메모리 요구 사항을 훨씬 낮게 유지하므로 소비자용 하드웨어 및 에지 장치에 배포하기가 매우 용이합니다.
Link to this section아키텍처 차이점#
YOLO11의 성능 향상은 몇 가지 주요 아키텍처 진화에서 비롯됩니다. YOLOv5가 C3 모듈이 포함된 표준 CSPNet 백본을 사용한 반면, YOLO11은 C2f 및 이후의 C3k2와 같은 더 효율적인 특징 추출 블록을 도입하여 그래디언트 흐름을 최적화하고 연산 오버헤드를 줄였습니다.
또한 YOLO11은 크게 개선된 헤드 구조를 특징으로 합니다. 이전 모델들의 앵커 기반 설계에서 벗어나, 새로운 Ultralytics 아키텍처는 앵커 프리(anchor-free) 접근 방식을 채택합니다. 이는 상자 예측 수를 줄여 후처리 파이프라인을 간소화하고 다양한 크기와 종횡비에 걸쳐 모델의 일반화 능력을 향상시킵니다. 또한 이러한 모델은 우수한 학습 효율성을 자랑하며, 미세 조정된 데이터셋의 수렴을 가속화하는 사전 학습된 가중치를 바로 사용할 수 있습니다.
Link to this section구현 및 코드 예제#
Ultralytics 생태계의 눈에 띄는 특징 중 하나는 단순성입니다. YOLOv5가 빠른 추론을 위해 torch.hub 사용을 대중화했다면, YOLO11은 통합된 ultralytics Python 패키지로 이를 한 단계 더 발전시켰습니다.
Link to this sectionYOLO11로 학습하기#
모델을 로드하고 학습 및 검증하는 데 필요한 상용구(boilerplate) 코드는 최소화되었습니다. API가 하이퍼파라미터 튜닝과 모델 관리를 원활하게 처리합니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")
# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")Link to this sectionYOLOv5를 사용한 레거시 추론#
기존 파이프라인을 유지 관리하는 경우, YOLOv5는 PyTorch의 기본 로딩 메커니즘과 직접 통합되므로 기존 추론 스크립트에 간단히 삽입할 수 있습니다.
import torch
# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")
# Print prediction details to the console
results.print()Both models support extensive export formats. Whether you are targeting an NVIDIA Jetson using TensorRT or an iOS application using CoreML, the deployment process is thoroughly documented and supported by the community.
Link to this section이상적인 사용 사례#
이 모델들 중 하나를 선택하는 것은 프로젝트의 수명 주기 단계와 특정 요구 사항에 따라 크게 달라집니다.
Link to this sectionYOLOv5를 선택해야 하는 경우#
- 레거시 코드베이스 유지 관리: 프로덕션 환경이 YOLOv5 리포지토리 구조나 특정 하이퍼파라미터 진화 기술을 중심으로 크게 맞춤화된 경우입니다.
- 학술적 기준: 확립된 2020-2022년 컴퓨터 비전 표준과 직접적인 벤치마킹이 필요한 연구를 발표할 때입니다.
Link to this sectionYOLO11을 선택해야 할 때#
- 다중 작업 프로젝트: 단일 통합 API를 사용하여 자세 추정 및 인스턴스 세그멘테이션과 같은 작업을 혼합하여 수행해야 하는 애플리케이션의 경우입니다.
- 에지 배포: 주어진 연산 예산(FLOPs) 내에서 최대 mAP를 뽑아내는 것이 중요한 에지 컴퓨팅 시나리오입니다.
- 상업용 AI 솔루션: Ultralytics Platform의 강력한 지원을 활용하는 소매 및 보안 분야의 기업용 애플리케이션에 이상적입니다.
Link to this section차세대: Ultralytics YOLO26#
YOLO11은 속도와 정확도의 환상적인 균형을 나타내지만, 인공지능 분야는 빠르게 진화하고 있습니다. 오늘 새로운 프로젝트를 시작하는 개발자들에게는 비전 AI의 최신 표준인 **Ultralytics YOLO26**을 살펴보실 것을 강력히 권장합니다.
2026년 1월에 출시된 YOLO26은 현대적인 배포 요구 사항에 맞춰 특별히 설계된 패러다임 전환형 발전을 도입했습니다:
- 종단간(End-to-End) NMS-Free 설계: YOLOv10에서 처음 개척된 개념을 기반으로 하는 YOLO26은 네이티브 종단간 모델입니다. NMS(Non-Maximum Suppression) 후처리가 필요 없어 배포 파이프라인을 크게 단순화하고 지연 시간을 줄입니다.
- MuSGD 옵티마이저: Moonshot AI의 Kimi K2와 같은 모델의 LLM 학습 혁신에서 영감을 받은 이 SGD와 Muon의 하이브리드는 믿을 수 없을 정도로 안정적인 학습과 획기적으로 빠른 수렴을 보장합니다.
- 전례 없는 CPU 속도: DFL(Distribution Focal Loss)을 제거함으로써 YOLO26은 43% 더 빠른 CPU 추론을 달성하여 전용 GPU가 없는 에지 장치 및 환경에 절대적으로 최고의 선택이 됩니다.
- 고급 손실 함수: ProgLoss와 STAL의 통합은 드론 분석, IoT 및 로봇 공학에 필수적인 소형 객체 인식에서 눈에 띄는 향상을 가져옵니다.
- 작업별 개선 사항: 자세 추정을 위한 RLE(Residual Log-Likelihood Estimation)와 회전 경계 상자를 위한 특수 각도 손실과 같은 전문화된 최적화를 도입하여 모든 컴퓨터 비전 작업에서 우수한 성능을 보장합니다.
표준 객체 탐지를 넘어선 특수 아키텍처에 관심이 있는 사용자는 Transformer 기반 탐지를 위한 RT-DETR이나 오픈 보캐블러리 추적 및 탐지를 위한 YOLO-World와 같은 모델을 탐색해 볼 수도 있습니다. 이러한 잘 관리되고 고도로 최적화된 도구를 수용하면 컴퓨터 비전 파이프라인의 효율성, 확장성 및 최첨단 상태를 유지할 수 있습니다.