YOLOv5 YOLO11: 종합적인 기술 비교
빠르게 진화하는 컴퓨터 비전 환경에서 올바른 물체 감지 모델을 선택하는 것은 프로젝트 성공을 위해 매우 중요합니다. 이 분야에서 가장 중요한 두 가지 이정표는 다음과 같습니다. YOLOv5 와 최근 출시된 YOLO11. YOLOv5 사용 편의성과 속도에 대한 전설적인 표준을 확립했다면, YOLO11 수년간의 연구와 개발을 바탕으로 정확성과 효율성의 한계를 뛰어넘었습니다.
이 가이드는 개발자, 연구원, 엔지니어가 AI 애플리케이션을 위한 정보에 입각한 결정을 내릴 수 있도록 이 두 가지 아키텍처에 대한 자세한 기술 분석을 제공합니다.
Ultralytics YOLOv5: 신뢰할 수 있는 워크포스
2020년에 출시된 YOLOv5 사물 인식의 접근성을 혁신적으로 개선했습니다. 이 모델은 네이티브로 구현된 최초의 "한 번만 보기" 모델입니다. PyTorch로 구현되어 개발자가 매우 쉽게 훈련하고 배포할 수 있습니다. 속도와 정확성의 균형 덕분에 산업 검사부터 자율 주행 차량에 이르기까지 모든 분야에서 최고의 선택이 되었습니다.
기술 세부 사항:
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Docs:https://docs.ultralytics.com/models/yolov5/
주요 기능 및 아키텍처
YOLOv5 앵커 기반 아키텍처를 활용합니다. 이전 버전에 비해 경사도 흐름을 크게 개선하고 계산 비용을 절감한 CSPDarknet 백본을 도입했습니다. 이 모델은 경로 집계 네트워크(PANet) 넥을 사용하여 정보 흐름을 향상시키고 훈련 중에 모자이크 데이터 증강을 통합하여 작은 객체에 대한 모델 견고성을 개선하는 표준이 되었습니다.
강점
YOLOv5 안정성과 완성도로 유명합니다. 수년간의 커뮤니티 테스트를 통해 튜토리얼, 타사 통합 및 배포 가이드로 구성된 방대한 에코시스템이 구축되어 있습니다. 아키텍처에 대한 특정 하드웨어 최적화가 이미 이루어진 레거시 시스템이나 엣지 디바이스에 탁월한 선택입니다.
Ultralytics YOLO11: 최첨단 진화
2024년 말 출시, YOLO11 은 최첨단 비전 AI를 대표합니다. YOLOv5 얻은 교훈과 YOLOv8 에서 얻은 교훈을 바탕으로 더 빠르고 정확하며 계산 효율이 높은 모델을 제공합니다.
기술 세부 사항:
- 저자: Glenn Jocher, Jing Qiu
- 조직:Ultralytics
- 날짜: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Docs:https://docs.ultralytics.com/models/yolo11/
아키텍처 및 주요 기능
YOLO11 C3k2 블록과 C2PSA(공간 주의 교차 단계 부분) 모듈을 포함한 상당한 아키텍처 개선 사항을 도입했습니다. YOLOv5 달리 YOLO11 앵커가 없는 감지 헤드를 사용하므로 앵커 박스를 수동으로 계산할 필요가 없어 훈련 프로세스가 간소화됩니다. 이러한 설계 변화는 일반화를 향상시키고 모델이 다양한 데이터 세트에 더 잘 적응할 수 있도록 합니다.
탁월한 다용도성
YOLO11 가장 큰 특징 중 하나는 단일 프레임워크 내에서 여러 컴퓨터 비전 작업을 기본적으로 지원한다는 점입니다. YOLOv5 주로 감지에 중점을 두었지만(나중에 세분화를 지원함), YOLO11 처음부터 처리할 수 있도록 설계되었습니다:
이러한 다용도성을 통해 개발자는 프레임워크를 전환하지 않고도 복잡한 로봇 공학 및 분석 문제를 해결할 수 있습니다.
성능 비교
YOLOv5 YOLO11 전환하면 상당한 성능 향상을 얻을 수 있습니다. 메트릭은 YOLO11 속도와 정확성 사이에서 우수한 절충안을 제공한다는 것을 보여줍니다.
정확성 대 효율성
YOLO11 비슷한 크기의 YOLOv5 모델에 비해 COCO 데이터 세트에서 일관되게 더 높은 평균 정밀도(mAP) 를 달성합니다. 예를 들어, YOLO11m 모델은 훨씬 적은 수의 파라미터(20.1억 개 대 97.2억 개)로 작동하면서도 정확도(51.5 대 50.7 mAP)가 훨씬 더 큰 YOLOv5x를 능가합니다. 이처럼 모델 크기가 크게 줄어든 덕분에 리소스가 제한된 엣지 AI 하드웨어에 배포하는 데 중요한 요소인 학습과 추론 과정에서 메모리 요구량이 줄어듭니다.
추론 속도
최적화된 아키텍처 선택 덕분에 YOLO11 CPU 추론 속도에서 빛을 발합니다. YOLO11n 모델은 실시간 애플리케이션의 새로운 벤치마크를 제시하며, ONNX 사용하는 CPU 이전 모델보다 훨씬 빠른 56.1ms의 클럭을 기록합니다.
메모리 효율성
Ultralytics YOLO11 모델은 최적의 메모리 사용을 위해 설계되었습니다. 다음과 같은 트랜스포머 기반 감지기와 비교할 때 RT-DETR과 같은 트랜스포머 기반 검출기에 비해 YOLO11 트레이닝 중에 훨씬 적은 CUDA 메모리를 필요로 하므로 표준 소비자용 GPU를 사용하는 개발자가 사용할 수 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
교육 및 개발자 경험
두 모델 모두 "사용 편의성"으로 유명한 포괄적인 Ultralytics 에코시스템의 이점을 누릴 수 있습니다.
원활한 통합
YOLO11 현대적인 ultralytics Python 패키지는 모든 작업을 간단한 API로 통합합니다. 이를 통해 단 몇 줄의 코드만으로 교육, 검증, 배포를 수행할 수 있습니다.
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
YOLOv5 자체 전용 저장소가 있지만 PyTorch Hub를 통해 쉽게 로드하거나 특정 작업을 위해 최신 에코시스템 내에서 활용할 수도 있습니다. 두 모델 모두에 대한 강력한 문서가 제공되므로 하이퍼파라미터 튜닝을 수행하거나 다음에 내보내든 상관없이 OpenVINO로 내보내든 관계없이 프로세스가 간소화됩니다.
에코시스템 혜택
Ultralytics 모델을 선택한다는 것은 잘 관리된 도구 세트에 액세스할 수 있다는 것을 의미합니다. 실험 추적을 위한 Comet 통합부터 원활한 데이터 세트 관리까지, 이 에코시스템은 전체 MLOps 수명 주기를 지원합니다. 이러한 활발한 개발을 통해 보안 패치와 성능 개선이 정기적으로 제공됩니다.
이상적인 사용 사례
YOLOv5 선택해야 하는 경우
- 레거시 하드웨어: YOLOv5 아키텍처에 특별히 최적화된 파이프라인이 있는 기존 엣지 디바이스(예: 구형 Raspberry Pis)가 있는 경우.
- 워크플로 구축: 핵심 모델 아키텍처를 업데이트하는 데 상당한 리팩토링 비용이 발생하는 유지 관리 모드가 깊은 프로젝트의 경우.
- 특정 GPU 최적화: 드물지만 특정 TensorRT 엔진이 YOLOv5 정확한 레이어 구조에 맞게 크게 튜닝되는 경우가 있습니다.
YOLO11 선택해야 할 때
- 새로운 개발: 거의 모든 신규 프로젝트의 경우, 정확도 대비 계산 비율이 뛰어난 YOLO11 권장되는 시작점입니다.
- 실시간 CPU 애플리케이션: 노트북이나 클라우드 인스턴스와 같은 표준 프로세서에서 실행되는 애플리케이션은 YOLO11 CPU 속도 최적화를 통해 엄청난 이점을 누릴 수 있습니다.
- 복잡한 작업: 인스턴스 세분화 또는 포즈 추정과 함께 탐지가 필요한 프로젝트.
- 높은 정확도 요구 사항: 의료 영상이나 위성 이미지 분석과 같이 작은 물체를 높은 정밀도로 감지하는 것이 가장 중요한 분야.
결론
YOLOv5 지난 몇 년 동안 수많은 혁신을 이끌어온 효율적이고 접근성이 뛰어난 AI 설계의 증거입니다. 하지만 YOLO11 미래를 대표합니다. 고급 앵커 프리 아키텍처, 우수한 mAP 점수, 향상된 다용도성을 통해 개발자에게 최신 컴퓨터 비전 과제를 해결할 수 있는 더욱 강력한 툴셋을 제공합니다.
YOLO11 도입하면 더 나은 성능을 얻을 수 있을 뿐만 아니라 번성하는 Ultralytics 에코시스템 내에서 애플리케이션의 미래에도 대비할 수 있습니다.
다른 모델 살펴보기
이러한 아키텍처를 다른 주요 모델과 비교하는 데 관심이 있다면 자세한 비교를 살펴보세요: