YOLOv5 YOLO: 객체 탐지 진화의 기술적 심층 분석
컴퓨터 비전 분야의 급속한 발전 속에서, 올바른 객체 탐지 모델 선택은 프로젝트 성공에 매우 중요합니다. 본 가이드는 YOLOv5, 접근 가능한 AI를 대중화한 전설적인 저장소, 그리고 알리바바 TinyVision 팀의 연구 중심 아키텍처인 YOLO 비교합니다. 두 모델 모두 높은 효율성을 목표로 하지만, 아키텍처, 사용 편의성, 배포 준비도 측면에서 서로 다른 철학으로 문제를 접근합니다.
모델 개요 및 기원
5
2020년 중반에 출시된 Ultralytics가 출시한 YOLOv5 아키텍처뿐만 아니라 엔지니어링 측면에서도 업계 표준이 YOLOv5 . 사용 편의성, 견고한 훈련 파이프라인, 원활한 내보내기 기능을 강조했습니다. 전 세계적으로 가장 널리 배포된 비전 AI 모델 중 하나로 남아 있습니다.
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜:26
- GitHub:yolov5
DAMO-YOLO
알리바바 그룹이 2022년 말 제안한YOLO Distillation-Augmented MOdel)는 신경망 구조 탐색(NAS), 효율적인 재매개변수화 일반화 FPN(RepGFPN)과 같은 첨단 기술을 통합하고 성능 향상을 위해 증류(distillation) 기법에 크게 의존합니다.
- 저자: 쉬샹저, 장이치 외
- Organization: Alibaba Group
- 날짜:23
- Arxiv:2211.15444v2
- GitHub:YOLO
기술 아키텍처 비교
이 두 모델 간의 구조적 차이는 경험적 '잡동사니 모음' 설계에서 자동화된 탐색 기반 아키텍처로의 전환을 부각시킨다.
YOLOv5: CSP-Darknet 표준
YOLOv5 수정된 CSP-Darknet53 백본을 YOLOv5 , 이 백본은 경로 집계 네트워크(PANet) 목 부분과 연결됩니다. 주요 강점은 모듈식 설계와 훈련 과정에서 적용되는 '다양한 무료 기능들'에 있습니다. 예를 들어 모자이크 증강과 유전 알고리즘 기반 하이퍼파라미터 진화 등이 포함됩니다.
- 백본: CSP-다크넷
- 목: PANet과 CSP 블록
- 헤드: YOLOv3 스타일 앵커 기반 결합 헤드
YOLO: NAS 및 디스틸레이션
YOLO 신경망 구조 탐색(NAS)을 활용하여 최적의 백본 구조를 찾는 방식으로 표준 수동 설계에서YOLO (MAE-NAS).
- 백본: MAE-NAS (검색 기반)
- 목: 효율적인 특징 융합을 가능하게 하는 RepGFPN(재매개변수화된 일반화 FPN).
- 헤드: 레이블 할당을 위해 정렬된 OTA(AlignedOTA)와 결합된 ZeroHead(이중 작업 투영 레이어).
- 증류: 더 큰 "교사" 모델이 더 작은 "학생" 모델의 훈련을 지도하는 핵심 구성 요소로, 훈련 파이프라인에 복잡성을 더하지만 최종 정확도를 향상시킵니다.
증류의 복잡성
증류는YOLO 정확도를 향상시키지만, YOLOv5 비해 훈련 워크플로우를 상당히 복잡하게 만듭니다. 사용자는 종종 먼저 교사 모델을 훈련하거나 다운로드해야 하므로, 사용자 정의 데이터셋에 대한 진입 장벽이 높아집니다.
성능 지표
다음 표는 COCO 데이터셋에서 다양한 모델 스케일의 성능을 비교합니다.YOLO 학술적 지표에서 우수한 결과를YOLO 반면, YOLOv5 처리량과 배포 유연성 측면에서 여전히 경쟁력을 YOLOv5 .
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
결과 분석
- 효율성: YOLOv5n(Nano)는 여전히 경량 추론의 왕으로,YOLO 비해 훨씬 적은 매개변수 수(260만 vs 850만)와 FLOPs를 자랑하여 표준 CPU에서의 극한의 에지 컴퓨팅 환경에 훨씬 더 적합합니다.
- 정확도:YOLO 증류 파이프라인을YOLO 더 높은 mAP 을 끌어냅니다. 특히 소형(Small) 및 중형(Medium) 범주에서 두드러집니다.
- 추론 속도: YOLOv5 표준 라이브러리에서 고도로 최적화된 단순한 아키텍처 블록 덕분에 YOLOv5 ONNX 통해 더 빠른 CPU 제공합니다.
교육 및 사용성
개발자에게 있어 이것이 가장 큰 차별점입니다. Ultralytics "초보자에서 전문가로"의 경험을 최우선으로 하는 반면, 연구 저장소들은 대개 복잡한 설정을 요구합니다.
YOLOv5: 간소화된 경험
YOLOv5 사용자 친화적인 명령줄 인터페이스와 Python YOLOv5 업계 표준이 되었습니다. 맞춤형 데이터셋으로의 훈련은 최소한의 설정만으로 가능합니다.
import torch
# Load a model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Train via CLI (simplified)
# !python train.py --data coco.yaml --epochs 100 --weights yolov5s.pt
YOLO: 연구의 복잡성
YOLO 훈련은YOLO 더 복잡한 구성 시스템을 수반합니다. 증류 일정에 대한 의존성으로 인해 사용자는 훈련 단계에서 두 모델(교사 모델과 학생 모델)을 관리해야 하는 경우가 많으며, 이는GPU 메모리 요구 사항과 구성 오버헤드를 증가시킵니다.
Ultralytics : 생태계와 다용도성
YOLO 강력한 순수 객체YOLO , Ultralytics 현대 AI 프로젝트에 필요한 보다 광범위한 기능 세트를 제공합니다.
- 다용도성: 단순한 바운딩 박스를 넘어, Ultralytics 인스턴스 세그멘테이션, 자세 추정, 분류, 그리고 방향성 바운딩 박스(OBB) 검출을 Ultralytics .YOLO 주로 표준 검출에 중점을YOLO .
- 배포: Ultralytics 다음과 같은 형식으로 원활하게 내보낼 수 있습니다. TensorRT, CoreML, TFLite, OpenVINO 단일 OpenVINO 내보낼 수 있습니다.
- 커뮤니티 지원: 수백만 명의 사용자를 보유한 Ultralytics 연구 저장소가 따라올 수 없는 방대한 리소스, 튜토리얼 및 타사 통합 기능을 제공합니다.
차세대: YOLO26
NAS 기반 모델의 효율성에 감탄하지만 YOLOv5 사용 편의성이 필요한 개발자에게는 YOLO26이 권장되는 후속 모델입니다. 2026년에 출시된 이 모델은 두 모델의 장점을 모두 결합했습니다.
- 엔드투엔드 NMS: 최근 학술적 돌파구와 마찬가지로, YOLO26은 비최대 억제(NMS)를 제거하여 배포 파이프라인을 단순화합니다.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받아 개발된 이 하이브리드 최적화기는 안정적인 수렴을 보장합니다.
- 엣지 최적화: YOLO26은 CPU에서 최대 43% 더 빠르며, 이는 YOLOv5 YOLO 엣지 컴퓨팅에 더 우수한 선택임을 의미합니다.
결론
YOLO 신경망 아키텍처 탐색 및 정제 기술의 위력을 입증하며 컴퓨터 비전 연구 분야에 탁월한 기여를 합니다. 이는 고급 아키텍처 탐색 방법을 연구하거나, 훈련 복잡성이 병목 현상이 아닌 특정 하드웨어 제약 조건에서 최대 정확도를 끌어내고자 하는 연구자들에게 강력한 후보입니다.
YOLOv5, 그리고 그 현대적 후속 모델인 YOLO26은 사실상 모든 생산 배포 환경에서 여전히 선호되는 선택지입니다. 낮은 메모리 사용량, 광범위한 작업 지원(분할, 자세, OBB), 그리고 강력한 Ultralytics 조합은 프로젝트가 프로토타입에서 생산 환경으로 최소한의 마찰로 이동할 수 있도록 보장합니다.
최신 성능과 기능을 필요로 하는 분들께는 YOLO26을 적극 추천합니다. 연구자들이 선호하는 종단간 효율성과 Ultralytics 사용 편의성을 모두 제공합니다.
추가 자료
- 최신 YOLO26 문서를 살펴보세요.
- YOLOv5 저장소를 확인해 보세요.
- 실시간 객체 탐지의 기본 개념을 알아보세요.
- 다른 모델과 비교해 보세요 RT-DETR 와 같은 변압기 기반 솔루션을 비교해 보십시오.