YOLOv8 YOLOv5: 포괄적인 기술 비교
올바른 컴퓨터 비전 아키텍처를 선택하는 것은 견고한 머신러닝 파이프라인을 구축하는 데 중요한 단계입니다. 이 상세한 기술 비교에서는 비전 AI 생태계에서 가장 인기 있는 두 모델인 YOLOv8과 YOLOv5의 차이점을 살펴봅니다. 두 모델 모두 Ultralytics에서 개발되었으며 실시간 객체 detect의 환경을 크게 형성하여 속도, 정확도 및 사용 편의성에 대한 산업 표준을 설정했습니다.
엣지 디바이스에 배포하든 클라우드 추론을 확장하든, 이러한 모델의 아키텍처 변화, 성능 지표 및 훈련 방법론을 이해하면 컴퓨터 비전 프로젝트에 대한 정보에 기반한 결정을 내리는 데 도움이 될 것입니다.
Ultralytics YOLOv8: 다용도 표준
2023년 초에 출시된 YOLOv8 이전 모델들과 비교해 주요한 아키텍처적 변화를 YOLOv8 . 인스턴스 분할, 이미지 분류, 자세 추정 등 다양한 비전 작업을 기본적으로 처리할 수 있는 통합 프레임워크로 설계되었습니다.
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직:Ultralytics
- 날짜:10
- GitHub:ultralyticsultralytics
- 문서:8 문서
아키텍처 및 방법론
YOLOv8 앵커 박스 없이도 작동하는 탐지 헤드를 YOLOv8 , 데이터셋 분포에 따라 앵커 박스를 수동으로 구성해야 하는 필요성을 제거함으로써 훈련 과정을 단순화했습니다. 이는 맞춤형 데이터셋으로 일반화할 때 모델의 견고성을 높이고, 박스 예측 개수를 줄여 비최대 억제(NMS) 속도를 향상시킵니다.
이 아키텍처는 YOLOv5 사용된 C3 모듈을 대체하는 C2f 모듈 (두 개의 컨볼루션으로 구성된 크로스 스테이지 부분 병목)을 특징으로 합니다. C2f 모듈은 기울기 흐름을 개선하고 계산 비용을 크게 증가시키지 않으면서도 모델이 더 풍부한 특징 표현을 학습할 수 있게 합니다. 또한 YOLOv8 객체성, 분류, 회귀 작업을 분리하는 분리형 헤드 구조를 YOLOv8 수렴 속도와 정확도를 향상시키는 것으로 입증되었습니다.
메모리 효율성
CUDA Ultralytics YOLO ( YOLOv8 포함)은 RT-DETR와 같은 많은 트랜스포머 기반 대안들에 비해 훈련 중 더 낮은 CUDA 메모리 사용량을 위해 최적화되어 있습니다. 이를 통해 개발자는 NVIDIA 시리즈와 같은 표준 소비자용 GPU에서 더 큰 배치 크기를 사용할 수 있습니다.
강점과 약점
강점:
- 단순한 경계 상자 탐지를 넘어 다양한 작업에 걸친 탁월한 다용도성.
- 간소화된 Python 통해
ultralytics패키지, 훈련 및 내보내기를 매우 직관적으로 만듭니다. - 모든 크기 변형에 걸쳐 YOLOv5 대비 더 높은 평균 정밀도(mAP) 를 기록함.
약점:
- 분리된 헤드와 C2f 모듈은 일부 변종에서 정확한 YOLOv5 모델에 비해 매개변수 수와 FLOPs가 약간 증가합니다.
Ultralytics YOLOv5: 민첩한 선구자
2020년에 소개된 YOLOv5 YOLO PyTorch 에코시스템에 도입되어 개발자 접근성을 획기적으로 개선했습니다. 이후 빠르게 빠르고, 신뢰할 수 있으며, 쉽게 배포 가능한 객체 탐지 모델의 업계 표준이 되었습니다.
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜:26
- GitHub:yolov5
- 문서:5 문서
아키텍처 및 방법론
YOLOv5 앵커 기반 아키텍처를 YOLOv5 하며 수정된 CSPDarknet53 백본을 활용합니다. 앵커 기반 접근법은 훈련 전에 최적의 앵커를 정의하기 위해 데이터셋 바운딩 박스의 신중한 클러스터링이 필요하지만, 특정하고 잘 정의된 데이터셋에 대해 매우 효과적입니다.
YOLOv5 낮은 매개변수 사용량으로 효율적으로 특징을 추출하는 C3 모듈을YOLOv5 . 손실 함수는 객체성 손실(Objectness loss)에 분류 및 경계 상자 회귀 손실을 결합하여 네트워크가 정확한 예측을 수행하도록 유도하는 데 크게 의존합니다.
강점과 약점
강점:
- 매우 가벼운 무게로 인해 Nano(YOLOv5n) 및 Small(YOLOv5s) 변종은 리소스가 제한된 엣지 AI 배포에 매우 적합합니다.
- 특히 CPU에서 매우 빠른 추론 속도.
- 광범위한 커뮤니티 튜토리얼과 타사 통합을 갖춘 깊이 확립된 생태계.
약점:
- 앵커 박스 구성이 필요하며, 이는 매우 다양하거나 맞춤형 데이터 세트의 설정을 복잡하게 만들 수 있습니다.
- YOLOv8 YOLO26과 같은 현대적인 앵커 프리 아키텍처에 비해 전반적인 정확도(mAP)가 낮음.
성능 비교
이러한 모델을 평가할 때 속도와 정확도 사이의 적절한 균형을 이루는 것이 가장 중요합니다. 아래 표는 COCO 평가된 두 아키텍처의 성능 지표를 요약한 것입니다. CPU ONNX를 사용하여 측정했으며, GPU TensorRT를 사용하여 테스트되었습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv5 Nano 변형은 매개변수 수와 절대적인 순수 속도 측면에서 여전히 약간의 우위를 YOLOv5 , YOLOv8 mAP 큰 도약을 YOLOv8 까다로운 실제 배포 시나리오에 훨씬 더 강력한 성능 균형을 제공합니다.
사용 편의성 및 Ultralytics 생태계
현대 Ultralytics 모델의 특징은 모델을 둘러싼 잘 관리된 생태계입니다. YOLOv5에서 YOLOv8로의 전환은 통합된 시스템의 도입을 가져왔습니다. ultralytics 파이프 패키지, 매우 간소화된 사용자 경험을 제공합니다.
개발자들은 몇 줄의 Python 코드로 모델 훈련, 검증, 예측 및 내보내기를 원활하게 처리할 수 있으며, 이는 딥러닝 프로젝트에서 역사적으로 필요했던 복잡한 상용구 스크립트를 우회합니다.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the model to ONNX for production deployment
path = model.export(format="onnx")
또한 Ultralytics 같은 도구와의 통합은 데이터셋 관리, 클라우드 기반 훈련 및 배포를 간소화하여 활발한 개발과 강력한 커뮤니티 지원을 보장합니다.
이상적인 사용 사례
YOLOv5를 선택해야 할 때: 레거시 시스템을 유지보수하거나, Raspberry Pi와 같이 심하게 제약된 CPU에서 추론을 실행하거나, 모델 크기에서 1메가바이트의 작은 부분이라도 절약하는 것이 중요한 프로젝트를 진행하는 경우, YOLOv5는 여전히 신뢰할 수 있는 핵심 도구입니다.
YOLOv8을 선택해야 할 때: 오늘부터 시작하는 거의 모든 새로운 프로젝트에 대해 YOLOv5보다 YOLOv8이 강력히 권장됩니다. 고급 아키텍처는 복잡한 track, 지향성 바운딩 박스(OBB) 및 segment를 손쉽게 처리합니다. 자율 로봇 공학부터 의료 영상 분석 및 스마트 도시 인프라에 이르는 현대적인 애플리케이션에 이상적입니다.
최신 첨단 기술을 찾고 계신가요?
YOLOv8 놀라울 정도로 뛰어난 YOLOv8 , 개발자들이 성능의 최첨단을 추구한다면 YOLO26을 고려해야 합니다. 2026년에 출시된 이 모델은 다음과 같은 획기적인 발전을 도입했습니다:
- 종단 간 NMS-Free 설계: 더 빠르고 간단한 배포를 위해 NMS 후처리를 제거합니다. 이는 YOLOv10에서 처음 개척된 개념입니다.
- MuSGD 옵티마이저: LLM 훈련 혁신을 컴퓨터 비전에 도입하는 SGD와 뮤온의 하이브리드로, 더 안정적인 훈련과 더 빠른 수렴을 가능하게 합니다.
- 최대 43% 더 빠른 CPU 추론: 전용 GPU가 없는 엣지 컴퓨팅 환경에 고도로 최적화되었습니다.
- DFL 제거: Distribution Focal Loss가 제거되어 내보내기가 간소화되고 엣지 장치 호환성이 향상되었습니다.
- ProgLoss + STAL: 항공 이미지 및 IoT에 필수적인 작은 객체 인식에서 현저한 개선을 이끌어내는 고급 손실 함수.
Ultralytics가 제공하는 포괄적인 문서와 도구를 활용하여 YOLOv8을 쉽게 배포하거나 최첨단 YOLO26을 탐색하여 전례 없는 속도와 정확도로 복잡한 시각적 문제를 해결할 수 있습니다. 추가 학습을 위해 하이퍼파라미터 튜닝 및 모델 배포 사례에 대한 가이드를 살펴보는 것을 고려해 보십시오.