콘텐츠로 건너뛰기

YOLOv8 YOLOv5: 포괄적인 기술 비교

적합한 컴퓨터 비전 아키텍처를 선택하는 것은 견고한 머신러닝 파이프라인 구축의 핵심 단계입니다. 이 상세한 기술 비교를 통해 비전 AI 생태계에서 가장 널리 사용되는 두 모델 간의 차이점을 살펴봅니다: YOLOv8YOLOv5. 두 모델 모두 Ultralytics 개발되었으며 Ultralytics 실시간 객체 탐지 분야의 지형을 크게 형성하여 속도, 정확도 및 사용 편의성에 대한 업계 표준을 설정했습니다.

엣지 디바이스에 배포하든 클라우드 추론을 확장하든, 이러한 모델의 아키텍처 변화, 성능 지표 및 훈련 방법론을 이해하면 컴퓨터 비전 프로젝트에 대한 정보에 기반한 결정을 내리는 데 도움이 될 것입니다.

Ultralytics YOLOv8: 다용도 표준

2023년 초에 출시된 YOLOv8 이전 모델들과 비교해 주요한 아키텍처적 변화를 YOLOv8 . 인스턴스 분할, 이미지 분류, 자세 추정 등 다양한 비전 작업을 기본적으로 처리할 수 있는 통합 프레임워크로 설계되었습니다.

아키텍처와 방법론

YOLOv8 앵커 박스 없이도 작동하는 탐지 헤드를 YOLOv8 , 데이터셋 분포에 따라 앵커 박스를 수동으로 구성해야 하는 필요성을 제거함으로써 훈련 과정을 단순화했습니다. 이는 맞춤형 데이터셋으로 일반화할 때 모델의 견고성을 높이고, 박스 예측 개수를 줄여 비최대 억제(NMS) 속도를 향상시킵니다.

이 아키텍처는 YOLOv5 사용된 C3 모듈을 대체하는 C2f 모듈 (두 개의 컨볼루션으로 구성된 크로스 스테이지 부분 병목)을 특징으로 합니다. C2f 모듈은 기울기 흐름을 개선하고 계산 비용을 크게 증가시키지 않으면서도 모델이 더 풍부한 특징 표현을 학습할 수 있게 합니다. 또한 YOLOv8 객체성, 분류, 회귀 작업을 분리하는 분리형 헤드 구조를 YOLOv8 수렴 속도와 정확도를 향상시키는 것으로 입증되었습니다.

메모리 효율성

CUDA Ultralytics YOLO ( YOLOv8 포함)은 RT-DETR와 같은 많은 트랜스포머 기반 대안들에 비해 훈련 중 더 낮은 CUDA 메모리 사용량을 위해 최적화되어 있습니다. 이를 통해 개발자는 NVIDIA 시리즈와 같은 표준 소비자용 GPU에서 더 큰 배치 크기를 사용할 수 있습니다.

강점과 약점

강점:

  • 단순한 경계 상자 탐지를 넘어 다양한 작업에 걸친 탁월한 다용도성.
  • 간소화된 Python 통해 ultralytics 패키지, 훈련 및 내보내기를 매우 직관적으로 만듭니다.
  • 모든 크기 변형에 걸쳐 YOLOv5 대비 더 높은 평균 정밀도(mAP) 를 기록함.

약점:

  • 분리된 헤드와 C2f 모듈은 일부 변종에서 정확한 YOLOv5 모델에 비해 매개변수 수와 FLOPs가 약간 증가합니다.

8에 대해 자세히 알아보기

Ultralytics YOLOv5: 민첩한 선구자

2020년에 소개된 YOLOv5 YOLO PyTorch 에코시스템에 도입되어 개발자 접근성을 획기적으로 개선했습니다. 이후 빠르게 빠르고, 신뢰할 수 있으며, 쉽게 배포 가능한 객체 탐지 모델의 업계 표준이 되었습니다.

아키텍처와 방법론

YOLOv5 앵커 기반 아키텍처를 YOLOv5 하며 수정된 CSPDarknet53 백본을 활용합니다. 앵커 기반 접근법은 훈련 전에 최적의 앵커를 정의하기 위해 데이터셋 바운딩 박스의 신중한 클러스터링이 필요하지만, 특정하고 잘 정의된 데이터셋에 대해 매우 효과적입니다.

YOLOv5 낮은 매개변수 사용량으로 효율적으로 특징을 추출하는 C3 모듈을YOLOv5 . 손실 함수는 객체성 손실(Objectness loss)에 분류 및 경계 상자 회귀 손실을 결합하여 네트워크가 정확한 예측을 수행하도록 유도하는 데 크게 의존합니다.

강점과 약점

강점:

  • 매우 가벼운 무게로 인해 Nano(YOLOv5n) 및 Small(YOLOv5s) 변종은 리소스가 제한된 엣지 AI 배포에 매우 적합합니다.
  • 특히 CPU에서 매우 빠른 추론 속도.
  • 광범위한 커뮤니티 튜토리얼과 타사 통합 기능을 갖춘 깊이 정착된 생태계.

약점:

  • 앵커 박스 구성이 필요하며, 이는 매우 다양하거나 맞춤형 데이터 세트의 설정을 복잡하게 만들 수 있습니다.
  • YOLOv8 YOLO26과 같은 현대적인 앵커 프리 아키텍처에 비해 전반적인 정확도(mAP)가 낮음.

5에 대해 자세히 알아보기

성능 비교

이러한 모델을 평가할 때 속도와 정확도 사이의 적절한 균형을 이루는 것이 가장 중요합니다. 아래 표는 COCO 평가된 두 아키텍처의 성능 지표를 요약한 것입니다. CPU ONNX를 사용하여 측정했으며, GPU TensorRT를 사용하여 테스트되었습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv5 Nano 변형은 매개변수 수와 절대적인 순수 속도 측면에서 여전히 약간의 우위를 YOLOv5 , YOLOv8 mAP 큰 도약을 YOLOv8 까다로운 실제 배포 시나리오에 훨씬 더 강력한 성능 균형을 제공합니다.

사용 편의성과 Ultralytics

현대 Ultralytics 특징은 이를 둘러싼 잘 유지된 생태계입니다. YOLOv5 YOLOv8 전환은 통합된 ultralytics 파이프 패키지, 매우 간소화된 사용자 경험을 제공합니다.

개발자는 딥러닝 프로젝트에서 전통적으로 필요했던 복잡한 상용 스크립트를 우회하여, 단 몇 Python 모델 훈련, 검증, 예측 및 내보내기를 원활하게 처리할 수 있습니다.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the model to ONNX for production deployment
path = model.export(format="onnx")

또한 Ultralytics 같은 도구와의 통합은 데이터셋 관리, 클라우드 기반 훈련 및 배포를 간소화하여 활발한 개발과 강력한 커뮤니티 지원을 보장합니다.

이상적인 사용 사례

YOLOv5 선택해야 할 때: 레거시 시스템을 유지 관리 중이거나, 라즈베리 파이와 같이 극도로 제한된 CPU에서 추론을 실행하거나, 모델 크기를 메가바이트 단위로 절약하는 것이 중요한 프로젝트를 진행 중이라면, YOLOv5 믿을 수 있는 주력 모델입니다.

YOLOv8 선택해야 할 때: 오늘날 시작하는 거의 모든 신규 프로젝트에는 YOLOv5 YOLOv8 적극 YOLOv8 . 이 고급 아키텍처는 복잡한 추적, 방향성 바운딩 박스(OBB), 분할을 손쉽게 처리합니다. 자율 로봇 공학부터 의료 영상 분석, 스마트 시티 인프라에 이르는 현대적 응용 분야에 이상적입니다.

최신 첨단 기술을 찾고 계신가요?

YOLOv8 놀라울 정도로 뛰어난 YOLOv8 , 개발자들이 성능의 최첨단을 추구한다면 YOLO26을 고려해야 합니다. 2026년에 출시된 이 모델은 다음과 같은 획기적인 발전을 도입했습니다:

  • 엔드투엔드 NMS 설계: YOLOv10 최초로 도입된 개념으로, NMS 제거하여 더 빠르고 간편한 배포를 가능케 합니다.
  • MuSGD 최적화기: SGD 뮤온의 하이브리드로, 컴퓨터 비전 분야에 대규모 언어 모델(LLM) 훈련 혁신을 가져와 보다 안정적인 훈련과 빠른 수렴을 가능하게 합니다.
  • 최대 43% 빠른 CPU : 전용 GPU 없이도 에지 컴퓨팅 환경에 최적화되었습니다.
  • DFL 제거: 단순화된 내보내기와 향상된 에지 장치 호환성을 위해 분포 초점 손실(DFL)이 제거되었습니다.
  • ProgLoss + STAL: 항공 촬영 및 IoT에 중요한 소형 물체 인식에서 현저한 개선을 이끌어내는 고급 손실 함수.

Ultralytics 제공하는 포괄적인 문서와 도구를 활용하면 YOLOv8 손쉽게 배포하거나 최첨단 YOLO26을 탐색하여 복잡한 시각적 과제를 전례 없는 속도와 정확도로 해결할 수 있습니다. 더 깊이 학습하려면 하이퍼파라미터 튜닝모델 배포 방법에 관한 가이드를 살펴보시기 바랍니다.


댓글