YOLOv8 대 YOLOv5: 포괄적인 기술 비교

올바른 컴퓨터 비전 아키텍처를 선택하는 것은 강력한 머신 러닝 파이프라인 구축의 핵심 단계입니다. 이 상세한 기술 비교에서는 비전 AI 생태계에서 가장 인기 있는 두 모델인 YOLOv8YOLOv5의 차이점을 살펴봅니다. 두 모델 모두 Ultralytics에서 개발했으며 실시간 객체 탐지 분야의 지형을 크게 변화시켜 속도, 정확성 및 사용 편의성에 대한 업계 표준을 정립했습니다.

엣지 디바이스에 배포하든 클라우드 추론을 확장하든, 이들 모델의 아키텍처 변화, 성능 지표 및 학습 방법론을 이해하면 컴퓨터 비전 프로젝트를 위한 정보에 입각한 결정을 내리는 데 도움이 됩니다.

Ultralytics YOLOv8: 다재다능한 표준

2023년 초에 출시된 YOLOv8은 이전 모델들과 비교하여 큰 아키텍처 변화를 보여주었습니다. 이 모델은 인스턴스 세그멘테이션, 이미지 분류, 자세 추정을 포함하여 여러 비전 작업을 기본적으로 처리할 수 있는 통합 프레임워크 역할을 하도록 처음부터 설계되었습니다.

아키텍처 및 방법론

YOLOv8은 앵커 프리(anchor-free) 탐지 헤드를 도입하여, 데이터셋 분포에 따라 앵커 박스를 수동으로 구성할 필요가 없어 학습 과정을 단순화합니다. 이를 통해 모델이 커스텀 데이터셋으로 일반화될 때 더욱 강력해지며 박스 예측 수를 줄여 비최대 억제(NMS) 속도를 향상시킵니다.

이 아키텍처는 YOLOv5의 C3 모듈을 대체하는 C2f 모듈(두 개의 컨볼루션을 포함한 교차 단계 부분 병목 구조)을 특징으로 합니다. C2f 모듈은 그래디언트 흐름을 개선하고 계산 비용을 크게 늘리지 않으면서 모델이 더 풍부한 특징 표현을 학습할 수 있게 합니다. 또한 YOLOv8은 객체성, 분류 및 회귀 작업을 분리하는 디커플드 헤드(decoupled head) 구조를 사용하여 수렴 속도와 정확도를 향상시킵니다.

메모리 효율성

YOLOv8을 포함한 Ultralytics YOLO 모델은 RT-DETR과 같은 많은 Transformer 기반 대안보다 학습 중 CUDA 메모리 사용량이 낮도록 최적화되어 있습니다. 이를 통해 개발자는 NVIDIA RTX 시리즈와 같은 표준 소비자용 GPU에서 더 큰 배치 사이즈를 사용할 수 있습니다.

장점 및 단점

강점:

  • 단순한 경계 박스 탐지를 넘어선 여러 작업 전반에 걸친 독보적인 범용성.
  • ultralytics 패키지를 통한 간소화된 Python API로 학습 및 내보내기(export) 과정을 매우 직관적으로 수행 가능.
  • Higher mean Average Precision (mAP) across all size variants compared to YOLOv5.

약점:

  • 디커플드 헤드와 C2f 모듈 도입으로 인해 일부 변형에서는 정확히 일치하는 YOLOv5 카운터파트와 비교했을 때 파라미터 수와 FLOPs가 약간 증가할 수 있음.

YOLOv8에 대해 더 알아보기

Ultralytics YOLOv5: 민첩한 선구자

2020년에 소개된 YOLOv5는 PyTorch 생태계에 YOLO를 도입하여 개발자 접근성을 비약적으로 향상시켰습니다. 이는 빠르고 안정적이며 배포하기 쉬운 객체 탐지 모델의 업계 표준으로 빠르게 자리 잡았습니다.

아키텍처 및 방법론

YOLOv5는 앵커 기반(anchor-based) 아키텍처에 의존하며 수정된 CSPDarknet53 백본을 사용합니다. 앵커 기반 접근 방식은 학습 전에 데이터셋 경계 박스를 신중하게 클러스터링하여 최적의 앵커를 정의해야 하지만, 특정하게 잘 정의된 데이터셋에는 매우 효과적입니다.

YOLOv5는 C3 모듈을 통합하여 낮은 파라미터 점유율을 유지하면서도 특징을 효율적으로 추출합니다. 손실 함수는 객체성 손실(Objectness loss)과 분류 및 경계 박스 회귀 손실을 결합하여 네트워크가 정확한 예측을 수행하도록 유도합니다.

장점 및 단점

강점:

  • Extremely lightweight, making the Nano (YOLOv5n) and Small (YOLOv5s) variants highly suitable for resource-constrained edge AI deployments.
  • 특히 CPU에서 매우 빠른 추론 속도를 제공.
  • 풍부한 커뮤니티 튜토리얼과 타사 통합이 뒷받침하는 깊게 자리 잡은 생태계.

약점:

  • 앵커 박스 구성이 필요하며, 이는 매우 다양하거나 커스텀 데이터셋의 경우 설정을 복잡하게 만들 수 있음.
  • YOLOv8 및 YOLO26과 같은 현대적인 앵커 프리 아키텍처와 비교하여 낮은 전반적인 정확도(mAP).

YOLOv5에 대해 더 알아보기

성능 비교

이 모델들을 평가할 때는 속도와 정확도 사이의 유리한 균형을 달성하는 것이 가장 중요합니다. 아래 표는 COCO 데이터셋에서 평가된 두 아키텍처의 성능 지표를 요약한 것입니다. CPU 속도는 ONNX를 사용하여 측정되었으며, GPU 속도는 TensorRT를 사용하여 테스트되었습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

38. YOLOv5가 Nano 변형에서 파라미터 수와 절대적인 원시 속도 측면에서 약간의 우위를 유지하지만, YOLOv8은 전반적으로 mAP의 대폭적인 향상을 제공하여 까다로운 실제 배포 시나리오에서 훨씬 강력한 성능 균형을 제공합니다.

사용 편의성과 Ultralytics 생태계

현대 Ultralytics 모델의 결정적인 특징은 이를 둘러싼 잘 관리된 생태계입니다. YOLOv5에서 YOLOv8로 전환되면서 통합된 ultralytics pip 패키지가 도입되어 매우 간소화된 사용자 경험을 제공하게 되었습니다.

개발자는 단 몇 줄의 Python 코드만으로 모델 학습, 검증, 예측 및 내보내기를 원활하게 처리할 수 있으며, 과거 딥러닝 프로젝트에서 필요했던 복잡한 보일러플레이트 스크립트를 우회할 수 있습니다.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the model to ONNX for production deployment
path = model.export(format="onnx")

또한 Ultralytics 플랫폼과 같은 도구와의 통합은 데이터셋 관리, 클라우드 학습 및 배포를 단순화하여 활발한 개발과 강력한 커뮤니티 지원을 보장합니다.

이상적인 활용 사례

YOLOv5를 선택해야 할 때: 레거시 시스템을 유지 관리하거나, Raspberry Pi와 같이 심각하게 제한된 CPU에서 추론을 실행하거나, 모델 크기를 단 1MB라도 줄이는 것이 중요한 프로젝트를 진행 중이라면 YOLOv5는 여전히 신뢰할 수 있는 도구입니다.

YOLOv8을 선택해야 할 때: 오늘 시작하는 거의 모든 신규 프로젝트의 경우 YOLOv5보다 YOLOv8이 강력히 권장됩니다. 고급 아키텍처를 통해 복잡한 추적, 지향성 경계 박스(OBB) 및 세그멘테이션을 쉽게 처리할 수 있습니다. 자율 로봇 공학부터 의료 영상 분석, 스마트 시티 인프라까지 현대적인 애플리케이션에 이상적입니다.

최신 기술(SOTA)을 찾고 계신가요?

YOLOv8이 매우 유능하지만, 성능의 최전선을 추구하는 개발자는 **YOLO26**을 고려해야 합니다. 2026년에 출시된 이 모델은 다음과 같은 획기적인 발전을 소개합니다:

  • 엔드 투 엔드 NMS 프리 설계: NMS 후처리를 제거하여 더 빠르고 단순한 배포를 가능하게 합니다. 이는 YOLOv10에서 처음 개척된 개념입니다.
  • MuSGD 옵티마이저: SGD와 Muon의 하이브리드 형태로, LLM 학습 혁신을 컴퓨터 비전에 도입하여 더 안정적인 학습과 빠른 수렴을 가능하게 합니다.
  • 최대 43% 더 빠른 CPU 추론: 전용 GPU가 없는 엣지 컴퓨팅 환경을 위해 크게 최적화되었습니다.
  • DFL 제거: 배포 단순화와 엣지 디바이스 호환성 향상을 위해 Distribution Focal Loss가 제거되었습니다.
  • ProgLoss + STAL: 소형 객체 인식에서 현저한 개선을 이끄는 고급 손실 함수로, 항공 영상 및 IoT에 매우 중요합니다.

Ultralytics에서 제공하는 포괄적인 문서와 도구를 활용하면 YOLOv8을 쉽게 배포하거나 최첨단 YOLO26을 탐색하여 전례 없는 속도와 정확도로 복잡한 시각적 문제를 해결할 수 있습니다. 추가 학습을 위해 하이퍼파라미터 튜닝모델 배포 관행에 대한 가이드를 확인해 보시기 바랍니다.

댓글