콘텐츠로 건너뛰기

YOLOv8 YOLO: 종합적인 기술 비교

빠르게 진화하는 컴퓨터 비전 환경에서 올바른 물체 감지 모델을 선택하는 것은 프로젝트 성공을 위해 매우 중요합니다. 이 비교에서는 다음과 같은 기술적 차이점을 자세히 살펴봅니다. Ultralytics YOLOv8 과 이 분야에 큰 영향을 끼친 두 가지 주요 아키텍처인 YOLO 간의 기술적 차이를 살펴봅니다. 두 모델 모두 속도와 정확성의 한계를 뛰어넘지만, 학술 연구부터 프로덕션급 배포에 이르기까지 다양한 요구와 사용자 기반을 충족합니다.

경영진 요약

YOLOv8에서 개발한 Ultralytics에서 개발한 YOLO 사용자 중심의 다용도 제품군에서 진화된 버전입니다. 2023년 초에 출시될 이 제품은 강력하고 잘 관리된 에코시스템의 지원을 받아 탐지, 세분화, 분류, 포즈 추정, OBB 등 여러 작업을 지원하는 통합 프레임워크를 우선시합니다.

알리바바 그룹이 2022년 말 출시한 YOLO 신경망 아키텍처 검색(NAS)과 고급 기능 융합 기술에서 파생된 아키텍처 혁신에 중점을 두고 있습니다. 주로 GPU에서 처리량이 많은 객체 감지를 위해 설계되었습니다.

아키텍처 혁신

이 두 모델의 핵심적인 차이점은 설계 철학에 있습니다. YOLOv8 사용 편의성과 일반화를 강조하는 반면, YOLO 특정 성능 메트릭을 위한 아키텍처 최적화를 목표로 합니다.

Ultralytics YOLOv8: 세련되고 통합된 기능

YOLOv8 앵커가 없는 최첨단 감지 헤드를 도입하여 이전 버전의 성공을 기반으로 합니다. 이 분리형 헤드는 객체, 분류 및 회귀 작업을 독립적으로 처리하여 수렴 속도와 정확도를 향상시킵니다.

주요 아키텍처 기능은 다음과 같습니다:

  • C2f 모듈: C3 모듈을 대체하는 C2f(병목 현상이 2개인 교차 단계 부분) 블록은 가벼운 설치 공간을 유지하면서 그라데이션 흐름과 피처 표현을 개선합니다.
  • 앵커 프리 디자인: 사전 정의된 앵커 박스가 필요하지 않으므로 하이퍼파라미터의 수가 줄어들어 학습 프로세스가 간소화되고 다양한 데이터 세트에서 일반화가 향상됩니다.
  • 모자이크 데이터 증강: 복잡한 장면과 다양한 스케일에서 오브젝트를 detect 모델의 기능을 향상시키는 최적화된 파이프라인입니다.

YOLOv8에 대해 자세히 알아보세요

YOLO: 연구 중심 최적화

YOLO ("발견, 모험, 모멘텀, 전망")는 아키텍처에서 최대한의 성능을 끌어내기 위해 몇 가지 고급 연구 개념을 통합합니다.

주요 기술은 다음과 같습니다:

  • MAE-NAS 백본: 신경망 아키텍처 검색(NAS)을 활용하여 효율적인 백본 구조를 자동으로 검색하여 지연 시간과 정확도 간의 균형을 최적화합니다.
  • RepGFPN 목: 효율적인 RepGFPN(일반화된 특징 피라미드 네트워크)은 다양한 크기의 물체를 감지하는 데 중요한 다양한 규모에 걸쳐 특징 융합을 개선합니다.
  • 제로헤드: 탐지 성능을 크게 저하시키지 않으면서 계산 복잡성(FLOPs)을 줄여주는 경량 헤드 디자인입니다.
  • AlignedOTA: 학습 중 분류와 회귀 작업 간의 정렬 불일치를 해결하는 동적 라벨 할당 전략입니다.

DAMO-YOLO에 대해 자세히 알아보세요.

성능 지표

엔지니어에게 성능은 종종 결정적인 요소입니다. 아래 표는 COCO 데이터 세트의 주요 메트릭을 자세히 비교한 것입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

분석

  • 최고 수준의 정확도: 가장 큰 YOLOv8x 모델은 53. mAP 가장 높은 정확도를 달성하여 가장 큰 YOLO 변형을 능가합니다. 따라서 의료 이미지 분석이나 안전이 중요한 시스템과 같이 정밀도가 가장 중요한 애플리케이션에 YOLOv8 선호됩니다.
  • 추론 속도:YOLOv8n (나노)는 T4 GPU 1.47ms, CPU 80.4ms에 불과해 속도 면에서 압도적인 우위를 점합니다. 이러한 탁월한 속도는 엣지 디바이스에서 실시간 추론에 필수적입니다.
  • 효율성: YOLOv8 뛰어난 파라미터 효율성을 보여줍니다. 예를 들어, YOLOv8n DAMO-YOLOt의 8.5M에 비해 320만 개의 파라미터만 사용하지만 매우 경쟁력 있는 성능을 제공합니다. 이러한 낮은 메모리 풋프린트는 라즈베리 파이와 같이 리소스가 제한된 하드웨어에 배포하는 데 매우 중요합니다.
  • CPU 성능: Ultralytics 투명한 CPU 벤치마크를 제공하는 반면, YOLO 공식 CPU 데이터가 부족합니다. 전용 GPU를 사용할 수 없는 많은 기업에게 YOLOv8 입증된 CPU 성능은 큰 장점입니다.

배포 유연성

YOLOv8 모델은 다음을 사용하여 ONNX, TensorRT, CoreML 및 TFLite 포함한 다양한 포맷으로 쉽게 내보낼 수 있습니다. yolo export 명령입니다. 이 모델 배포 기능을 통해 다양한 프로덕션 환경에 원활하게 통합할 수 있습니다.

사용성 및 에코시스템

연구 모델과 프로덕션 도구의 차이는 종종 에코시스템과 사용 편의성에 의해 정의됩니다.

Ultralytics 에코시스템의 이점

YOLOv8 단순한 모델이 아니라 종합적인 플랫폼의 일부입니다. Ultralytics 에코시스템이 제공합니다:

  • 간단한 API: 통합 Python 인터페이스를 통해 개발자는 5줄 미만의 코드로 모델을 학습, 검증 및 배포할 수 있습니다.
  • 광범위한 문서: 자세한 가이드, 튜토리얼 및 용어집은 사용자가 복잡한 컴퓨터 비전 개념을 탐색하는 데 도움이 됩니다.
  • 커뮤니티 지원: GitHub와 Discord의 활발한 커뮤니티를 통해 문제를 신속하게 해결할 수 있습니다.
  • 통합: 다음과 같은 도구에 대한 기본 지원 Weights & Biases, CometRoboflow 는 MLOps 파이프라인을 간소화합니다.

YOLO 사용성

YOLO 주로 리서치 저장소입니다. 인상적인 기술을 제공하지만 학습 곡선이 가파르다는 단점이 있습니다. 사용자는 종종 환경을 수동으로 구성하고 복잡한 코드베이스를 탐색하여 사용자 지정 데이터 세트에 맞게 모델을 조정해야 합니다. Ultralytics 프레임워크에서 볼 수 있는 광범위한 다중 작업 지원(세분화, 포즈 등)이 부족합니다.

사용 사례 및 응용 분야

YOLOv8 이상적인 시나리오

  • 멀티태스크 비전 시스템: 물체 감지, 인스턴스 분할, 포즈 추정이 동시에 필요한 프로젝트.
  • 엣지 AI: 메모리 효율성과 짧은 지연 시간이 중요한 NVIDIA Jetson 또는 휴대폰과 같은 디바이스에 배포합니다.
  • 신속한 프로토타이핑: 데이터 수집부터 모델 배포까지 빠르게 반복해야 하는 스타트업 및 R&D 팀에 적합합니다.
  • 산업 자동화: 신뢰성과 표준 통합이 필요한 품질 검사를 사용하는 제조 라인.

YOLO 위한 이상적인 시나리오

  • GPU 서버: 강력한 GPU에서 대량의 이미지를 처리하는 고처리량 클라우드 서비스입니다.
  • 학술 연구: 객체 감지 아키텍처에서 NAS 및 증류 기술의 효율성을 조사하는 연구원.

교육 예시: YOLOv8

Ultralytics API의 단순함을 경험해 보세요. 다음 코드 스니펫은 사전 학습된 YOLOv8 모델을 로드하고 사용자 지정 데이터 집합에서 미세 조정하는 방법을 보여 줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on your custom data
# The data argument points to a YAML file describing your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

이 간단한 워크플로는 일반적으로 YOLO 같은 연구 중심 모델에 필요한 설정이 많은 설정과 대조적입니다.

결론

두 아키텍처 모두 컴퓨터 비전 분야에서 중요한 업적을 남겼습니다. YOLO 제로헤드 및 MAE-NAS와 같은 강력한 혁신 기술을 도입하여 특정 고성능 GPU 작업에 강력한 경쟁자가 되었습니다.

하지만 대다수의 개발자와 조직은 그렇지 않습니다, Ultralytics YOLOv8 이 여전히 최고의 선택입니다. 탁월한 다용도성, 포괄적인 문서화, 활기찬 에코시스템은 AI 도입에 따른 마찰을 줄여줍니다. 고속도로에서 속도 추정을 최적화하든 실험실에서 세분화된 조직 분할을 수행하든, YOLOv8 솔루션을 효율적으로 생산에 적용하는 데 필요한 균형 잡힌 성능과 툴링을 제공합니다.

다른 모델 살펴보기

모델을 비교하는 것은 특정 요구사항에 적합한 도구를 찾는 가장 좋은 방법입니다. 다른 비교 항목을 확인해 보세요:


댓글