YOLOv8 YOLO: 객체 탐지 모델의 포괄적 기술 비교
컴퓨터 비전 분야는 지속적으로 진화하고 있으며, 새로운 아키텍처들이 에지 디바이스와 대규모 클라우드 클러스터에서 가능한 한계를 넓혀가고 있습니다. 본 기술 심층 분석에서는 두 가지 주요 실시간 객체 탐지 모델을 비교합니다: YOLOv8 와 YOLO 비교합니다. 두 모델의 아키텍처, 성능 지표, 훈련 방법론을 분석함으로써 머신러닝 엔지니어들은 배포 파이프라인에 대한 정보에 기반한 결정을 내릴 수 있습니다.
모델 배경과 기원
두 모델은 거의 동시에 출시되었지만 서로 다른 설계 철학과 연구 목표에서 비롯되었습니다.
YOLOv8 세부 정보
- 저자: 글렌 조커, 아유시 차우라시아, 징 치우
- 조직: Ultralytics
- 날짜: 2023-01-10
- GitHub: Ultralytics 저장소
- 문서: YOLOv8 문서
YOLO
아키텍처 혁신
YOLOv8: 앵커 없는 다목적 설계
Ultralytics YOLOv8 이전 모델들에 비해 상당한 개선을 이루며, 매우 신뢰할 수 있는 최첨단 모델로서의 위상을 확고히 했습니다. 앵커 프리 탐지 헤드를 특징으로 하여 박스 예측 수를 줄이고 추론 속도를 높입니다. 이 아키텍처는 디커플링된 헤드를 활용하여 객체성, 분류, 회귀 작업을 분리함으로써 더 정확한 바운딩 박스 예측을 가능하게 합니다.
또한 YOLOv8 CIoU 함께 분포 초점 손실(DFL) CIoU YOLOv8 , 특히 작거나 가려진 대상의 경우에도 객체 경계를 정밀하게 국소화하는 모델의 능력을 향상시킵니다. 간소화된 백본은 GPU CPU 모두에 대해 고도로 최적화되어 있습니다.
YOLO: 아키텍처 탐색에 의해 주도됨
YOLO 다른 접근법을YOLO , 백본 설계를 자동화하기 위해 신경망 구조 탐색(NAS)에 크게 의존합니다. 알리바바 팀은 특히 TensorRT 가속 환경에서 최적의 지연 시간-정확도 균형을 제공하는 구조를 찾기 위해 "MAE-NAS"를 제안했습니다.
이 모델은 효율적인 특징 융합을 위해 RepGFPN(재매개변수화된 일반화 특징 피라미드 네트워크)을 통합하고, 탐지 헤드의 계산 부담을 최소화하기 위해 "ZeroHead" 설계를 적용합니다. 훈련 과정에서 레이블 할당을 위해 AlignedOTA를 활용하며, 복잡한 지식 증류 과정에 크게 의존하여 대상 학생 모델을 감독하기 위해 더 큰 교사 모델이 필요합니다.
훈련 복잡성
YOLO NAS 및 디스트일레이션을 통해 인상적인 지연 시간 지표를YOLO , 이는 고도로 최적화된 YOLOv8 단일 단계 훈련 파이프라인에 비해 훈련 과정에서 훨씬 더 많은 CUDA 계산 시간을 필요로 합니다.
성과 및 지표
컴퓨터 비전 모델을 실제 환경에 배포할 때 정확도(mAP)와 추론 속도의 균형을 맞추는 것이 매우 중요합니다. 아래 표는 다양한 크기의 모델 간 성능을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv8 탁월한 성능 균형을 YOLOv8 . YOLOv8n (nano) 모델은 DAMO-YOLOt의 850만 개에 비해 단 320만 개의 매개변수만 필요로 하여, 모바일 기기나 엄격한 메모리 요구사항이 있는 환경에서 훨씬 우월합니다. 또한 YOLOv8 더 넓은 크기 범위를 YOLOv8 , 매우 높은 정확도를 자랑하는 YOLOv8x 클라우드 기반 워크로드를 위해.
개발자 경험 및 생태계
사용 편의성 및 교육 효율성 향상
가장 큰 차별화 요소 중 하나는 사용자 경험입니다. Ultralytics 개발자 속도를 위해 설계되었습니다. 맞춤형 YOLOv8 훈련에는 매우 적은 메모리 사용량이 필요하며, 통합된 Python 또는 명령줄 인터페이스를 통해 실행할 수 있습니다.
반대로,YOLO 증류 강화 학습을 재현하려면 복잡한 구성 파일을 탐색하고 다단계 교사-학생 실험 추적을 처리해야 하는 경우가YOLO .
다음은 Python YOLOv8 훈련, 검증 및 내보내는 것이 얼마나 간단한지 보여주는 예시입니다:
from ultralytics import YOLO
# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")
# Export the trained model to ONNX format
path = model.export(format="onnx")
다양한 시력 작업에 걸친 다용도성
YOLO 경계 상자 객체 탐지를 위해 엄격하게YOLO . 반면 YOLOv8 기본적으로 다중 작업을 지원합니다. 개발자는 모델 가중치만 교체함으로써 기본 배포 코드베이스를 변경하지 않고도 인스턴스 세그멘테이션, 이미지 분류, 자세 추정 작업을 수행할 수 있습니다. 이러한 다용도성 덕분에 Ultralytics 복잡한 애플리케이션에 훨씬 더 실용적입니다.
실제 사용 사례
YOLOv8 사용 시기
YOLOv8 속도, 정확도 및 배포 용이성의 조합은 다음에 이상적입니다:
- 스마트 리테일 애널리틱스: 고객 행동 모니터링 또는 재고 점검 자동화를 위한 객체 추적 수행.
- 농업용 로봇공학: 다양한 하드웨어에서 뛰어난 성능을 활용하여 작물이나 해충을 실시간으로 식별합니다.
- 의료 진단: 인스턴스 분할을 활용하여 의료 영상 내 이상 부위를 신속하고 정확하게 매핑하기.
- 엣지 배포: OpenVINO 및 CoreML 과 같은 내보내기 형식과 원활하게 통합되어 YOLOv8 제한된 장치에서도 뛰어난 성능을 YOLOv8 있습니다.
YOLO 언제 사용해야 하는가
YOLO 특정 상황에서 유용할YOLO , 특히 다음과 같은 경우에 해당됩니다:
- 학술적 NAS 연구: 반복 매개변수화 또는 자동화된 아키텍처 설계 방법론을 연구하는 팀을 위한.
- 엄격한 GPU 파이프라인: 특정 NVIDIA 실행되는 애플리케이션으로, NAS 구조가 TensorRT 한계에 맞춰 극도로 최적화되었습니다.
사용 사례 및 권장 사항
YOLOv8 YOLO 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라YOLO .
8 선택해야 할 때
YOLOv8 다음과 같은 경우에 강력한 YOLOv8 :
- 다목적 멀티태스크 배포: Ultralytics 내에서 검출, 분할, 분류 및 자세 추정 기능을 위한 검증된 모델이 필요한 프로젝트.
- 구축된 생산 시스템: YOLOv8 기반으로 이미 구축된 기존 생산 환경으로, 안정적이고 철저히 검증된 배포 파이프라인을 갖추고 있습니다.
- 광범위한 커뮤니티 및 생태계 지원: YOLOv8 방대한 튜토리얼, 타사 통합 기능, 활발한 커뮤니티 리소스의 혜택을 받는 애플리케이션.
YOLO 선택해야 할 때
YOLO 다음에 권장YOLO :
- 고처리량 비디오 분석: 고정된 NVIDIA GPU 높은 FPS의 비디오 스트림을 처리하며, 배치 1 처리량이 주요 지표입니다.
- 산업용 제조 라인: 전용 하드웨어에서 엄격한 GPU 제약이 적용되는 시나리오, 예를 들어 조립 라인에서의 실시간 품질 검사.
- 신경망 구조 탐색 연구: 자동화된 구조 탐색(MAE-NAS)과 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향 연구.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
- 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.
앞으로의 전망: 새로운 Ultralytics
YOLOv8 매우 신뢰할 수 있는 주력 모델이지만, 컴퓨터 비전 분야는 빠르게 진화하고 있습니다. 사용자들은 또한 최신 세대 모델들을 탐구해 볼 것을 고려해야 합니다:
YOLO26: 최신 세대인 Ultralytics 패러다임 전환을 의미합니다. 이 모델은 본질적으로 엔드투엔드 NMS( NMS) 설계를 도입하여, 비최대 억제(NMS) 후처리와 관련된 지연 병목 현상을 완전히 제거합니다. 새로운 MuSGD 최적화기 ( SGD 하이브리드)와 특수화된 ProgLoss + STAL 손실 함수를 기반으로, YOLO26은 놀라울 정도로 안정적인 훈련과 대폭 개선된 소형 객체 인식 성능을 달성합니다. DFL 제거 (간소화된 내보내기와 더 나은 에지/저전력 장치 호환성을 위해 분포 초점 손실 제거)를 통해 아키텍처가 개선되어 이전 세대에 비해 최대 43% 더 빠른 CPU 가능해져 현대적인 에지 컴퓨팅을 위한 확실한 선택이 되었습니다.
YOLO11: 또 다른 훌륭한 대안, Ultralytics YOLO11YOLOv8 비해 점진적인 아키텍처 개선을 제공하며 YOLOv8 커뮤니티에서 강력하고 널리 채택된 모델로 자리매김하고 있습니다.
업무 흐름을 간소화하세요
프로토타입 모델을 생산 단계로 전환할 준비가 되셨나요? Ultralytics 활용하여 데이터셋에 자동으로 주석을 달고, track , 모델을 클라우드 또는 에지 디바이스에 원활하게 배포하세요.
결론적으로,YOLO 아키텍처 탐색에 대한 흥미로운 학술적 통찰을YOLO , Ultralytics 훨씬 더 성숙하고 다재다능하며 개발자 친화적인 생태계를YOLO . 검증된 안정성을 YOLOv8 초고속이며 NMS(네트워크 모드 선택) NMS YOLO26 아키텍처로 YOLOv8 , Ultralytics 실시간 비전 AI를 위한 최고의 선택으로 남을 것입니다.