YOLOv8 YOLO: 객체 탐지 모델의 포괄적 기술 비교
컴퓨터 비전 분야는 지속적으로 진화하고 있으며, 새로운 아키텍처들이 에지 디바이스와 대규모 클라우드 클러스터에서 가능한 한계를 넓혀가고 있습니다. 본 기술 심층 분석에서는 두 가지 주요 실시간 객체 탐지 모델을 비교합니다: YOLOv8 와 YOLO 비교합니다. 두 모델의 아키텍처, 성능 지표, 훈련 방법론을 분석함으로써 머신러닝 엔지니어들은 배포 파이프라인에 대한 정보에 기반한 결정을 내릴 수 있습니다.
모델 배경과 기원
두 모델 모두 거의 동시에 소개되었지만, 서로 다른 설계 철학과 연구 목표에서 비롯되었습니다.
YOLOv8 세부 정보
- 저자: 글렌 조커, 아유시 차우라시아, 징 치우
- 조직: Ultralytics
- 날짜: 2023-01-10
- GitHub: Ultralytics 저장소
- 문서: YOLOv8 공식 문서
DAMO-YOLO 세부 정보
- 저자: 쉬셴저, 장이치, 천웨이화, 황이룬, 장위안, 쑨시위
- 조직: 알리바바 그룹
- 날짜: 2022-11-23
- Arxiv: DAMO-YOLO 연구 논문
- GitHub: YOLO 저장소
아키텍처 혁신
YOLOv8: 앵커 없는 다목적 설계
Ultralytics YOLOv8은 이전 버전보다 상당한 개선을 이루어, 매우 신뢰할 수 있는 최첨단 모델로서의 입지를 굳혔습니다. 이 모델은 박스 예측 수를 줄이고 추론 속도를 높이는 앵커 프리 detect 헤드를 특징으로 합니다. 아키텍처는 객체성, 분류 및 회귀 작업을 분리하는 디커플드 헤드를 활용하여 더 정확한 바운딩 박스 예측을 가능하게 합니다.
또한 YOLOv8 CIoU 함께 분포 초점 손실(DFL) CIoU YOLOv8 , 특히 작거나 가려진 대상의 경우에도 객체 경계를 정밀하게 국소화하는 모델의 능력을 향상시킵니다. 간소화된 백본은 GPU CPU 모두에 대해 고도로 최적화되어 있습니다.
DAMO-YOLO: 아키텍처 탐색 기반
DAMO-YOLO는 백본을 자동으로 설계하기 위해 신경망 아키텍처 검색(NAS)에 크게 의존하는 다른 접근 방식을 취합니다. Alibaba 팀은 특히 TensorRT 가속 환경에서 최적의 지연 시간-정확도 균형을 제공하는 구조를 찾기 위해 "MAE-NAS"를 도입했습니다.
이 모델은 효율적인 특징 융합을 위해 RepGFPN(재매개변수화된 일반화 특징 피라미드 네트워크)을 통합하고, 탐지 헤드의 계산 부담을 최소화하기 위해 "ZeroHead" 설계를 적용합니다. 훈련 과정에서 레이블 할당을 위해 AlignedOTA를 활용하며, 복잡한 지식 증류 과정에 크게 의존하여 대상 학생 모델을 감독하기 위해 더 큰 교사 모델이 필요합니다.
훈련 복잡성
YOLO NAS 및 디스트일레이션을 통해 인상적인 지연 시간 지표를YOLO , 이는 고도로 최적화된 YOLOv8 단일 단계 훈련 파이프라인에 비해 훈련 과정에서 훨씬 더 많은 CUDA 계산 시간을 필요로 합니다.
성과 및 지표
컴퓨터 비전 모델을 실제 환경에 배포할 때 정확도(mAP)와 추론 속도의 균형을 맞추는 것이 매우 중요합니다. 아래 표는 다양한 크기의 모델 간 성능을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv8 탁월한 성능 균형을 YOLOv8 . YOLOv8n (나노) 모델은 DAMO-YOLOt의 850만 개와 비교하여 320만 개의 파라미터만 필요하므로, 모바일 장치 또는 엄격한 메모리 요구 사항이 있는 환경에 훨씬 더 우수합니다. 또한, YOLOv8은 매우 정확한 모델까지 확장되는 더 넓은 범위의 크기를 제공합니다. YOLOv8x 클라우드 기반 워크로드를 위해.
개발자 경험 및 생태계
사용 편의성 및 교육 효율성 향상
가장 큰 차별화 요소 중 하나는 사용자 경험입니다. Ultralytics 개발자 속도를 위해 설계되었습니다. 맞춤형 YOLOv8 훈련에는 매우 적은 메모리 사용량이 필요하며, 통합된 Python 또는 명령줄 인터페이스를 통해 실행할 수 있습니다.
반대로, DAMO-YOLO의 증류 강화 학습을 재현하는 것은 종종 복잡한 구성 파일을 탐색하고 다단계 교사-학생 실험 추적을 처리해야 합니다.
다음은 Python YOLOv8 훈련, 검증 및 내보내는 것이 얼마나 간단한지 보여주는 예시입니다:
from ultralytics import YOLO
# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")
# Export the trained model to ONNX format
path = model.export(format="onnx")
다양한 시력 작업에 걸친 다용도성
DAMO-YOLO는 바운딩 박스 객체 detect를 위해 엄격하게 구축되었습니다. 이와 대조적으로, YOLOv8 아키텍처는 여러 작업을 기본적으로 지원합니다. 개발자는 모델 가중치만 교체함으로써 기본 배포 코드베이스를 변경하지 않고도 인스턴스 segment, 이미지 분류 및 자세 추정을 수행할 수 있습니다. 이러한 다재다능함은 Ultralytics 모델을 복잡한 애플리케이션에 훨씬 더 실용적으로 만듭니다.
실제 사용 사례
YOLOv8 사용 시기
YOLOv8 속도, 정확도 및 배포 용이성의 조합은 다음에 이상적입니다:
- 스마트 리테일 분석: 객체 track을 수행하여 고객 행동을 모니터링하거나 재고 확인을 자동화합니다.
- 농업 로봇 공학: 다양한 하드웨어에서 강력한 성능을 활용하여 실시간으로 작물이나 해충을 식별합니다.
- 헬스케어 진단: 인스턴스 분할을 사용하여 의료 영상의 이상 징후를 빠르고 정확하게 매핑합니다.
- 엣지 배포: OpenVINO 및 CoreML과 같은 내보내기 형식과의 원활한 통합을 통해 YOLOv8은 제약이 있는 장치에서 뛰어난 성능을 발휘할 수 있습니다.
YOLO 언제 사용해야 하는가
DAMO-YOLO는 특정 틈새 시나리오에서 유용할 수 있습니다. 특히:
- 학술적 NAS 연구: 재매개변수화 또는 자동화된 아키텍처 설계 방법론을 연구하는 팀을 위한 것입니다.
- 엄격한 GPU 종속 파이프라인: NAS 구조가 TensorRT 실행 제한에 맞춰 고도로 최적화된 특정 NVIDIA 하드웨어에서만 실행되는 애플리케이션입니다.
사용 사례 및 권장 사항
YOLOv8과 DAMO-YOLO 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
8 선택해야 할 때
YOLOv8 다음과 같은 경우에 강력한 YOLOv8 :
- 다재다능한 다중 작업 배포: Ultralytics 생태계 내에서 detect, 세분화, 분류 및 자세 추정을 위한 검증된 모델이 필요한 프로젝트.
- 구축된 프로덕션 시스템: 안정적이고 잘 테스트된 배포 파이프라인을 갖추고 이미 YOLOv8 아키텍처를 기반으로 구축된 기존 프로덕션 환경.
- 광범위한 커뮤니티 및 생태계 지원: YOLOv8의 광범위한 튜토리얼, 타사 통합 및 활발한 커뮤니티 리소스로부터 이점을 얻는 애플리케이션.
YOLO 선택해야 할 때
DAMO-YOLO는 다음 경우에 권장됩니다.
- 고처리량 비디오 분석: 배치-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리합니다.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
- 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화된 백본이 detect 성능에 미치는 영향 연구.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
- 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.
앞으로의 전망: 새로운 Ultralytics
YOLOv8 매우 신뢰할 수 있는 주력 모델이지만, 컴퓨터 비전 분야는 빠르게 진화하고 있습니다. 사용자들은 또한 최신 세대 모델들을 탐구해 볼 것을 고려해야 합니다:
YOLO26: 최신 세대인 Ultralytics YOLO26은 패러다임의 전환을 의미합니다. 기본적으로 End-to-End NMS-Free Design을 도입하여 Non-Maximum Suppression 후처리 관련 지연 병목 현상을 완전히 제거합니다. 새로운 MuSGD Optimizer (SGD와 Muon의 하이브리드)와 특수 ProgLoss + STAL 손실 함수로 구동되는 YOLO26은 놀랍도록 안정적인 학습과 크게 향상된 작은 객체 인식을 달성합니다. DFL Removal (간소화된 내보내기 및 더 나은 엣지/저전력 장치 호환성을 위해 Distribution Focal Loss 제거)을 통해 아키텍처 조정은 이전 세대에 비해 최대 43% 더 빠른 CPU Inference를 제공하여 현대 엣지 컴퓨팅을 위한 최종적인 선택이 됩니다.
YOLO11: 또 다른 훌륭한 대안인 Ultralytics YOLO11은 YOLOv8에 비해 점진적인 아키텍처 개선을 제공하며, 커뮤니티에서 강력하고 널리 채택된 모델로 남아 있습니다.
업무 흐름을 간소화하세요
프로토타입 모델을 생산 단계로 전환할 준비가 되셨나요? Ultralytics 활용하여 데이터셋에 자동으로 주석을 달고, track , 모델을 클라우드 또는 에지 디바이스에 원활하게 배포하세요.
결론적으로,YOLO 아키텍처 탐색에 대한 흥미로운 학술적 통찰을YOLO , Ultralytics 훨씬 더 성숙하고 다재다능하며 개발자 친화적인 생태계를YOLO . 검증된 안정성을 YOLOv8 초고속이며 NMS(네트워크 모드 선택) NMS YOLO26 아키텍처로 YOLOv8 , Ultralytics 실시간 비전 AI를 위한 최고의 선택으로 남을 것입니다.