YOLOv10 vs YOLOv8: 객체 감지를 위한 기술 비교
모든 컴퓨터 비전 프로젝트의 성공을 위해 올바른 객체 감지 모델을 선택하는 것은 매우 중요합니다. 이 페이지에서는 해당 분야의 최첨단 모델인 YOLOv10과 Ultralytics YOLOv8 간의 자세한 기술 비교를 제공합니다. 속도, 정확성 및 리소스 효율성에 대한 특정 요구 사항에 따라 정보에 입각한 결정을 내리는 데 도움이 되도록 아키텍처 차이점, 성능 지표 및 이상적인 애플리케이션을 분석합니다.
YOLOv10: 효율성의 한계 돌파
작성자: Ao Wang, Hui Chen, Lihao Liu 외
소속: Tsinghua University
날짜: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
문서: https://docs.ultralytics.com/models/yolov10/
YOLOv10은(는) 2024년 5월에 소개되었으며, 진정한 엔드 투 엔드 실시간 객체 탐지를 달성하기 위한 중요한 단계입니다. 주요 혁신은 후처리 병목 현상을 제거하고 효율성을 극대화하기 위해 모델 아키텍처를 최적화하는 데 중점을 둡니다. 주요 특징은 NMS(Non-Maximum Suppression)의 필요성을 없애기 위해 일관된 이중 할당을 사용하는 NMS-free 훈련 방식으로, 추론 지연 시간을 줄입니다.
아키텍처 및 주요 기능
YOLOv10은 전체적인 효율성-정확도 중심 모델 설계를 도입했습니다. 경량 분류 헤드 구현 및 공간-채널 분리 다운샘플링 사용과 같은 다양한 구성 요소를 최적화하여 계산 중복성을 줄이고 감지 기능을 향상시킵니다. 칭화대학교에서 개발되었지만 YOLOv10은 Ultralytics 프레임워크를 기반으로 구축되어 통합되었으므로 친숙한 Ultralytics API를 통해 액세스하고 사용하기 쉽습니다.
강점
- 향상된 효율성: 직접 비교에서 더 빠른 추론 속도와 더 작은 모델 크기를 제공하므로 에지 장치와 같이 리소스가 제한된 환경에 매우 유용합니다.
- NMS-Free 설계: NMS 사후 처리 단계를 제거하여 배포 파이프라인을 간소화하여 엔드 투 엔드 지연 시간을 줄입니다.
- 최첨단 성능: 특히 대기 시간 중심 벤치마크에서 뛰어난 성능을 달성하여 속도-정확도 절충에 대한 최첨단 기술을 제공합니다.
약점
- 더 새로운 모델: 더 최신 릴리스이므로, 확고하게 자리 잡은 YOLOv8에 비해 커뮤니티 규모가 더 작고 타사 통합이 더 적습니다.
- Task Specialization: YOLOv10은 주로 객체 탐지에 중점을 둡니다. YOLOv8의 기본 기능인 세분화 및 포즈 추정과 같은 다른 비전 작업에 대한 기본 제공 다기능성이 부족합니다.
- 생태계 성숙도: Ultralytics 생태계에 통합되었지만 아직 YOLOv8만큼 풍부한 리소스와 커뮤니티 기반 예제가 없습니다.
이상적인 사용 사례
YOLOv10은 실시간 성능과 리소스 효율성이 가장 중요한 애플리케이션에 특히 적합합니다.
- Edge AI: 휴대폰 및 NVIDIA Jetson과 같은 임베디드 시스템과 같이 컴퓨팅 성능이 제한된 장치에 배포하는 데 이상적입니다.
- 고속 처리: 자율 드론 및 로봇 공학과 같이 매우 낮은 지연 시간이 필요한 애플리케이션에 적합합니다.
- 실시간 분석: 교통 관리와 같이 즉각적인 객체 감지가 필요한 빠르게 변화하는 환경에 적합합니다.
Ultralytics YOLOv8: 다재다능함과 성숙도
작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/
2023년 1월에 출시된 Ultralytics YOLOv8은 YOLO 이전 모델의 강점을 기반으로 하는 성숙하고 매우 다재다능한 모델입니다. 광범위한 비전 AI 작업에서 속도, 정확성 및 사용 편의성을 위해 설계되었습니다. 따라서 개발자와 연구자 모두에게 강력하고 안정적인 선택입니다.
아키텍처 및 주요 기능
YOLOv8은 모델 아키텍처를 단순화하고 일반화 성능을 향상시키는 앵커 프리 감지 방식을 특징으로 합니다. 유연한 백본과 최적화된 손실 함수는 더 높은 정확도와 보다 안정적인 훈련에 기여합니다. YOLOv8의 뛰어난 기능은 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(Oriented Bounding Box)를 포함한 여러 비전 작업에 대한 기본 지원입니다.
강점
- 성숙하고 문서화가 잘 되어 있음: 광범위한 문서, 대규모 커뮤니티 및 즉시 사용 가능한 리소스의 이점을 누릴 수 있어 간단한 Python 및 CLI 인터페이스를 통해 사용자 친화적이고 쉽게 구현할 수 있습니다.
- 다재다능한 멀티태스킹: 다양한 비전 작업을 즉시 지원하여 단순 감지 이상의 기능이 필요한 복잡한 프로젝트에 탁월한 유연성을 제공합니다.
- 잘 관리되는 에코시스템: Ultralytics HUB 및 기타 MLOps 도구와 원활하게 통합되어 학습에서 배포에 이르기까지 워크플로를 간소화합니다. 활발한 개발과 잦은 업데이트로 지원됩니다.
- 성능 균형: 속도, 정확성 및 모델 크기 간에 뛰어난 균형을 제공하므로 광범위한 실제 배포 시나리오에 적합합니다.
- 학습 효율성: 효율적인 학습 프로세스와 즉시 사용 가능한 사전 학습된 가중치를 제공하여 개발 주기를 가속화합니다. 또한 특히 트랜스포머 기반 모델과 비교하여 다른 많은 아키텍처보다 더 낮은 메모리 요구 사항을 가집니다.
약점
- 매우 효율적이지만, YOLOv10과 같은 최신 모델은 파라미터 수 또는 지연 시간과 같이 매우 제한적인 시나리오에서 특정 메트릭의 미세한 개선을 제공할 수 있습니다.
이상적인 사용 사례
YOLOv8은 다재다능함과 사용 편의성 덕분에 광범위한 응용 분야에 이상적인 선택입니다.
- 보안 시스템: 보안 경보 시스템에서 실시간 객체 탐지에 탁월합니다.
- 리테일 분석: 고객 행동 이해 및 재고 관리를 위한 스마트 리테일에 유용.
- 산업 품질 관리: 자동화된 육안 검사를 위해 제조 분야에 적용 가능합니다.
- 다중 작업 프로젝트: 단일하고 효율적인 모델에서 감지, 분할 및 자세 추정을 동시에 요구하는 프로젝트에 완벽한 선택입니다.
성능 분석: YOLOv10 vs. YOLOv8
COCO 데이터 세트의 성능 지표는 두 모델 간의 주요 차이점을 보여줍니다. YOLOv10은 비슷한 크기의 YOLOv8 모델에 비해 더 적은 매개변수와 FLOP로 일관되게 더 높은 mAP 점수를 달성합니다. 예를 들어 YOLOv10-S는 7.2M 매개변수로 46.7% mAP를 달성하는 반면 YOLOv8-S는 11.2M 매개변수로 44.9% mAP에 도달합니다. 이는 YOLOv10의 우수한 아키텍처 효율성을 강조합니다.
그러나 YOLOv8은 특히 GPU에서 매우 경쟁력 있는 추론 속도를 유지합니다. 가장 작은 모델인 YOLOv8n은 TensorRT가 장착된 T4 GPU에서 YOLOv10n보다 약간 빠릅니다(1.47ms 대 1.56ms). 또한 YOLOv8은 GPU 액세스 권한이 없을 수 있는 배포에 대한 강력하고 안정적인 성능을 입증하는 완벽한 CPU 벤치마크 제품군을 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
결론 및 권장 사항
YOLOv10과 YOLOv8은 모두 강력한 모델이지만, 서로 다른 우선순위를 충족합니다. YOLOv10은 순수한 효율성에서 탁월하며, 더 낮은 대기 시간과 더 적은 매개변수로 최첨단 성능을 제공하므로 특수화된 대기 시간에 중요한 애플리케이션에 탁월한 선택입니다.
그러나 대다수의 개발자와 연구자에게 Ultralytics YOLOv8이 권장되는 선택입니다. 주요 이점은 성숙도, 다재다능성 및 강력한 생태계에 있습니다. 여러 작업(감지, 분할, 자세, 분류 및 OBB)에 대한 YOLOv8의 기본 지원은 복잡하고 다면적인 AI 솔루션을 구축하는 데 상당한 이점을 제공합니다. 광범위한 문서, 활발한 커뮤니티 및 Ultralytics HUB와 같은 도구와의 원활한 통합은 더욱 우수하고 간소화된 개발 경험을 제공합니다. 가장 광범위한 실제 애플리케이션에 안정적인 속도와 정확도의 뛰어난 입증된 균형을 제공합니다.
다른 모델 살펴보기
다른 최첨단 모델 탐색에 관심 있는 사용자를 위해 Ultralytics는 기본 YOLOv5, 효율적인 YOLOv9 및 최신 YOLO11을 포함한 포괄적인 제품군을 제공합니다. YOLOv9 vs. YOLOv8 및 YOLOv5 vs. YOLOv8과 같은 자세한 비교도 프로젝트에 적합한 모델을 선택하는 데 도움이 되도록 제공됩니다.