콘텐츠로 건너뛰기

모델 비교: 객체 탐지를 위한 YOLOv8 vs YOLOv10

모든 컴퓨터 비전 프로젝트의 성공을 위해 올바른 객체 감지 모델을 선택하는 것은 매우 중요합니다. 이 페이지에서는 해당 분야의 최첨단 모델인 Ultralytics YOLOv8과 YOLOv10 간의 자세한 기술 비교를 제공합니다. 특정 요구 사항에 대한 정보에 입각한 결정을 내리는 데 도움이 되도록 아키텍처의 뉘앙스, 성능 지표, 훈련 방법 및 이상적인 애플리케이션을 분석합니다.

Ultralytics YOLOv8: 다재다능함과 성숙도

작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/

Ultralytics에서 2023년 1월에 출시한 Ultralytics YOLOv8은 YOLO 이전 모델의 강점을 기반으로 하는 성숙하고 매우 다재다능한 모델입니다. 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 방향 경계 상자(OBB)를 포함한 광범위한 비전 AI 작업에서 속도, 정확성 및 사용 편의성을 위해 설계되었습니다.

아키텍처 및 주요 기능

YOLOv8은 YOLO 시리즈의 중요한 진화로, 모델 아키텍처를 단순화하고 다양한 데이터 세트에서 일반화(generalization)를 향상시키는 앵커 프리(anchor-free) 감지 방식을 특징으로 합니다. 유연한 백본과 최적화된 손실 함수는 정확도 향상과 보다 안정적인 훈련에 기여합니다. YOLOv8의 주요 장점은 Nano(n)에서 Extra-large(x)에 이르기까지 다양한 계산 및 정확도 요구 사항을 충족하는 다양한 모델 크기를 제공하는 확장성입니다. 이러한 다재다능함은 단일 통합 프레임워크 내에서 여러 작업을 지원하므로 객체 감지 이상의 기능이 필요한 프로젝트에 적합한 선택입니다.

성능 및 강점

YOLOv8은 강력한 성능 균형을 제공하여 실시간 애플리케이션에 적합한 빠른 추론 속도를 유지하면서 높은 mAP 점수를 달성합니다. 예를 들어 YOLOv8x는 COCO 데이터 세트에서 53.9% mAPval 50-95에 도달합니다. 효율적인 설계로 인해 특히 RT-DETR과 같은 트랜스포머 기반 모델에 비해 훈련 및 추론 중에 더 낮은 메모리 요구 사항이 보장됩니다.

  • 성숙하고 문서화가 잘 되어 있음: YOLOv8은 광범위한 문서, 대규모 커뮤니티 및 즉시 사용 가능한 리소스의 이점을 누릴 수 있어 간단한 PythonCLI 인터페이스를 통해 매우 사용자 친화적이고 쉽게 구현할 수 있습니다.
  • 다재다능한 멀티태스킹: 광범위한 비전 작업을 지원하므로 보다 전문화된 모델에 비해 주요 이점을 제공하며 복잡한 프로젝트 요구 사항에 대해 탁월한 유연성을 제공합니다.
  • 잘 관리되는 에코시스템: 이 모델은 학습에서 배포에 이르기까지 워크플로를 간소화하는 플랫폼인 Ultralytics HUB와 원활하게 통합됩니다. Ultralytics의 활발한 개발과 잦은 업데이트로 지원됩니다.
  • 성능 균형: 속도, 정확성 및 모델 크기 간에 뛰어난 균형을 제공하므로 광범위한 실제 배포 시나리오에 적합합니다.
  • 학습 효율성: YOLOv8은 효율적인 학습 프로세스와 즉시 사용 가능한 사전 학습된 가중치를 제공하여 개발 주기를 크게 단축합니다.

약점

매우 효율적이지만, YOLOv8은 원시 속도 또는 파라미터 수를 최우선으로 하는 YOLOv10과 같은 최신 모델에 의해 특정의 매우 제한적인 벤치마크에서 약간 성능이 떨어질 수 있습니다. 그러나 YOLOv8은 종종 사용 편의성, 다재다능성 및 지원 측면에서 더 나은 전체 패키지를 제공합니다.

이상적인 사용 사례

YOLOv8의 다재다능함과 사용 편의성은 광범위한 애플리케이션에 이상적입니다.

  • 보안 시스템: 보안 경보 시스템에서 실시간 객체 감지에 탁월합니다.
  • 리테일 분석: 고객 행동 이해 및 재고 관리를 위한 스마트 리테일에 유용.
  • 산업 품질 관리: 자동화된 시각적 검사를 위해 제조에 적용 가능합니다.
  • 다중 작업 프로젝트: 단일 모델에서 감지, 분할 및 자세 추정을 동시에 요구하는 프로젝트에 이상적입니다.

YOLOv8에 대해 자세히 알아보세요

YOLOv10: 효율성의 한계 돌파

작성자: Ao Wang, Hui Chen, Lihao Liu 외
소속: Tsinghua University
날짜: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
문서: https://docs.ultralytics.com/models/yolov10/

YOLOv10은(는) 2024년 5월에 소개되었으며, 경쟁력 있는 정확도를 유지하면서 효율성과 속도를 극대화하는 데 중점을 둡니다. 특히 실시간 및 에지 애플리케이션을 목표로 합니다. 주요 혁신은 NMS(Non-Maximum Suppression)가 필요 없는 훈련 방식으로, 후처리 지연 시간을 줄이고 진정한 엔드 투 엔드 객체 탐지를 가능하게 합니다.

아키텍처 및 주요 기능

YOLOv10은 전체적인 효율성-정확도 중심 모델 설계를 특징으로 합니다. 계산 중복성을 줄이고 감지 기능을 향상시키기 위해 다양한 구성 요소를 최적화합니다. 학습에 일관된 이중 할당을 사용하여 NMS 단계를 제거하여 배포 파이프라인을 단순화합니다. 이는 상당한 진전이지만 YOLOv10은 주로 객체 감지에 중점을 두고 있으며 YOLOv8의 내장된 다중 작업 다용성이 부족하다는 점에 유의해야 합니다.

성능 분석

YOLOv10은 최첨단 효율성을 보여주며 이전의 많은 YOLO 버전에 비해 더 빠른 추론 속도와 더 작은 모델 크기를 제공합니다. 예를 들어 YOLOv10-S는 7.2M 파라미터만으로 46.7% mAPval 50-95를 달성합니다. 아래 표는 주어진 정확도 수준에서 YOLOv10 모델이 YOLOv8 모델보다 파라미터 수가 적고 FLOP가 낮은 경우가 많다는 것을 보여줍니다. 그러나 YOLOv8은 특히 CPU에서 매우 경쟁력 있는 속도를 유지하며, CPU에서 고도로 최적화되었습니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

강점과 약점

  • 향상된 효율성: 많은 비교에서 더 빠른 추론 속도와 더 작은 모델 크기를 제공하므로 리소스가 제한된 환경에 유용합니다.
  • NMS-Free 학습: NMS 후처리 단계를 제거하여 배포 파이프라인을 단순화하고 지연 시간을 줄입니다.
  • 최첨단 성능: 특히 대기 시간 중심 벤치마크에서 뛰어난 성능을 달성합니다.

그러나 YOLOv10에는 몇 가지 제한 사항도 있습니다.

  • 더 새로운 모델: 더 최신 모델이므로, 확고하게 자리 잡은 YOLOv8에 비해 커뮤니티 규모가 더 작고 즉시 사용 가능한 리소스 또는 타사 통합이 더 적습니다.
  • 생태계 통합: Ultralytics 라이브러리에 통합되었지만 포괄적인 Ultralytics 생태계의 기본 모델인 YOLOv8과 같은 모델에 비해 기존 MLOps 워크플로에 맞추려면 더 많은 노력이 필요할 수 있습니다.
  • Task Specialization: 주로 객체 탐지에 중점을 두고 있으며 YOLOv8에서 제공하는 분할, 분류 및 포즈 추정에 대한 기본 제공 다용성이 부족합니다.

이상적인 사용 사례

YOLOv10은 실시간 성능과 리소스 효율성이 가장 중요한 애플리케이션에 특히 적합합니다.

  • Edge 장치: 휴대폰 및 임베디드 시스템과 같이 제한된 컴퓨팅 성능을 가진 장치에 배포하는 데 이상적입니다.
  • 고속 처리: 자율 드론 및 로봇 공학과 같이 매우 낮은 지연 시간을 요구하는 애플리케이션에 적합합니다.
  • 실시간 분석: 교통 관리와 같이 즉각적인 객체 감지가 필요한 빠르게 변화하는 환경에 적합합니다.

YOLOv10에 대해 자세히 알아보세요

결론

Ultralytics YOLOv8과 YOLOv10은 모두 강력하고 효과적인 객체 감지 모델입니다. 둘 중 어떤 것을 선택할지는 프로젝트별 우선순위에 크게 좌우됩니다.

Ultralytics YOLOv8은 대부분의 개발자와 연구자에게 권장되는 선택입니다. 뛰어난 다재다능함, 사용 편의성, 강력한 생태계, 그리고 속도와 정확성의 훌륭한 균형으로 두드러집니다. 멀티태스크 기능은 분할, 포즈 추정 또는 기타 비전 작업을 포함하도록 발전할 수 있는 프로젝트를 위한 미래 보장형 솔루션입니다.

YOLOv10은 특수화된 지연 시간에 민감한 애플리케이션에 대해 강력한 효율성 향상을 제공합니다. 프로젝트의 주요 제약 조건이 저전력 에지 장치에 배포하거나 단일 작업에 대해 가능한 가장 낮은 추론 시간을 달성하는 것이라면 YOLOv10이 강력한 경쟁자가 될 것입니다.

다른 최첨단 모델 탐색에 관심 있는 사용자를 위해 Ultralytics는 높은 평가를 받는 YOLOv5, 혁신적인 YOLOv9 및 최신 YOLO11을 포함한 다양한 옵션을 제공합니다. 필요에 가장 적합한 모델을 선택하는 데 도움이 되도록 YOLOv9 vs YOLOv8YOLOv5 vs YOLOv8과 같은 추가 비교를 확인할 수 있습니다.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글