YOLOv10 YOLOv8: 실시간 객체 탐지 아키텍처의 발전
실시간 객체 탐지 기술의 지형도는 끊임없이 진화하고 있으며, 새로운 아키텍처들이 속도, 정확도, 효율성의 한계를 넓혀가고 있습니다. 본 기술 비교에서는 YOLOv10, 비최대 억제(NMS) 제거에 초점을 맞춘 학술적 돌파구, 그리고 Ultralytics YOLOv8를 비교 분석합니다.
개발자는 아키텍처 차이점, 성능 지표 및 훈련 방법론을 분석함으로써 에지 배포부터 고처리량 클라우드 추론에 이르는 컴퓨터 비전 애플리케이션에 적합한 모델을 선택할 때 정보에 기반한 결정을 내릴 수 있습니다.
성능 지표 비교
다음 표는 주요 성능 지표에 대한 상세한 비교를 제시합니다. YOLOv10 NMS 단계를 제거함으로써 경쟁력 있는 지연 시간을 YOLOv10 반면, YOLOv8 단순 탐지 작업을 넘어 더 광범위한 작업에 적합한 균형 잡힌 성능 프로파일을 YOLOv8 .
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10: 엔드투엔드 선구자
YOLOv10 칭화대학교 연구진이 개발한 YOLOv10은 후처리 과정에서 비최대 억제(NMS)에 대한 의존성을 제거하는 것을 주요 목표로 한다. 기존 YOLO 단일 객체에 대해 여러 개의 바운딩 박스를 예측하고 중복을 걸러내기 NMS 의존한다. YOLOv10 훈련 과정에서 일관된 이중 할당 전략을 YOLOv10 모델이 객체당 단일 최적 박스를 직접 예측할 수 있도록 한다.
아키텍처 및 혁신
- NMS 훈련: 풍부한 감독을 위한 다대다(one-to-many)와 효율적인 추론을 위한 일대일(one-to-one)이라는 이중 레이블 할당을 활용함으로써,YOLOv10 NMS 인한 추론 지연을YOLOv10 .
- 전체적 효율성 설계: 이 아키텍처는 경량 분류 헤드와 공간-채널 분리 다운샘플링을 포함하여 정확도를 저하시키지 않으면서 계산 오버헤드(FLOPs)를 줄입니다.
- 대형 커널 컨볼루션: 대형 커널 깊이별 컨볼루션을 표적적으로 활용하면 수용 야영이 개선되어 작은 물체 감지에 도움이 됩니다.
메타데이터:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직:조직: 칭화 대학교
- 날짜:23
- Arxiv:arXiv:2405.14458
- GitHub:THU-MIG/yolov10
Ultralytics YOLOv8: 견고한 업계 표준
Ultralytics YOLOv8 유연성과 사용 편의성을 위해 설계된 성숙하고 생산 환경에 바로 적용 가능한 프레임워크를 대표합니다. 표준 NMS 활용하지만, 고도로 최적화된 아키텍처와 Ultralytics 통합으로 안정성, 다중 작업 지원, 원활한 배포가 필요한 개발자들에게 선호되는 선택입니다.
주요 건축적 강점
- 통합 프레임워크: 탐지에만 국한된 많은 학술 모델과 달리, YOLOv8 단일 코드베이스 내에서 인스턴스 분할, 자세 추정, OBB(Object Bounding Box), 분류를 YOLOv8 지원합니다.
- 앵커 프리 탐지: 앵커 기반 접근법에서 벗어나 객체 중심을 직접 예측함으로써 훈련 파이프라인을 단순화하고 다양한 데이터셋 간 일반화 성능을 향상시킵니다.
- 모자이크 증강: 실시간 고급 데이터 증강 기술로 가림 현상 및 변화하는 조명 조건에 대한 내성을 강화합니다.
- 최적화된 생태계: 사용자는 데이터셋 관리, 모델 훈련, TensorRT, CoreML, ONNX 등의 형식으로의 원클릭 내보내기를 위해 Ultralytics (구 HUB)의 혜택을 누립니다.
메타데이터:
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직:Ultralytics
- 날짜:10
- GitHub:ultralyticsultralytics
- 문서:8 문서
종단 간 탐지의 미래
YOLOv10 NMS 검출을 YOLOv10 반면, 새로 출시된 YOLO26 이 기반을 더욱 발전시켰습니다. YOLO26은 기본적으로 엔드투엔드(end-to-end) 방식으로, NMS 분포 초점 손실(DFL) NMS 제거하여 CPU 속도를 최대 43%까지 향상시켰습니다. MuSGD 최적화기와 ProgLoss 함수를 통합하여 YOLOv8 YOLOv10 대비 우수한 안정성과 소형 객체 탐지 성능을 제공합니다.
사용 사례 및 실제 적용 사례
이러한 모델들 사이에서 선택하는 것은 종종 배포 환경의 특정 제약 조건에 따라 달라집니다.
YOLOv10을 위한 이상적인 시나리오
YOLOv10 후처리 지연 시간이 병목 현상이 되는 애플리케이션에 특히 YOLOv10 .
- 혼잡한 장면 분석: 보행자 탐지와 같이 밀집된 객체 군집이 존재하는 시나리오에서 NMS 제거하면 상당한 중첩을 보이는 유효한 탐지 결과를 "누락"하는 것을 NMS .
- 저전력 에지 디바이스: FLOPs 및 매개변수 수의 감소는 라즈베리 파이(Raspberry Pi)나 제트슨 나노(Jetson Nano)와 같이 컴퓨팅 자원이 제한된 디바이스에 배포하는 데 도움이 되며, 이러한 환경에서는 처리 속도가 밀리초 단위로 중요합니다.
Ultralytics YOLOvYOLOv8의 이상적인 시나리오
YOLOv8 신뢰성과 멀티태스킹이 요구되는 포괄적인 AI 솔루션에 있어 YOLOv8 최상의 선택입니다.
- 복합 산업 검사: 세분화 기능을 통해 단순한 경계 상자 대신 정밀한 결함 윤곽을 추출할 수 있으며, 이는 제조 품질 관리에 필수적입니다.
- 스포츠 분석: 네이티브 자세 추정 기능을 지원하는 YOLOv8 track 움직임과 생체역학적 분석을 위한 골격 키포인트를 track YOLOv8 .
- 소매 분석: Ultralytics API에 통합된 강력한 객체 추적 기능은 고객 동선 및 재고 모니터링에 이상적입니다.
사용 편의성 및 에코시스템
YOLOv8 또는 최신 버전인 YOLO26)과 같은 Ultralytics 선택할 때 가장 큰 장점 중 하나는 주변 생태계입니다.
간편한 Python : 개발자는 몇 줄의 코드만으로 모델을 로드, 훈련 및 배포할 수 있습니다.
from ultralytics import YOLO # Load a model model = YOLO("yolov8n.pt") # Train model.train(data="coco8.yaml", epochs=100)포괄적인 문서: Ultralytics 하이퍼파라미터 튜닝부터 iOS Android 모델 내보내기까지 모든 것에 대한 상세한 가이드를 제공합니다.
- 메모리 효율성: Ultralytics 훈련 중 CUDA 사용량을 줄이도록 최적화되어 있어, 다음과 같은 많은 트랜스포머 기반 대안들에 비해 RT-DETR와 같은 많은 트랜스포머 기반 대안들에 비해 훈련 중 CUDA 메모리 사용량을 낮추도록 최적화되어 있어, 일반 소비자용 GPU에서도 더 큰 배치 크기를 사용할 수 있습니다.
결론
두 아키텍처 모두 뚜렷한 장점을 제공합니다. YOLOv10 는 NMS 없는 탐지의 잠재력을 입증하는 탁월한 학술적 기여로, 특정 탐지 전용 작업에 높은 효율성을 제공합니다.
Ultralytics YOLOv8 유니버설한 만능 선택지로 두각을 나타내며, 유지보수되는 생태계가 뒷받침되어 머신러닝 라이프사이클 전체를 단순화합니다. 세그멘테이션 및 포즈 추정 등 다양한 작업에서 프로토타입에서 생산 환경으로 신속하게 전환해야 하는 개발자들에게 여전히 최상위 추천 솔루션입니다.
최상의 성능을 추구하는 이들을 위해, YOLO26 이 최고의 선택입니다. YOLOv10 개척한 엔드투엔드 YOLOv10 NMS(네트워크 미세조정) NMS YOLOv10 Ultralytics 견고성, 다중 작업 지원, 사용 편의성을 결합했습니다. MuSGD 최적화기 및 향상된 손실 함수 같은 혁신을 통해 YOLO26은 2026년을 위한 속도와 정확도의 최첨단 균형을 제공합니다.