Ultralytics YOLOv8 YOLOv10: 실시간 탐지의 진화
컴퓨터 비전 분야는 눈부신 속도로 발전하며, 새로운 아키텍처가 끊임없이 최신 기술을 재정의하고 있습니다. 이 발전 과정에서 두 가지 중요한 이정표는 다음과 같습니다. Ultralytics YOLOv8 와 YOLOv10입니다. 두 모델 모두 전설적인 YOLO You Only Look Once) 계보에서 비롯되었지만, 서로 다른 설계 철학과 생태계 통합 방식을 보여줍니다.
이 가이드는 생태계 성숙도, 작업 다용도성, 아키텍처 혁신성 등의 요소를 고려하여 연구자와 개발자가 특정 요구사항에 맞는 적절한 도구를 선택할 수 있도록 상세한 기술적 비교를 제공합니다.
요약: 어떤 모델을 선택해야 할까?
아키텍처에 대해 자세히 살펴보기 전에, 먼저 고수준 차이를 살펴보겠습니다:
- Ultralytics YOLOv8 컴퓨터 비전의 강력한 '만능 도구'입니다. 방대한 생태계, 다양한 작업 지원(탐지, 분할, 자세 추정, OBB, 분류), 그리고 Ultralytics 플랫폼과의 원활한 통합 덕분에 기업 배포에 가장 선호되는 선택입니다.
- YOLOv10 은 세계 최초로 NMS 훈련 방식을 도입한 특수 탐지 모델입니다. 후처리 제거가 주요 목표인 연구 및 특정 탐지 전용 시나리오에 탁월합니다.
최신 표준: YOLO26
YOLOv8 YOLOv10 비교하는 것은 YOLOv10 , 최고의 성능을 원하는 사용자는 YOLO26를 고려해야 합니다. 2026년 1월 출시된 YOLO26은 YOLOv10 개척한 NMS(Neighborhood NMS YOLOv10 Ultralytics 견고한 생태계 및 다중 작업 유연성을 결합합니다. 최대 43% 빠른 CPU 속도와 개선된 소형 객체 탐지 기능을 제공합니다.
Ultralytics YOLOv8: 에코시스템 표준
2023년 초 출시된 YOLOv8 실용적인 컴퓨터 비전 분야의 업계 표준으로 YOLOv8 자리매김했습니다. 그 핵심 강점은 단순한 성능 지표뿐만 아니라 사용 편의성과 다용도성에 있습니다.
주요 기능
- 다중 작업 학습: 많은 특수 목적 모델과 달리, YOLOv8 객체 탐지, 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB), 이미지 분류를 YOLOv8 지원합니다.
- 앵커 프리 탐지: 앵커 프리 분할 헤드를 사용하여 박스 예측 개수를 줄이고 비최대 억제(NMS) 속도를 높입니다.
- Ultralytics : 데이터 주석 작업, 모델 훈련 및 배포를 위한 도구와 완벽하게 통합됩니다.
모델 상세 정보
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직:Ultralytics
- 날짜:10
- 문서:8 문서
YOLOv10: NMS 선구자
칭화대학교 연구진이 개발한 YOLOv10 아키텍처 효율성과 후처리 병목 현상 제거에 중점을 YOLOv10 .
주요 혁신
- 엔드투엔드 훈련: YOLOv10 일관된 이중 할당을 YOLOv10 추론 과정에서 비최대 억제(NMS) 의 필요성을 제거합니다. 이는 혼잡한 장면에서 지연 시간 변동성을 줄여줍니다.
- 전체적 효율성 설계: 이 아키텍처는 경량 분류 헤드와 공간-채널 분리 다운샘플링을 특징으로 하여 계산 비용(FLOPs)을 줄입니다.
- 주요 초점: 주로 객체 탐지 작업을 위해 설계되었습니다.
모델 상세 정보
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직: 칭화대학교
- 날짜:23
- Arxiv:2405.14458
- 문서:10 문서
기술 비교: 지표 및 성능
다음 표는 COCO 데이터셋에서 두 모델의 성능을 비교합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
데이터 분석
- 정확도 대 효율성: YOLOv10 YOLOv8 비해 더 적은 매개변수와 FLOPs로 더 높은mAPval을 달성합니다. 이러한 효율성은 최적화된 아키텍처 블록 덕분입니다.
- 추론 속도: YOLOv10 NMS YOLOv10 반면, YOLOv8 (특히 Nano 변형)은 표준 하드웨어에서 순수 처리량 측면에서 여전히 매우 경쟁력 있는 성능을 유지합니다.
- 훈련 메모리: Ultralytics YOLOv8 훈련 효율성을 위해 고도로 최적화되어YOLOv8 , 학술적 구현체보다 GPU 적게 소모하는 경우가 많으며, 이로 인해 일반 하드웨어에서 더 큰 배치 크기를 사용할 수 있습니다.
건축 및 디자인 철학
핵심적인 차이는 이러한 모델들이 최종 예측을 처리하는 방식에 있습니다.
YOLOv8
YOLOv8 작업 정렬 어사이너(Task-Aligned Assigner)를 YOLOv8 . 바운딩 박스와 클래스 점수를 별도로 예측하지만 훈련 과정에서 이를 정렬합니다. 핵심적으로, 중복 박스를 걸러내기 위해 NMS 활용합니다. 이로 인해 모델은 견고하고 다용도로 활용 가능해지며, 세그멘테이션 및 포즈 추정 작업에 쉽게 적용할 수 있습니다.
YOLOv10
YOLOv10 이중 레이블 할당(Dual Label Assignments)을 YOLOv10 . 훈련 중에는 풍부한 감독 신호를 위해 일대다 헤드( YOLOv8 유사)를 사용하고, 최종 추론을 위해 일대일 헤드를 사용합니다. 이러한 구조를 통해 모델은 객체에 대해 단일 최적 박스를 선택하는 법을 학습할 수 있어 NMS .
배포 영향
NMS 제거는 배포 파이프라인을 상당히 NMS . 모델을 TensorRT 이나 OpenVINO과 같은 형식으로 모델을 내보낼 때 엔지니어는 더 이상 복잡한 NMS 구현할 필요가 없어 엔지니어링 오버헤드가 감소합니다.
사용 편의성 및 에코시스템
개발자들에게 이 구분이 가장 중요한 지점이 바로 여기입니다.
Ultralytics YOLOv8 방대한 활성 오픈소스 커뮤니티의 지원을 받습니다. 다음과 같은 이점을 누립니다:
- 자주 업데이트: 정기적인 패치, 새로운 기능 및 호환성 수정 사항.
- Ultralytics : 원활한 클라우드 트레이닝 및 데이터셋 관리.
- 문서: 하이퍼파라미터 튜닝부터 엣지 디바이스 배포에 이르기까지 모든 것을 다루는 포괄적인 가이드.
YOLOv10Ultralytics 통해 이용 가능하지만, 주로 학술적 기여를 목적으로 합니다. Ultralytics 동일한 수준의 유지보수 빈도나 기능 확장(추적 기능이나 OBB 지원 등)을 받지 못할 수 있습니다.
코드 비교
두 모델 모두 통합된 Ultralytics 사용하여 실행할 수 있어, 생태계가 제공하는 사용 편의성을 보여줍니다.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model (Official Ultralytics)
model_v8 = YOLO("yolov8n.pt")
# Load a pretrained YOLOv10 model (Community supported)
model_v10 = YOLO("yolov10n.pt")
# Train YOLOv8 on a custom dataset
model_v8.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference with YOLOv10 on an image
results = model_v10("https://ultralytics.com/images/bus.jpg")
실제 응용 분야
YOLOv8 사용 시기
- 복합 로봇공학: 로봇이 물체를 탐색(탐지)하고 조작(자세/분할)해야 하는 경우, YOLOv8 다중 작업 기능이 필수적입니다.
- 상업용 제품: 장기적인 유지보수가 필요한 제품의 경우, Ultralytics 안정성을 통해 모델 배포가 수년간 지속 가능하도록 보장합니다.
- 위성 영상: YOLOv8 특수 OBB 모델은 항공 사진에서 선박이나 차량과 같은 회전된 물체를 탐지하는 데 YOLOv8 .
YOLOv10 언제 사용해야 하는가
- 시각 데이터의 고빈도 거래: 지연 시간 변동이 1마이크로초 단위로 중요한 시나리오에서 NMS 제거하면 결정론적 추론 시간을 확보할 수 있습니다.
- 제한된 CPU 가진 임베디드 장치: CPU NMS 병목 현상을 CPU 장치의 경우, YOLOv10 엔드투엔드 설계가 프로세서의 부하를 경감시킵니다.
결론
두 아키텍처 모두 훌륭한 선택입니다. YOLOv8 대부분의 개발자에게 여전히 다재다능한 챔피언으로 남아 있으며, 안전하고 견고하며 기능이 풍부한 생산 환경으로의 경로를 제공합니다. YOLOv10 는 NMS(네트워크 다중 스캐너)가 필요 없는 탐지의 미래를 흥미롭게 엿볼 수 있게 해줍니다.
그러나 이 분야는 이미 진전을 이루었습니다. 오늘날 새로운 프로젝트를 시작하는 개발자들에게는 YOLO26 가 권장되는 선택지입니다. 이 YOLOv10 NMS 장점을 YOLOv10 MuSGD 최적화기와 향상된 손실 함수(ProgLoss)로 이를 정교화하여 두 가지 장점을 모두 제공합니다: 학술 연구의 최첨단 아키텍처와 Ultralytics 산업용 등급 지원을 동시에 구현한 것입니다.