YOLOv7 대 YOLOv10: 실시간 객체 탐지의 진화
컴퓨터 비전 분야는 지난 몇 년간 눈부신 발전을 거듭해 왔으며, YOLO (You Only Look Once) 모델 제품군은 실시간 객체 탐지 분야를 선도하고 있습니다. 컴퓨터 비전 프로젝트를 위해 올바른 아키텍처를 선택하려면 사용 가능한 옵션에 대한 깊은 이해가 필요합니다. 이 포괄적인 기술 비교에서는 두 가지 주요 아키텍처인 YOLOv7과 YOLOv10의 핵심 차이점을 살펴봅니다.
모델 소개
이 두 모델 모두 인공지능 역사에서 중요한 이정표를 세웠지만, 객체 탐지의 문제를 해결하는 방식에서는 근본적으로 다른 접근 방식을 취합니다.
YOLOv7: Bag-of-Freebies의 개척자
2022년 7월 6일, 중앙연구원 정보과학연구소의 연구원인 Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao가 발표한 YOLOv7은 신경망 최적화 방식의 패러다임 전환을 가져왔습니다. 학술 논문과 공식 GitHub 저장소에 자세히 기술된 원본 연구는 아키텍처 재매개변수화(re-parameterization)와 학습 가능한 "bag-of-freebies"에 중점을 두었습니다.
YOLOv7은 확장된 효율적 계층 집계 네트워크(E-ELAN)를 활용하여 원래의 그래디언트 경로를 훼손하지 않으면서 네트워크가 다양한 특징을 학습하도록 안내합니다. 이로 인해 학술 연구 벤치마크나 표준 고성능 GPU에 크게 의존하는 시스템에 적합한 강력한 선택지가 됩니다.
YOLOv10: 실시간 종단간(End-to-End) 탐지
칭화대학교의 Ao Wang 팀이 개발한 YOLOv10은 2024년 5월 23일에 공개되었습니다. 해당 arxiv 출판물과 칭화대학교 GitHub 저장소에 상세히 기술된 바와 같이, 이 모델은 객체 탐지의 고질적인 병목 현상인 NMS(Non-Maximum Suppression)를 제거합니다.
YOLOv10은 NMS 없는 학습을 위해 일관된 이중 할당 방식을 도입하여 사후 처리 파이프라인을 근본적으로 변경했습니다. 전체적인 효율성 및 정확도 중심의 모델 설계 전략을 적용함으로써 YOLOv10은 계산 중복성을 줄였습니다. 그 결과 매우 낮은 지연 시간이 요구되는 엣지 디바이스에 최적화된 아키텍처가 탄생했습니다.
성능 및 메트릭 비교
모델 성능을 분석할 때는 정밀도, 속도, 계산 무게 간의 균형(트레이드오프)을 평가하는 것이 중요합니다. 다음 표는 이러한 모델의 다양한 크기가 어떻게 비교되는지 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
트레이드오프 분석
위의 지표는 세대 간의 뚜렷한 격차를 보여줍니다. YOLOv7x는 53.1%의 매우 강력한 mAPval 성능을 제공하지만, 71.3M개의 파라미터와 189.9B FLOPs가 필요합니다. 반면 YOLOv10l은 53.3% mAP로 더 높은 정확도를 보이면서도 파라미터는 절반 이하(29.5M), FLOPs는 훨씬 적게(120.3B) 요구합니다. 또한 고도로 최적화된 YOLOv10n은 1.56ms라는 놀라운 추론 속도를 제공하여 실시간 비디오 분석 및 모바일 애플리케이션에 이상적입니다.
실제 사용 사례
이 모델들 간의 아키텍처 차이는 최적의 사용 사례를 결정합니다.
YOLOv7을 활용해야 할 때
풍부한 특징 표현 덕분에 YOLOv7은 매우 복잡한 환경에서 탁월한 성능을 발휘합니다. 인구 밀집 지역의 교통 흐름 모니터링, 위성 이미지 분석, 또는 대규모 제조 자동화에서의 결함 식별과 같은 사례들은 강력한 구조적 재매개변수화로부터 이점을 얻습니다. 또한 특정 PyTorch 1.12 파이프라인과 이미 깊이 통합된 레거시 환경에서도 널리 선호됩니다.
YOLOv10을 활용해야 할 때
YOLOv10의 NMS 없는 경량 디자인은 제약이 많은 환경에서 빛을 발합니다. NVIDIA Jetson Nano나 Raspberry Pi와 같은 엣지 컴퓨팅 디바이스에 강력히 권장됩니다. 낮은 지연 시간 성능 덕분에 스포츠 분석, 자율 드론 내비게이션, 컨베이어 벨트의 고속 로봇 분류와 같은 빠르게 움직이는 애플리케이션에 완벽합니다.
Ultralytics 생태계의 이점
두 모델 모두 강력한 학술적 뿌리를 가지고 있지만, 진정한 잠재력은 통합된 Ultralytics Platform 내에서 활용될 때 발휘됩니다. 처음부터 컴퓨터 비전 모델을 개발하는 것은 매우 어렵지만, Ultralytics 생태계는 머신 러닝 엔지니어에게 독보적인 경험을 제공합니다.
- 사용 편의성: Ultralytics Python API는 통합 인터페이스를 제공합니다. 몇 줄의 코드만으로 모델을 학습, 검증 및 내보내기 할 수 있어 일반적인 학술 저장소와 관련된 복잡한 의존성 문제를 피할 수 있습니다.
- 잘 관리된 생태계: Ultralytics는 기반 코드가 활발하게 개발됨을 보장합니다. 사용자는 로깅을 위한 Weights & Biases나 빠른 웹 데모를 위한 Hugging Face와 같은 인기 있는 ML 도구와의 원활한 통합을 누릴 수 있습니다.
- 메모리 요구 사항: Transformer 기반 객체 탐지기는 학습 중에 엄청난 양의 CUDA 메모리를 소모하는 경우가 많습니다. 반면 Ultralytics YOLO 모델은 훨씬 적은 메모리를 요구하므로 소비자용 하드웨어에서도 더 큰 배치 크기를 사용할 수 있습니다.
- Versatility: The Ultralytics pipeline is not restricted to standard bounding boxes. It seamlessly supports pose estimation, instance segmentation, and oriented bounding boxes across supported model families like YOLO11 and YOLOv8.
간소화된 학습 예시
Ultralytics를 사용하여 학습 파이프라인을 실행하는 것은 매우 간단합니다. YOLOv7의 역사적 견고함을 활용하든, YOLOv10의 NMS 없는 속도를 활용하든 구문은 일관되게 유지됩니다:
from ultralytics import YOLO
# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to an edge-friendly format like ONNX
model.export(format="onnx")사용 사례 및 권장 사항
YOLOv7과 YOLOv10 중 무엇을 선택할지는 프로젝트의 특정 요구 사항, 배포 제약 조건, 그리고 생태계 선호도에 따라 달라집니다.
YOLOv7을 선택해야 하는 경우
YOLOv7은 다음과 같은 경우에 강력한 선택지입니다:
- 학술 벤치마킹: 2022년 당시의 최첨단 성능 결과를 재현하거나 E-ELAN 및 trainable bag-of-freebies 기술의 효과를 연구할 때 사용합니다.
- 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략을 조사할 때 사용합니다.
- 기존 커스텀 파이프라인: YOLOv7의 특정 아키텍처를 기반으로 구축되어 쉽게 리팩터링하기 어려운 프로젝트에서 사용합니다.
YOLOv10을 선택해야 하는 경우
YOLOv10은 다음과 같은 경우에 권장됩니다:
- NMS-free 실시간 탐지: Non-Maximum Suppression 없이 엔드투엔드 탐지 기능을 활용하여 배포 복잡성을 줄여야 하는 애플리케이션.
- 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 규모 전반에서 추론 속도와 탐지 정확도 간의 강력한 균형이 필요한 프로젝트.
- Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.
Ultralytics(YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최적의 조합을 제공합니다:
- NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.
미래: YOLO26 소개
YOLOv7과 YOLOv10이 인상적인 이정표를 세웠지만, AI의 영역은 항상 전진하고 있습니다. 2026년 1월에 출시된 Ultralytics YOLO26은 모든 엣지 및 클라우드 배포 시나리오에서 효율성과 정확도에 대한 새로운 표준입니다.
오늘 새로운 컴퓨터 비전 프로젝트를 시작한다면 YOLO26 아키텍처를 권장합니다. 이는 몇 가지 혁신적인 성과를 통합하여 이전 모델의 유산을 계승합니다:
- 종단간 NMS 없는 설계: YOLOv10에서 영감을 받은 YOLO26은 NMS 사후 처리를 기본적으로 제거하여 결정론적 실시간 로봇 공학을 위한 초저지연 추론을 보장합니다.
- 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss) 모듈을 전략적으로 제거함으로써, YOLO26은 GPU가 없는 엣지 컴퓨팅 하드웨어에서의 실행 속도를 획기적으로 가속화하여 IoT 디바이스를 위한 강력한 도구가 되었습니다.
- MuSGD Optimizer: 최근 대규모 언어 모델 학습 혁신에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드를 통합하여 학습 경로를 안정화하고 더 빠른 수렴을 보장합니다.
- ProgLoss + STAL: 이러한 고급 손실 함수는 소형 객체 인식에서 현저한 개선을 가져오며, 이전 YOLO 세대의 역사적 약점을 극복했습니다.
- 타의 추종을 불허하는 범용성: YOLO26은 자세 추적을 위한 RLE(Residual Log-Likelihood Estimation) 및 항공 이미지에서 정확한 OBB 탐지를 위한 특수 각도 손실과 같은 작업별 최적화를 기본적으로 제공합니다.
속도, 정확도, 배포 단순성의 궁극적인 균형을 찾는 엔지니어에게 레거시 모델에서 YOLO26으로 전환하는 것은 즉각적이고 측정 가능한 경쟁 우위를 제공합니다.