YOLOv10 대 YOLOv7: 실시간 객체 탐지의 진화
지난 몇 년간 컴퓨터 비전 분야의 급격한 발전으로 실시간 애플리케이션을 위한 더욱 효율적인 아키텍처가 등장했습니다. YOLOv10과 YOLOv7을 비교하면 이러한 진화 과정의 중요한 전환기를 확인할 수 있습니다. YOLOv7이 매우 효과적인 학습 전략과 아키텍처 스케일링을 도입했다면, YOLOv10은 오랫동안 사용되어 온 NMS(Non-Maximum Suppression)에 대한 의존성을 제거함으로써 배포 방식을 혁신했습니다.
두 모델 모두 출시 당시 객체 탐지의 한계를 확장했지만, 현대적인 Ultralytics 에코시스템과 YOLO26 같은 차세대 모델의 등장은 오늘날 AI 실무자들에게 훨씬 더 우수한 워크플로우를 제공합니다.
모델 프로필 및 기원
이들 모델의 기원을 이해하면 아키텍처 설계 선택과 이를 뒷받침하는 학술 연구에 대한 중요한 맥락을 파악할 수 있습니다.
YOLOv10 세부 정보
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: YOLOv10: 실시간 엔드 투 엔드 객체 탐지
- GitHub: THU-MIG/yolov10
- 문서: Ultralytics YOLOv10 문서
YOLOv7 세부 정보
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 기관: 대만 중앙연구원 정보과학연구소
- 날짜: 2022-07-06
- Arxiv: YOLOv7: 학습 가능한 bag-of-freebies가 새로운 최첨단 성능을 달성하다
- GitHub: WongKinYiu/yolov7
- 문서: Ultralytics YOLOv7 문서
아키텍처 혁신
YOLOv7 접근 방식
2022년에 출시된 YOLOv7은 그래디언트 경로 최적화에 집중했습니다. 이 모델은 E-ELAN(Extended Efficient Layer Aggregation Network)을 도입하여, 원래의 그래디언트 경로를 손상하지 않으면서도 모델이 더 다양한 특징을 학습할 수 있게 했습니다. 또한 저자들은 "trainable bag-of-freebies" 방법론을 구현하여, 학습 중에는 재매개변수화(re-parameterization) 기술을 활용하고 추론 시에는 이를 융합하여 제거함으로써 빠른 실행 속도를 유지했습니다. 이러한 인상적인 최적화에도 불구하고, YOLOv7은 여전히 후처리를 위해 NMS에 크게 의존했으며, 이로 인해 밀집된 장면 분석에서 지연 시간이 가변적으로 발생하는 문제가 있었습니다.
YOLOv10의 혁신
YOLOv10은 NMS 병목 현상을 직접적으로 해결했습니다. 칭화대학교 연구팀은 학습 중 일관된 이중 할당(consistent dual assignments)을 도입하여 NMS가 필요 없는 엔드 투 엔드 탐지를 가능하게 했습니다. 이 이중 헤드 접근 방식은 학습 중에 풍부한 감독 신호를 제공하는 일대다(one-to-many) 할당 브랜치 하나와, NMS 없는 추론을 위한 일대일(one-to-one) 할당 브랜치를 사용합니다. 이러한 아키텍처의 변화는 고속 비디오 분석에 적합한 일관되고 극도로 낮은 추론 지연 시간을 보장합니다. 또한, YOLOv10은 전체적인 효율성과 정확도를 중심으로 설계되어 이전 세대에서 발견되던 계산상의 중복성을 제거했습니다.
NMS 후처리를 제거하면 추론 속도가 빨라질 뿐만 아니라, 사용자 정의 NMS 연산을 컴파일하기 어려운 AI 가속기나 NPU와 같은 엣지 AI 하드웨어에서의 배포가 크게 단순화됩니다.
성능 비교
MS COCO 데이터셋에서 원시 지표를 비교해 보면 세대 간의 차이가 명확해집니다. YOLOv10은 파라미터 수, 계산 요구량, 정확도 간의 훨씬 더 유리한 균형을 달성했습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
위에서 볼 수 있듯이, YOLOv10x는 YOLOv7x의 53.1%보다 뛰어난 54.4%의 mAP를 제공하며, 파라미터는 약 20% 적게 사용합니다. 또한 경량 YOLOv10 모델(Nano 및 Small)은 탁월한 TensorRT 배포 속도를 제공하여 모바일 배포에 매우 매력적입니다.
Ultralytics 생태계의 이점
아키텍처 관련 논문을 연구하는 것도 통찰력이 있지만, 현대의 컴퓨터 비전 개발은 강력하고 잘 유지 관리되는 프레임워크에 의존합니다. Ultralytics에서 지원하는 모델을 선택하면 프로토타입에서 프로덕션 단계로 신속하게 전환하려는 개발자에게 엄청난 이점을 제공합니다.
간소화된 개발
YOLOv10과 YOLOv7 모두 표준 Ultralytics Python 패키지를 통해 액세스할 수 있습니다. 이는 수천 줄의 상용구 코드를 직관적인 API로 대체하여 독보적인 사용 편의성을 제공합니다. 또한 Ultralytics YOLO 모델은 무거운 Transformer 아키텍처와 비교하여 학습 중 CUDA 메모리 사용량이 훨씬 적으므로, 소비자용 하드웨어에서도 더 큰 배치 사이즈를 사용할 수 있습니다.
비교할 수 없는 범용성
이전의 저장소들이 바운딩 박스 탐지에만 엄격하게 집중했던 것과 달리, 통합된 Ultralytics 프레임워크는 방대한 종류의 작업을 원활하게 지원합니다. 인스턴스 세분화, 자세 추정, 방향성 바운딩 박스(OBB) 탐지 중 무엇을 수행하든 워크플로우는 동일하게 유지됩니다.
코드 예제: 일관된 학습 워크플로우
다음 코드 스니펫은 데이터 증강과 학습률 스케줄링을 자동으로 처리하는 원활한 학습 과정을 보여줍니다.
from ultralytics import YOLO
# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")
# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export to ONNX format for rapid deployment
model.export(format="onnx")사용 사례 및 권장 사항
YOLOv10과 YOLOv7 중 선택하는 것은 특정 프로젝트 요구 사항, 배포 제약 조건, 에코시스템 선호도에 따라 달라집니다.
YOLOv10을 선택해야 하는 경우
YOLOv10은 다음 경우에 강력한 선택입니다:
- NMS-free 실시간 탐지: Non-Maximum Suppression 없이 엔드투엔드 탐지 기능을 활용하여 배포 복잡성을 줄여야 하는 애플리케이션.
- 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 규모 전반에서 추론 속도와 탐지 정확도 간의 강력한 균형이 필요한 프로젝트.
- Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.
YOLOv7을 선택해야 하는 경우
YOLOv7은 다음 상황에 권장됩니다:
- 학술 벤치마킹: 2022년 당시의 최첨단 성능 결과를 재현하거나 E-ELAN 및 trainable bag-of-freebies 기술의 효과를 연구할 때 사용합니다.
- 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략을 조사할 때 사용합니다.
- 기존 커스텀 파이프라인: YOLOv7의 특정 아키텍처를 기반으로 구축되어 쉽게 리팩터링하기 어려운 프로젝트에서 사용합니다.
Ultralytics(YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최적의 조합을 제공합니다:
- NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.
새로운 표준: YOLO26 소개
YOLOv10은 2024년에 큰 도약을 이루었지만, 컴퓨터 비전 환경은 매우 빠르게 변화합니다. 모든 신규 개발에는 최신 세대 모델인 Ultralytics YOLO26을 강력히 권장합니다. 2026년 1월에 출시된 이 모델은 실시간 비전 AI의 정점으로, YOLOv7과 YOLOv10을 모두 크게 뛰어넘습니다.
YOLO26은 현대적인 배포 환경을 위해 특별히 설계된 전례 없는 혁신을 제공합니다:
- 엔드 투 엔드 NMS 프리 설계: YOLOv10이 구축한 기반 위에서 YOLO26은 NMS 후처리를 기본적으로 제거하여 배포 파이프라인을 단순화하고 일관된 고속 추론을 제공합니다.
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 및 전용 GPU가 없는 기기에 최적화되어 하드웨어 비용을 크게 절감할 수 있습니다.
- DFL 제거: Distribution Focal Loss가 완전히 제거되어 내보내기 로직이 근본적으로 단순화되었으며, 저전력 엣지 기기 및 마이크로컨트롤러와의 호환성이 대폭 향상되었습니다.
- MuSGD 옵티마이저: Moonshot AI의 Kimi K2에서 영감을 받은 이 SGD와 Muon의 하이브리드는 대규모 언어 모델(LLM) 학습 혁신을 컴퓨터 비전에 직접 적용하여, 매우 안정적인 학습 역학과 더 빠른 수렴 속도를 제공합니다.
- ProgLoss + STAL: 이러한 고급 손실 함수는 드론, 로봇 공학 및 스마트 시티 모니터링에 필수적인 소형 객체 인식 분야에서 역사적으로 어려운 문제를 획기적으로 개선했습니다.
- 작업별 개선: YOLO26은 단순한 탐지기가 아닙니다. 여기에는 전문적인 의미론적 분할 손실, 초정밀 자세 추적을 위한 RLE(Residual Log-Likelihood Estimation), OBB 경계 문제를 제거하기 위한 전문 각도 손실 알고리즘이 포함되어 있습니다.
데이터셋 관리, YOLO26 학습, 모델의 클라우드 배포를 위한 최상의 경험을 원하신다면 Ultralytics 플랫폼을 살펴보십시오. Python SDK를 완벽하게 보완하는 노코드 인터페이스를 제공합니다.
실제 사용 사례
적절한 아키텍처 선택은 하드웨어와 애플리케이션 제약 조건에 따라 크게 달라집니다.
YOLOv7 사용 시기
YOLOv7은 특정 텐서 구조와 이미 깊게 통합된 레거시 파이프라인을 유지하거나 2022년 및 2023년의 학술 벤치마크를 재현할 때 여전히 신뢰할 수 있는 선택입니다. 고성능 서버 GPU에서 뛰어난 성능을 발휘합니다.
YOLOv10 사용 시기
YOLOv10은 엄격하고 변하지 않는 지연 시간이 필요한 시나리오에서 빛을 발합니다. NMS가 필요 없기 때문에, 객체 수가 급격히 변하지만 프레임당 처리 시간은 일정해야 하는 고밀도 인원 계수나 제조 결함 탐지에 탁월합니다.
YOLO26 사용 시기
YOLO26은 모든 신규 프로젝트를 위한 결정적인 선택입니다. 기본적인 Raspberry Pi에서의 보안 경보 시스템 배포부터 대규모 클라우드 기반 비디오 분석 실행에 이르기까지, 뛰어난 CPU 속도와 고급 소형 객체 탐지 기능은 이전 세대보다 훨씬 우수합니다.
대체 현대 아키텍처 탐색에 관심이 있는 개발자를 위해, RT-DETR과 같은 Transformer 기반 탐지기와 Ultralytics YOLO11과 같은 이전 세대의 주요 모델에 대해서도 광범위한 지원을 제공합니다.