Link to this sectionYOLOv9 대 YOLOv10#

실시간 컴퓨터 비전 분야는 성능과 효율성의 한계를 끊임없이 확장하려는 연구자들에 의해 엄청난 발전을 이루었습니다. 최첨단 비전 모델의 진화를 분석할 때 YOLOv9과 YOLOv10은 두 가지 중요한 이정표를 나타냅니다. 2024년 초에 출시된 두 모델 모두 정보 병목 현상부터 후처리 지연 시간에 이르기까지 딥 뉴럴 네트워크의 고질적인 문제를 해결하기 위해 패러다임을 전환하는 아키텍처 설계를 도입했습니다.

본 포괄적인 기술 비교에서는 두 모델의 아키텍처, 성능 지표, 이상적인 배포 시나리오를 살펴봄으로써, 현대적인 객체 탐지 생태계의 복잡성을 해결하는 데 도움을 드립니다.

Link to this section모델 기원 및 아키텍처 혁신#

이들 모델의 계보와 이론적 기반을 이해하는 것은 귀하의 컴퓨터 비전 프로젝트에 적합한 아키텍처를 선택하는 데 매우 중요합니다.

Link to this sectionYOLOv9: 정보 흐름의 마스터#

2024년 2월 21일에 도입된 YOLOv9은 데이터가 딥 뉴럴 네트워크를 통과할 때 발생하는 정보 손실이라는 이론적 문제를 해결합니다.

저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
기관: 대만 중앙연구원 정보과학연구소
참조: YOLOv9 arXiv 논문
저장소: YOLOv9 GitHub

YOLOv9은 CSPNet과 ELAN의 장점을 결합하여 파라미터 활용도를 극대화하는 **GELAN(Generalized Efficient Layer Aggregation Network)**을 도입했습니다. 또한, 깊은 레이어에서 중요한 공간 정보를 유지하도록 보장하는 보조 감독 메커니즘인 **PGI(Programmable Gradient Information)**를 채택했습니다. 이로 인해 YOLOv9은 의료 영상 분석이나 원거리 감시와 같이 높은 특징 정확도가 요구되는 작업에 매우 강력합니다.

YOLOv9에 대해 더 알아보기

Link to this sectionYOLOv10: 실시간 엔드 투 엔드 효율성#

얼마 지나지 않은 2024년 5월 23일에 출시된 YOLOv10은 객체 탐지에서 가장 악명 높은 지연 시간 병목 현상 중 하나인 NMS(Non-Maximum Suppression)를 제거하여 배포 파이프라인을 재구성했습니다.

저자: Ao Wang, Hui Chen, Lihao Liu 외
기관: 칭화대학교
참조: YOLOv10 arXiv 논문
저장소: YOLOv10 GitHub

YOLOv10은 학습 중 **일관된 이중 할당(consistent dual assignments)**을 활용하여 기본적으로 NMS-free 설계를 가능하게 합니다. 이는 추론 중 후처리 오버헤드를 제거하여 지연 시간을 획기적으로 줄입니다. 전체적인 효율성과 정확도를 중심으로 설계된 YOLOv10은 우수한 균형을 이루며 계산 오버헤드(FLOPs)를 낮추는 동시에 경쟁력 있는 정밀도를 유지하여 엣지 컴퓨팅 애플리케이션에 매우 매력적입니다.

YOLOv10에 대해 더 알아보기

Link to this section성능 및 지표 비교#

표준 MS COCO 데이터셋에서 이 두 강력한 모델을 벤치마킹하면 순수 정확도와 추론 지연 시간 사이에서 뚜렷한 상충 관계가 나타납니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

Link to this section데이터 분석#

지연 시간 대 정확도: YOLOv10 모델은 일반적으로 우수한 추론 속도를 제공합니다. 예를 들어, YOLOv10s는 TensorRT에서 2.66ms만에 46.7% mAP를 달성하는 반면, YOLOv9s는 거의 동일한 46.8% mAP를 얻는 데 3.54ms가 소요됩니다.
최고 수준의 정밀도: 최대의 탐지 정확도가 요구되는 연구 시나리오에서는 55.6% mAP라는 인상적인 수치에 도달하는 YOLOv9e가 여전히 강력한 선택지입니다. PGI 아키텍처는 미세한 특징을 안정적으로 추출하도록 보장합니다.
효율성: YOLOv10은 FLOPs 효율성 면에서 탁월합니다. 이는 낮은 전력 소비로 직결되며, 비전 AI 모델을 실행하는 배터리 기반 기기에 매우 중요한 지표입니다.

배포 팁

CPU나 Raspberry Pi와 같은 자원이 제한된 엣지 하드웨어에 배포하는 경우, YOLOv10의 NMS-free 아키텍처는 비결정적 후처리 단계를 제거하여 일반적으로 더 매끄러운 파이프라인을 제공합니다.

Link to this sectionUltralytics의 강점: 교육 및 생태계#

아키텍처의 차이점도 중요하지만, 주변 소프트웨어 생태계가 프로젝트의 성공을 크게 좌우합니다. YOLOv9과 YOLOv10은 모두 Ultralytics 생태계에 완전히 통합되어 비교할 수 없는 개발자 경험을 제공합니다.

Link to this section사용 편의성 및 메모리 효율성#

막대한 메모리 팽창 문제를 겪는 복잡한 Transformer 기반 아키텍처와 달리, Ultralytics YOLO 모델은 최적의 GPU 메모리 사용을 위해 설계되었습니다. 이를 통해 연구자들은 소비자용 하드웨어에서도 더 큰 배치 사이즈를 활용할 수 있어 최첨단 AI를 쉽게 접근할 수 있습니다.

통합 Python API는 데이터 증강과 하이퍼파라미터 튜닝의 복잡성을 추상화합니다. 가중치 파일 문자열을 변경하는 것만으로 아키텍처 간을 원활하게 전환할 수 있습니다.

from ultralytics import YOLO

# Load a YOLOv10 model (Easily swap to "yolov9c.pt" for YOLOv9)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Validate the model's performance
metrics = model.val()

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

MLflow에 지표를 기록하거나 고속 하드웨어 배포를 위해 TensorRT로 내보내야 하는 경우에도 Ultralytics 플랫폼은 이를 기본적으로 처리합니다.

Link to this section이상적인 사용 사례#

이 모델들 중에서 선택하는 것은 배포 환경의 제약 조건에 따라 달라집니다:

Choose YOLOv9 if: You are working on small object detection tasks, such as aerial drone imagery or detecting small tumors, where the GELAN architecture's feature retention provides the highest fidelity.
YOLOv10을 선택해야 할 경우: 엣지 기기에서의 실시간 추론이 주된 목표일 때 적합합니다. NMS-free 설계 덕분에 자율 로봇, 실시간 교통 모니터링, 스마트 감시에 완벽합니다.

Link to this section미래 대비: YOLO26으로의 전환#

YOLOv8, YOLOv9, YOLOv10은 훌륭한 모델이지만, 최신 AI 솔루션을 구축하려는 개발자들은 2026년 1월에 출시된 **Ultralytics YOLO26**을 고려해야 합니다.

YOLO26은 이전 세대들의 장점을 종합하여 YOLOv9의 정확도와 YOLOv10의 효율성을 모두 결합한 궁극적인 통합 모델입니다.

Link to this section주요 YOLO26 혁신#

엔드 투 엔드 NMS-free 설계: YOLOv10이 마련한 기반을 바탕으로, YOLO26은 더 단순한 배포를 위해 NMS 후처리를 기본적으로 제거합니다.
MuSGD 최적화 도구: SGD와 Muon의 하이브리드 모델로, 고급 LLM 학습 혁신을 컴퓨터 비전에 도입하여 매우 안정적이고 빠른 수렴을 제공합니다.
최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 및 전용 GPU가 없는 기기에 특별히 최적화되었습니다.
DFL 제거: 모델 내보내기를 단순화하고 저전력 기기 호환성을 높이기 위해 Distribution Focal Loss를 제거했습니다.
ProgLoss + STAL: 향상된 손실 함수를 통해 작은 객체 인식에서 괄목할 만한 개선을 이루어 YOLOv9의 성능과 동등하거나 그 이상을 보여줍니다.

레거시 아키텍처를 평가하는 연구자들에게 RT-DETR과 YOLO11 또한 Ultralytics 생태계 내에서 잘 문서화된 대안입니다. 그러나 모든 비전 작업에서 최대한의 범용성을 얻으려면 Ultralytics 플랫폼에서 YOLO26으로 전환하는 것이 오픈 소스 비전 AI의 정점을 활용하는 방법입니다.

기여자

GLglenn-jocher¹⁵

생성됨 2025년 1월 27일업데이트됨 3주 전