YOLOv10 YOLOv9: 실시간 객체 탐지의 진화

2024년은 객체 탐지 분야에서 급속한 혁신의 시기를 맞이했으며, 두 가지 중요한 아키텍처가 출시되었습니다: YOLOv10 와 YOLOv9이 등장했습니다. 두 모델 모두 속도와 정확성의 한계를 뛰어넘는 것을 목표로 하지만, 이를 달성하는 데 있어 근본적으로 다른 아키텍처 철학을 채택하고 있습니다.

YOLOv10 NMS 설계를 통해 후처리로 인한 추론 지연 시간을 제거하는 데 YOLOv10 반면, YOLOv9 프로그래머블 그라디언트 정보(PGI)를 활용하여 심층 신경망 내 정보 보존을 YOLOv9 .

성능 비교

다음 표는 표준 벤치마크에서 이들 모델을 비교한 상세한 내용을 제공합니다. 이 데이터는 매개변수 효율성, 추론 속도, 탐지 정확도(mAP) 간의 상충 관계를 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLOv10: 엔드투엔드 선구자

YOLOv10, 칭화대학교 연구진이 개발한 이 모델은 엔드투엔드 처리 방식으로의 전환을 보여줍니다. 2024년 5월 23일 왕아오(Ao Wang), 천후이(Hui Chen) 및 동료 연구진에 의해 발표된 이 모델은 비최대 억제(NMS)의 병목 현상을 해결합니다.

10에 대해 자세히 알아보기

주요 아키텍처 기능

NMS 훈련: 일관된 이중 할당을 활용함으로써 YOLOv10 추론 NMS 필요하지 YOLOv10 . 이는 특히 엣지 컴퓨팅 애플리케이션에서 지연 시간을 줄이고 배포 파이프라인을 단순화합니다.
전체적 효율성 설계: 이 아키텍처는 높은 성능을 유지하면서 다양한 구성 요소를 최적화하여 계산 오버헤드(FLOPs)를 줄입니다.
개선된 지연 시간: 표에서 볼 수 있듯이, YOLOv10 유사한 정확도 수준에서 YOLOv9 비해 일반적으로 더 낮은 추론 시간을 제공합니다.

기술적 세부 사항에 대해서는 YOLOv10 논문을 참고하시기 바랍니다.

YOLOv9: 정보 흐름의 정복

YOLOv9, 2024년 2월 21일 국립중앙연구원( Academia Sinica)의 왕젠야오(Chien-Yao Wang)와 리아오홍위안(Hong-Yuan Mark Liao)이 발표한 이 모델은 심층 신경망에서의 정보 손실이라는 이론적 문제에 초점을 맞추고 있다.

9에 대해 자세히 알아보기

주요 아키텍처 기능

GELAN 아키텍처: 일반화된 효율적 레이어 집계 네트워크 (GELAN)는 CSPNet과 ELAN의 장점을 결합하여 매개변수 활용도를 극대화합니다.
프로그래머블 그라디언트 정보(PGI): 이 보조 감독 메커니즘은 심층 레이어가 정확한 탐지를 위한 핵심 정보를 유지하도록 보장하여, 높은 정밀도가 요구되는 작업에 모델이 매우 효과적으로 작동하도록 합니다.
높은 정확도: YOLOv9e 모델은 인상적인^mAPval 55.6%를 달성하여 순수 탐지 정확도 측면에서 동시대 많은 모델들을 능가합니다.

더 깊이 알아보려면 YOLOv9 논문을 읽어보세요.

교육 및 사용 편의성

두 모델 모두 Ultralytics 완벽하게 통합되어 개발자에게 통합되고 원활한 경험을 제공합니다. YOLOv10 YOLOv9 YOLOv10 , Ultralytics Python 훈련 파이프라인, 데이터 증강 및 로깅의 복잡성을 추상화합니다.

코드 예제

사용자 정의 데이터셋이나 COCO8 같은 표준 벤치마크로 모델을 훈련하는 COCO8 . 프레임워크가 자동으로 아키텍처 차이를 처리합니다.

from ultralytics import YOLO

# Load a model (Choose YOLOv10 or YOLOv9)
model = YOLO("yolov10n.pt")  # or "yolov9c.pt"

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model
model.val()

메모리 효율성

Ultralytics YOLO 최적의 GPU 사용을 위해 설계되었습니다. 트랜스포머 기반 아키텍처나 기존 탐지 모델과 비교하여, 소비자용 하드웨어에서 더 큰 배치 크기를 지원함으로써 최첨단 AI를 더 많은 사용자에게 제공합니다.

이상적인 사용 사례

YOLOv10 YOLOv9 사이의 선택은 YOLOv9 배포 환경의 특정 제약 조건에 따라 달라집니다.

10 선택해야 할 때

저지연 제약 조건: 애플리케이션이 밀리초 단위의 시간이 중요한 모바일 기기나 임베디드 시스템에서 실행되는 경우, YOLOv10 NMS 설계는 상당한 이점을 YOLOv10 .
간편한 배포: 후처리 단계를 제거하여 다음과 같은 형식으로의 내보내기를 단순화합니다 ONNX 또는 TensorRT으로의 내보내기를 단순화하여 연산자 호환성 문제 발생 가능성을 줄입니다.
실시간 영상: 처리량이 중요한 교통 관리나 고속 생산 라인에 이상적입니다.

9 선택해야 할 때

최대 정확도: 정밀도가 최우선인 연구 응용 분야 또는 시나리오(예: 의료 영상 분석)에서 YOLOv9e의 PGI 강화 아키텍처는 우수한 결과를 제공합니다.
소형 물체 탐지: GELAN의 풍부한 특징 보존 능력 덕분에 YOLOv9 항공 이미지에서 소형 또는 가려진 물체를 탐지하는 데 YOLOv9 탁월한 성능을 발휘합니다.
복잡한 장면: 시각적 혼잡도가 높은 환경에서 프로그래밍 가능한 그라디언트 정보는 모델이 관련 특징을 보다 효과적으로 구별하는 데 도움을 줍니다.

미래는 여기 있다: YOLO26

YOLOv9 YOLOv10 , 컴퓨터 비전 분야는 빠르게 진화하고 YOLOv10 . Ultralytics YOLO26을 출시했는데, 이 모델은 이전 세대의 장점을 종합하면서 획기적인 최적화를 도입했습니다.

YOLO26에 대해 더 알아보기

YOLO26은 속도, 정확도, 다용도성 간의 탁월한 균형을 제공하므로 신규 프로젝트에 권장되는 선택입니다.

왜 YOLO26으로 업그레이드해야 할까요?

엔드투엔드 NMS: YOLOv10 마찬가지로 YOLO26은 기본적으로 엔드투엔드 방식입니다. NMS 제거하여 더 빠른 추론과 간소화된 배포 파이프라인을 보장합니다.
MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 분야의 혁신(특히 Moonshot AI의 Kimi K2)에서 영감을 받아, YOLO26은 SGD Muon 최적화기의 하이브리드 방식을 활용합니다. 이를 통해 훈련 안정성이 크게 향상되고 수렴 속도가 빨라집니다.
DFL 제거: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 모델 아키텍처를 간소화하여 내보내기에 더 용이하고 다양한 에지/저전력 장치와 호환되도록 합니다.
성능 도약: CPU 특별히 겨냥한 최적화로 이전 세대 대비 최대 43% 빠른 속도를 구현하여, 엣지 AI의 핵심 동력이 됩니다.
작업 다용도성: v9 및 v10의 탐지 중심 업데이트와 달리, YOLO26은 모든 작업에 대한 특화된 개선 사항을 포함합니다:
- 분할: 새로운 의미적 분할 손실 및 다중 스케일 프로토.
- Pose: 고정밀 키포인트를 위한 잔차 로그우도 추정(RLE)
- OBB: 방향성 경계 상자 작업에서 경계 문제를 처리하기 위한 특수 각도 손실

Ultralytics 으로 간소화된 워크플로우

개발자는 Ultralytics (구 HUB)을 활용하여 YOLO26 모델의 전체 라이프사이클을 관리할 수 있습니다. 데이터셋 주석 부착부터 클라우드 기반 훈련, 에지 디바이스 배포에 이르기까지, 이 플랫폼은 통합 인터페이스를 제공하여 시장 출시 시간을 단축합니다.

결론

둘 다 YOLOv10 와 YOLOv9 는 객체 탐지 역사에서 중요한 이정표입니다. YOLOv10 NMS 아키텍처가 최첨단 성능을 달성할 수 있음을 YOLOv10 , YOLOv9 딥 네트워크에서 기울기 정보 흐름의 중요성을 YOLOv9 .

그러나 가장 강력하고 다재다능하며 미래에도 유효한 솔루션을 찾는 개발자들에게는 YOLO26이 최고의 선택으로 손꼽힙니다. NMS( NMS 시스템) NMS 설계와 혁신적인 MuSGD 최적화기, 광범위한 작업 지원을 결합함으로써 YOLO26은 현대 컴퓨터 비전 애플리케이션에 최적의 성능 균형을 제공합니다.

YOLO11 - YOLO26의 견고한 전신으로, 안정성으로 유명합니다.
YOLOv8 - 산업계에서 널리 사용되는 다목적 클래식 모델.
RT-DETR - 변압기 기반 실시간 감지기.

YOLOv10 YOLOv9: 실시간 객체 탐지의 진화

성능 비교

YOLOv10: 엔드투엔드 선구자

주요 아키텍처 기능

YOLOv9: 정보 흐름의 정복

주요 아키텍처 기능

교육 및 사용 편의성

코드 예제

이상적인 사용 사례

10 선택해야 할 때

9 선택해야 할 때

미래는 여기 있다: YOLO26

왜 YOLO26으로 업그레이드해야 할까요?

Ultralytics 으로 간소화된 워크플로우

결론

관련 모델

댓글