콘텐츠로 건너뛰기

YOLOv9 YOLOv10: 실시간 객체 탐지 진화에 대한 기술적 심층 분석

실시간 컴퓨터 비전 분야는 연구자들이 성능과 효율성의 경계를 끊임없이 확장해 나감에 따라 엄청난 발전을 이루었습니다. 최첨단 비전 모델의 진화를 분석할 때, YOLOv9YOLOv10 은 두 가지 중요한 이정표를 나타냅니다. 2024년 초에 출시된 두 모델 모두 정보 병목 현상부터 후처리 지연 시간에 이르기까지 딥 뉴럴 네트워크의 오랜 과제를 해결하기 위해 패러다임 전환적인 아키텍처 설계를 도입했습니다.

이 포괄적인 기술 비교는 그들의 아키텍처, 성능 지표 및 이상적인 배포 시나리오를 탐구하여 현대 객체 탐지 생태계의 복잡성을 헤쳐나가는 데 도움을 줍니다.

모델의 기원 및 건축적 혁신

이러한 모델들의 계보와 이론적 기반을 이해하는 것은 특정 컴퓨터 비전 프로젝트에 적합한 아키텍처를 선택하는 데 매우 중요합니다.

YOLOv9: 정보 흐름의 정복

2024년 2월 21일에 소개된 YOLOv9 데이터가 심층 신경망을 통과할 때 발생하는 정보 손실이라는 이론적 문제를 YOLOv9 .

YOLOv9 CSPNet과 ELAN의 장점을 결합하여 매개변수 활용도를 극대화하는 일반화된 효율적 레이어 집계 네트워크(GELAN)를 YOLOv9 . 또한 프로그래머블 그라디언트 정보(PGI)를 활용하여 심층 레이어가 중요한 공간 정보를 유지하도록 보조 감독 메커니즘을 제공합니다. 이로 인해 YOLOv9 의료 영상 분석이나 원거리 감시와 같이 높은 특징 충실도가 요구되는 작업에서 YOLOv9 성능을 발휘합니다.

9에 대해 자세히 알아보기

YOLOv10: 실시간 엔드투엔드 효율성

2024년 5월 23일 직후 출시된 YOLOv10 객체 탐지에서 가장 악명 높은 지연 병목 현상 중 하나인 비최대 억제(NMS)를 제거함으로써 배포 파이프라인을 YOLOv10 .

YOLOv10 훈련 과정에서 일관된 이중 할당을 YOLOv10 본질적으로 NMS 설계를 가능케 합니다. 이는 추론 시 후처리 오버헤드를 제거하여 지연 시간을 획기적으로 줄입니다. 효율성과 정확도를 종합적으로 고려한 모델 설계와 결합된 YOLOv10 뛰어난 균형을 YOLOv10 , 경쟁력 있는 정밀도를 유지하면서도 계산 오버헤드(FLOPs)를 낮추어 엣지 컴퓨팅 애플리케이션에 매우 매력적인 솔루션입니다.

10에 대해 자세히 알아보기

성능 및 지표 비교

표준 MS COCO 이 두 강자를 벤치마킹할 때, 순수 정확도와 추론 지연 시간 사이에는 뚜렷한 상충 관계가 나타난다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

데이터 분석

  1. 지연 시간 대 정확도: YOLOv10 일반적으로 우수한 추론 속도를 제공합니다. 예를 들어, TensorRT YOLOv10s는 2. mAP 46.7% mAP 달성하는 반면, 거의 동일한 46.8% mAP 달성하는 데 YOLOv9s는 3.54ms가 소요됩니다.
  2. 최상위 정밀도: 최대 탐지 정확도가 요구되는 연구 시나리오에서 YOLOv9e는 여전히 강력한 선택지로, 인상적인 55.6% mAP 달성합니다. PGI 아키텍처는 미세한 특징도 안정적으로 추출할 수 있도록 보장합니다.
  3. 효율성: YOLOv10 FLOPs 효율성에서 YOLOv10 . 이는 전력 소비 감소로 직접 연결되며, 이는 비전 AI 모델을 실행하는 배터리 구동 장치에 있어 핵심적인 지표입니다.

배포 팁

CPU나 라즈베리 파이와 같은 리소스 제약이 있는 에지 하드웨어에 배포하는 경우, YOLOv10 NMS(Neural Motion Segmentation)가 없는 아키텍처는 비결정적 후처리 단계를 제거함으로써 일반적으로 더 원활한 파이프라인을 제공합니다.

Ultralytics : 교육 및 생태계

아키텍처 차이는 중요하지만, 주변 소프트웨어 생태계가 프로젝트 성공을 크게 좌우합니다. YOLOv9 YOLOv10 모두 Ultralytics 완벽히 YOLOv10 타의 추종을 불허하는 개발자 경험을 제공합니다.

사용 편의성과 메모리 효율성

복잡한 트랜스포머 기반 아키텍처가 막대한 메모리 부풀림 문제를 겪는 것과 달리, Ultralytics YOLO 최적의 GPU 사용을 위해 설계되었습니다. 이를 통해 연구자들은 소비자용 하드웨어에서 더 큰 배치 크기를 활용할 수 있어 최첨단 AI를 손쉽게 이용할 수 있습니다.

통합된 Python 데이터 증강과 하이퍼파라미터 튜닝의 복잡성을 추상화합니다. 가중치 파일 문자열만 변경하면 아키텍처 간에 원활하게 전환할 수 있습니다.

from ultralytics import YOLO

# Load a YOLOv10 model (Easily swap to "yolov9c.pt" for YOLOv9)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Validate the model's performance
metrics = model.val()

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

MLflow 에 메트릭을 기록하거나 TensorRT로 내보내야 하는 경우 TensorRT 로 내보내야 하는 경우에도 Ultralytics 이 기본적으로 처리합니다.

이상적인 사용 사례

이러한 모델 중 선택은 배포 제약 조건에 따라 달라집니다:

미래 대비: YOLO26로의 전환

YOLOv8, YOLOv9, YOLOv10 우수한 YOLOv10 , 현대적인 AI 솔루션을 구축하려는 개발자들은 2026년 1월에 출시된Ultralytics 를 고려해야 합니다.

YOLO26은 이전 세대들의 궁극적인 통합체로서, YOLOv9 정확성과 YOLOv10 효율성이라는 두 가지 장점을 결합한 모델입니다.

YOLO26의 주요 혁신점

  • 엔드투엔드 NMS 설계: YOLOv10 마련한 기반 위에 구축된 YOLOv26은 더 간편한 배포를 위해 NMS 과정을 원천적으로 제거합니다.
  • MuSGD 최적화기: SGD 뮤온의 하이브리드로, 컴퓨터 비전 분야에 첨단 LLM 훈련 혁신을 도입하여 놀라울 정도로 안정적이고 빠른 수렴을 실현합니다.
  • 최대 43% 빠른 CPU : 전용 GPU가 없는 에지 컴퓨팅 및 디바이스에 특화 최적화.
  • DFL 제거: 모델 내보내기를 단순화하고 저전력 장치 호환성을 높이기 위해 분포 초점 손실(DFL)을 제거했습니다.
  • ProgLoss + STAL: 이 개선된 손실 함수들은 소형 객체 인식에서 눈에 띄는 향상을 가져와 YOLOv9 성능을 따라잡거나 능가합니다.

레거시 아키텍처를 평가하는 연구자들을 위해, RT-DETRYOLO11 도 Ultralytics 내에서 잘 문서화된 대안입니다. 그러나 모든 비전 작업에 걸쳐 최대한의 다용도성을 확보하려면 Ultralytics YOLO26으로 전환함으로써 오픈소스 비전 AI의 정점을 활용할 수 있습니다.


댓글