콘텐츠로 건너뛰기

YOLOv7 YOLOv9: 실시간 객체 탐지의 진화

컴퓨터 비전 분야는 급속한 진화를 거듭해 왔으며, YOLO You Only Look Once) 계열은 실시간 객체 탐지 분야에서 꾸준히 선두를 달리고 있습니다. 이 계보에서 두 가지 중요한 이정표는 YOLOv7(2022년 7월 출시)와 YOLOv9입니다. 두 아키텍처 모두 중앙연구원 정보과학연구소 연구진에 의해 개발되었으나, 딥러닝 최적화의 서로 다른 세대를 대표합니다.

이 가이드는 두 가지 강력한 모델의 기술적 비교를 제공하며, Ultralytics 내에서 두 모델의 아키텍처 혁신, 성능 지표 및 이상적인 사용 사례를 분석합니다.

아키텍처 혁신

이 모델들의 핵심적인 차이는 심층 신경망을 통해 특징 전파와 기울기 흐름을 관리하는 방식에 있다.

YOLOv7: 무료 선물 가방

저자: 왕천야오(Chien-Yao Wang), 알렉세이 보치코프스키(Alexey Bochkovskiy), 리아오홍위안(Hong-Yuan Mark Liao), YOLOv7E-ELAN(확장 효율적 레이어 집계 네트워크)을 소개했습니다. 이 아키텍처는 가장 짧고 긴 기울기 경로를 제어함으로써 네트워크가 더 다양한 특징을 학습할 수 있도록 합니다.

YOLOv7 "Bag-of-Freebies"로 YOLOv7 . 이는 추론 비용을 증가시키지 않으면서 정확도를 향상시키는 훈련 방법들의 집합입니다. 여기에는 재매개변수화 기법과 보조 헤드 감독이 포함되며, 이는 훈련 중 모델이 더 나은 표현을 학습하도록 돕지만, 더 빠른 배포를 위해 모델 내보내기 시 병합되거나 제거됩니다.

7에 대해 자세히 알아보기

YOLOv9: 프로그래밍 가능한 그래디언트 정보

YOLOv9, 왕젠야오(Chien-Yao Wang)와 마크 리아오홍위안(Hong-Yuan Mark Liao)이 개발한 이 모델은 딥러닝 네트워크에 내재된 "정보 병목 현상" 문제를 해결합니다. 데이터가 연속적인 레이어를 통과할 때 입력 정보가 종종 손실되기 때문입니다. YOLOv9 그들의 Arxiv 논문에서 상세히 설명된 두 가지 혁신적인 개념을 YOLOv9 :

  1. GELAN(일반화된 효율적 레이어 집계 네트워크): CSPNet과 ELAN의 장점을 결합하여 매개변수 효율성을 극대화하는 아키텍처.
  2. PGI(Programmable Gradient Information): 네트워크 가중치 업데이트를 위한 신뢰할 수 있는 기울기를 생성하는 보조 감독 프레임워크로, 모델이 네트워크 깊이 전반에 걸쳐 핵심 정보를 유지하도록 보장합니다.

9에 대해 자세히 알아보기

성능 분석

아키텍처 선택 시 개발자는 평균 정밀도(mAP), 추론 속도, 계산 비용(FLOPs) 간의 균형을 고려해야 합니다. 아래 표는 COCO 성능 차이를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

주요 내용

  • 효율성: YOLOv9m은 YOLOv7l과 동일한 정확도(51.4% mAP)를 달성하지만, 매개변수 수는45% 적으며 (20.0M vs 36.9M), FLOPs도 현저히 낮습니다.
  • 속도: 매 밀리초가 중요한 실시간 애플리케이션에서 YOLOv9t는 에지 디바이스에 적합한 놀라운 속도(T4 TensorRT 기준 2.3ms)를 제공합니다.
  • 정확도:YOLOv9e는 탐지 정확도의 한계를 뛰어넘어 55.6% mAP 달성하여 높은 정밀도가 요구되는 작업에 탁월합니다.

Ultralytics 에코시스템의 이점

YOLOv7 YOLOv9 중 어떤 것을 선택하든, Ultralytics Python 통해 활용하면 통일되고 간소화된 경험을 제공합니다.

사용 편의성과 교육

Ultralytics 원시 PyTorch 발견되는 복잡한 훈련 루프를 Ultralytics . 개발자는 단일 문자열 인수를 변경하여 아키텍처를 전환할 수 있어, 하이퍼파라미터 튜닝과 실험을 단순화합니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model (or substitute with "yolov7.pt")
model = YOLO("yolov9c.pt")

# Train on the COCO8 dataset with efficient memory management
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

메모리 및 리소스 관리

Ultralytics 주요 장점은 최적화된 메모리 사용입니다. DETR 변형 모델을 비롯한 많은 트랜스포머 기반 모델이나 구형 2단계 탐지기와 달리, Ultralytics YOLO CUDA 급증을 최소화하도록 설계되었습니다. 이를 통해 연구자들은 소비자용 GPU에서도 더 큰 배치 크기를 사용할 수 있어, 고급 모델 훈련에 대한 접근성을 확대합니다.

통합 데이터셋 관리

Ultralytics 데이터셋 다운로드 및 포맷팅을 자동으로 Ultralytics . 다음과 같은 표준 데이터셋으로 즉시 훈련을 시작할 수 있습니다. COCO8 이나 Objects365와 같은 표준 데이터셋으로 복잡한 데이터 로더를 작성하지 않고도 즉시 훈련을 시작할 수 있습니다.

실제 응용 분야

7 선택해야 할 때

YOLOv7 레거시 호환성이 핵심인 시스템에 YOLOv7 강력한 선택지입니다.

  • 기존 파이프라인: 2022년식 C++ 내보내기 파이프라인과 이미 통합된 프로젝트의 경우 YOLOv7을 계속 사용하는 것이 더 쉬울 수 있습니다.
  • 범용 탐지: 절대적으로 가장 낮은 매개변수 수가 주요 제약 조건이 아닌 표준 영상 분석의 경우, YOLOv7 훌륭한 성능을 발휘합니다.

9 선택해야 할 때

YOLOv9 우수한 매개변수 효율성으로 인해 일반적으로 신규 배포에 YOLOv9 .

  • 엣지 컴퓨팅: GELAN의 경량 특성 덕분에 YOLOv9 저장 공간과 연산 능력이 제한된 임베디드 시스템 및 모바일 애플리케이션에 YOLOv9
  • 의료 영상: PGI 아키텍처는 미세한 정보를 보존하는 데 도움이 되며, 이는 의료 스캔에서 작은 이상을 탐지할 때 매우 중요합니다.
  • 공중 감시: 향상된 특징 보존 기능은 고고도 드론 영상에서 차량이나 가축과 같은 소형 물체를 탐지하는 데 도움이 됩니다.

차세대: YOLO26

YOLOv7 YOLOv9 훌륭한 YOLOv9 불구하고, AI 분야는 더욱 단순하고 빠른 방향으로 나아가고 있습니다. 2026년 1월에 Ultralytics 최신 버전인 YOLO26이 등장했습니다.

YOLO26은 엔드투엔드 NMS 설계로 패러다임 전환을 이루었습니다. 비최대 억제(NMS)를 제거함으로써 YOLO26은 추론 파이프라인의 주요 병목 현상을 해소하고 배포를 단순화합니다. TensorRT 및 ONNX 배포를 단순화합니다.

  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 분야의 혁신(예: Moonshot AI의 Kimi K2)에서 영감을 받아, YOLO26은 더 빠른 수렴과 향상된 안정성을 위해 MuSGD 최적화기를 활용합니다.
  • 에지 최적화: 분포 초점 손실(DFL) 제거 및 ProgLoss + STAL과 같은 최적화된 손실 함수를 통해 YOLO26은 CPU에서 최대 43% 더 빠르게 실행되어 에지 AI의 최상의 선택이 되었습니다.
  • 다용도성: 탐지 전용이었던 이전 모델들과 달리, YOLO26은 기본적으로 자세 추정, 분할방향성 경계 상자(OBB)를 지원합니다.

YOLO26에 대해 더 알아보기

결론

YOLOv7 YOLOv9 모두 컴퓨터 비전 발전에 크게 YOLOv9 . YOLOv7 2022년 속도와 정확도 측면에서 높은 기준을 YOLOv7 , YOLOv9 2024년 그라디언트 흐름과 매개변수 효율성을 개선하기 위한 새로운 아키텍처 변경을 YOLOv9 .

오늘날 개발자들에게 선택은 일반적으로 YOLOv9 의 효율성이나 NMS 아키텍처와 CPU 최첨단 YOLO26을 CPU 있습니다. 강력한 Ultralytics 지원을 통해 이러한 모델들 사이를 전환하며 스마트 시티 모니터링이나 농업용 로봇 공학등 특정 제약 조건에 완벽하게 부합하는 모델을 찾는 일이 그 어느 때보다 쉬워졌습니다.


댓글