YOLOv9 vs YOLOv7: 현대적 객체 탐지에 대한 기술적 심층 분석
실시간 객체 탐지의 진화는 계산 효율성과 높은 정확도 사이의 균형을 맞추려는 끊임없는 노력에 의해 주도되어 왔습니다. 이 여정에서 중요한 이정표가 된 두 가지 아키텍처는 YOLOv9와 YOLOv7이며, 두 모델 모두 대만 중앙연구원 정보과학연구소의 연구원들이 개발했습니다. YOLOv7이 혁신적인 학습 가능한 'bag-of-freebies'를 도입했다면, 최신 모델인 YOLOv9는 딥러닝 정보 병목 현상을 정면으로 해결합니다.
이 포괄적인 기술 비교에서는 두 모델의 아키텍처 차이, 성능 지표 및 이상적인 배포 시나리오를 살펴보고, 머신러닝 엔지니어와 연구자가 컴퓨터 비전 파이프라인에 적합한 도구를 선택하도록 돕습니다.
성능 및 메트릭 비교
이 모델들을 비교할 때, 기본 성능과 효율성은 결정적인 요소입니다. 다음 표는 표준 COCO 데이터셋 벤치마크에 대한 평균 정밀도(mAP)와 계산 요구 사항을 자세히 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv9c가 더 적은 파라미터(25.3M 대 71.3M)와 FLOPs를 사용하면서도 YOLOv7x(53.1 mAP)와 거의 동일한 정확도(53.0 mAP)를 달성하는 방식에 주목하십시오. 이는 현대적 아키텍처의 성능 균형 개선 사항을 보여줍니다.
YOLOv9: 정보 병목 현상 해결
2024년 초에 소개된 YOLOv9는 딥 신경망이 레이어 전반에 걸쳐 데이터를 유지하는 방식을 근본적으로 변화시켰습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직: 중앙연구원 정보과학연구소
- 날짜: 2024년 2월 21일
- 리소스: Arxiv 논문 | GitHub 저장소
아키텍처 혁신
YOLOv9는 GELAN(Generalized Efficient Layer Aggregation Network)과 PGI(Programmable Gradient Information)를 도입합니다. GELAN은 CSPNet과 ELAN의 장점을 결합하여 파라미터 효율성과 계산 비용을 최적화함으로써 낮은 파라미터 수로도 높은 정밀도를 보장합니다. PGI는 딥 네트워크에서 데이터 손실을 방지하기 위해 설계된 보조 감독 프레임워크로, 학습 과정에서 가중치를 업데이트하기 위한 신뢰할 수 있는 그래디언트를 생성합니다.
장점과 한계
YOLOv9의 가장 큰 장점은 막대한 계산 오버헤드 없이 미세한 특징을 추출할 수 있다는 점이며, 이는 의료 영상 분석과 같이 높은 특징 충실도가 필요한 작업에 매우 뛰어난 성능을 발휘합니다. 그러나 학습 중의 복잡한 PGI 구조는 더 통합된 프레임워크에 비해 초보자가 맞춤형 아키텍처 수정을 수행하기 더 어렵게 만들 수 있습니다.
YOLOv7: Bag-of-Freebies의 개척자
2022년에 출시된 YOLOv7은 실시간 추론 속도를 크게 향상시키는 구조적 혁신을 도입하여 소비자용 하드웨어에서 가능한 성능의 새로운 기준을 세웠습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직: 중앙연구원 정보과학연구소
- 날짜: 2022년 7월 6일
- 리소스: Arxiv 논문 | GitHub 저장소
아키텍처 혁신
YOLOv7의 핵심 기여는 E-ELAN(Extended Efficient Layer Aggregation Network)입니다. 이 아키텍처는 모델이 더 다양한 특징을 지속적으로 학습할 수 있게 합니다. 또한 YOLOv7은 계획된 재파라미터화 컨볼루션 및 동적 레이블 할당과 같은 '학습 가능한 bag-of-freebies' 기술을 사용합니다. 이러한 방법은 배포 시 추론 비용을 추가하지 않으면서도 학습 중 모델의 정확도를 향상시킵니다.
장점과 한계
YOLOv7은 실시간 에지 처리에 최적화되어 있으며 레거시 시스템 및 이전 CUDA 환경에서 여전히 주요 모델로 사용됩니다. 현재의 주요 한계는 최신 모델에 비해 파라미터 크기가 더 크다는 점입니다. 성능 표에서 볼 수 있듯이, 최고 수준의 정확도를 달성하려면 동일한 수준의 최신 아키텍처보다 훨씬 많은 GPU 메모리를 요구하는 무거운 YOLOv7x 모델이 필요합니다.
Ultralytics의 이점: 간소화된 배포
YOLOv9와 YOLOv7의 원본 연구 저장소는 훌륭한 학문적 기반을 제공하지만, 이러한 모델을 프로덕션 환경에 배포하는 것은 복잡할 수 있습니다. ultralytics 패키지를 통해 이들을 통합하면 비할 데 없는 사용 편의성을 제공합니다.
통합 Ultralytics Platform을 사용함으로써 개발자는 직관적인 Python API, 활발한 커뮤니티 지원, 그리고 강력한 실험 추적 기능을 갖춘 잘 관리된 생태계의 이점을 누릴 수 있습니다.
YOLO26으로 미래 대비하기
새로운 컴퓨터 비전 프로젝트를 시작한다면, YOLOv9와 YOLOv7보다 새로 출시된 **YOLO26**을 살펴보는 것을 강력히 추천합니다. 새로운 최첨단 표준으로 출시된 YOLO26은 혁신적인 발전을 가져옵니다:
- 종단 간(End-to-End) NMS-Free 설계: NMS 후처리를 제거하여 배포 복잡성과 지연 시간을 획기적으로 줄였습니다.
- 최대 43% 빠른 CPU 추론: 에지 컴퓨팅 환경에 최적화되어 전용 GPU 없이도 애플리케이션이 원활하게 실행됩니다.
- MuSGD 옵티마이저: LLM 학습에서 영감을 받은 하이브리드 옵티마이저로, 매우 안정적인 수렴을 제공하고 학습 시간을 단축합니다.
- DFL 제거: Distribution Focal Loss를 제거하여 모델 내보내기를 간소화하고 저전력 모바일 장치와의 호환성을 향상시켰습니다.
- ProgLoss + STAL: 소형 객체 탐지 성능을 크게 향상시켜 항공 이미지 및 감시 분야에서 최고의 선택이 됩니다.
생태계 내의 다른 인기 있는 대안으로는 Ultralytics YOLOv8과 YOLO11이 있으며, 두 모델 모두 인스턴스 분할 및 포즈 추정과 같은 작업 전반에서 방대한 범용성을 제공합니다.
구현 예시
통합 API를 사용하면 이러한 아키텍처를 학습하고 내보내는 작업이 매우 간단합니다. 아래 코드는 Ultralytics 도구의 특징인 간소화된 학습 효율성을 보여줍니다.
from ultralytics import YOLO
# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt") # Swap with "yolo26n.pt" for faster edge performance
# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")소비자급 하드웨어에서 학습할 때는 메모리 효율성이 중요합니다. YOLOv9와 YOLO26의 Ultralytics 구현은 VRAM 스파이크를 줄이도록 크게 최적화되어 있습니다. 이는 학습 중에 심각한 메모리 팽창 문제를 겪는 트랜스포머 기반 모델(예: RT-DETR)과는 대조적입니다.
실제 애플리케이션 및 이상적인 사용 사례
이러한 아키텍처 중에서 선택하는 것은 종종 프로덕션 환경의 구체적인 제약 사항에 따라 달라집니다.
YOLOv9 사용 시기: YOLOv9는 미세한 디테일 유지가 필요한 환경에서 탁월합니다. 강력한 특징 추출 기능 덕분에 선반에 촘촘하게 쌓인 제품을 계산하는 소매 분석이나 작은 잎에서 초기 단계의 작물 질병을 식별하는 것이 중요한 농업 분야에 이상적입니다.
YOLOv7 사용 시기: YOLOv7은 레거시 배포 파이프라인에서 여전히 강력한 후보입니다. 이전 하드웨어 시스템(예: 특정 세대의 Google Coral Edge TPU)과 통합하는 경우, YOLOv7의 직관적인 CNN 아키텍처가 최신 모델의 복잡한 그래디언트 브랜치보다 컴파일하기 쉬울 수 있습니다.
YOLO26 사용 시기 (권장): 자율 드론부터 스마트 시티 교통 관리에 이르기까지, 모든 현대적 배포에는 YOLO26이 더 나은 선택입니다. NMS-free 아키텍처는 결정론적 추론 시간을 보장하여 안전이 중요한 로봇 공학에 필수적이며, 높은 정밀도는 모든 측면에서 YOLOv9와 YOLOv7을 능가합니다.