YOLOv9 YOLOv7: 현대 객체 탐지 기술에 대한 심층 분석
실시간 객체 탐지 기술의 진화는 계산 효율성과 높은 정확도 사이의 균형을 지속적으로 추구해온 결과물이다. 이 여정에서 두 가지 획기적인 아키텍처는 대만 중앙연구원 정보과학연구소 연구진이 개발한 YOLOv7. YOLOv7 혁신적인 훈련 가능한 'bag-of-freebies'를 YOLOv7 반면, 최신 버전인 YOLOv9 딥러닝 정보 병목 현상을 정면으로 YOLOv9 .
이 포괄적인 기술 비교는 두 모델의 아키텍처 차이점, 성능 지표 및 이상적인 배포 시나리오를 탐구하여 머신러닝 엔지니어와 연구원이 컴퓨터 비전 파이프라인에 적합한 도구를 선택할 수 있도록 지원합니다.
성능 및 지표 비교
이러한 모델들을 비교할 때, 순수 성능과 효율성은 핵심 요소입니다. 아래 표는 표준 COCO 벤치마크에 대한 평균 정밀도(mAP)와 계산 요구 사항을 상세히 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
성능 균형
YOLOv9c가 YOLOv7x(53.1 mAP)와 거의 동일한 정확도(53.0 mAP)를 달성하면서도 훨씬 적은 매개변수(25.3M vs 71.3M)와 FLOPs를 사용한다는 점에 주목하십시오. 이는 현대 아키텍처의 성능 균형 개선을 보여줍니다.
YOLOv9: 정보 병목 현상 해결
2024년 초에 소개된 YOLOv9 딥 뉴럴 네트워크가 레이어 전반에 걸쳐 데이터를 유지하는 방식을 YOLOv9 변화시켰습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직:정보 과학 연구소, 아카데미아 시니카
- 날짜: 2024년 2월 21일
- 자료:Arxiv 논문 | GitHub 저장소
건축 혁신
YOLOv9 일반화된 효율적 레이어 집계 네트워크(GELAN)와 프로그래머블 기울기 정보(PGI)를 YOLOv9 . GELAN은 CSPNet과 ELAN의 장점을 결합하여 매개변수 효율성과 계산 비용을 최적화함으로써, 더 적은 매개변수 수로 높은 정밀도를 보장합니다. PGI는 딥 네트워크에서 데이터 손실을 방지하기 위해 설계된 보조 감독 프레임워크로, 훈련 과정 중 가중치 업데이트를 위한 신뢰할 수 있는 기울기를 생성합니다.
장점과 한계
YOLOv9 주요 YOLOv9 막대한 계산 오버헤드 없이도 미묘한 특징을 추출할 수 YOLOv9 , 의료 영상 분석과 같이 높은 특징 충실도가 요구되는 작업에 탁월한 성능을 발휘합니다. 그러나 훈련 과정에서의 복잡한 PGI 구조는 초보자에게 더 통합된 프레임워크에 비해 맞춤형 아키텍처 수정을 더 어렵게 만들 수 있습니다.
YOLOv7: 프리비즈 백의 선구자
2022년 출시된 YOLOv7 소비자용 하드웨어에서 가능한 성능의 새로운 기준을 YOLOv7 , 실시간 추론 속도를 크게 향상시킨 구조적 혁신을 도입했습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직:정보 과학 연구소, 아카데미아 시니카
- 날짜: 2022년 7월 6일
- 자료:Arxiv 논문 | GitHub 저장소
건축 혁신
YOLOv7 핵심 기여는 확장 효율적 레이어 집계 네트워크(E-ELAN)입니다. 이 아키텍처는 모델이 지속적으로 더 다양한 특징을 학습할 수 있게 합니다. 또한 YOLOv7 계획된 재매개변수화 컨볼루션과 동적 레이블 할당과 같은 기법인 "훈련 가능한 무료 기능 모음(trainable bag-of-freebies)"을 YOLOv7 . 이러한 방법들은 배포 시 추론 비용을 추가하지 않으면서도 훈련 중 모델의 정확도를 향상시킵니다.
장점과 한계
YOLOv7 실시간 에지 처리에 YOLOv7 , 기존 시스템과 구형 CUDA 여전히 핵심 역할을 수행합니다. 현재 주요 한계점은 최신 모델 대비 큰 매개변수 크기입니다. 성능 표에서 확인할 수 있듯, 최상위 정확도를 달성하려면 무거운 YOLOv7x 모델이 필요하며, 이는 동등한 현대적 아키텍처 대비 훨씬 더 많은 GPU 요구합니다.
Ultralytics : 간소화된 배포
YOLOv9 YOLOv7 원본 연구 저장소는 탁월한 학술적 기반을 YOLOv7 , 이러한 모델을 실제 운영 환경에 배포하는 것은 복잡할 수 있습니다. 이를 통해 통합하는 것은 ultralytics 패키지는 비교할 수 없는 사용 편의성.
통합된 Ultralytics 활용함으로써 개발자는 직관적인 Python , 활발한 커뮤니티 지원, 강력한 실험 추적 기능을 갖춘 잘 관리된 생태계의 혜택을 누릴 수 있습니다.
YOLO26으로 미래 대비하기
새로운 컴퓨터 비전 프로젝트를 시작하신다면, 새로 출시된 YOLO26YOLOv7 YOLOv9 YOLOv7 우선적으로 검토하시길 강력히 권장합니다. 최신 최첨단 표준으로 출시된 YOLO26은 획기적인 발전을 가져왔습니다:
- 엔드투엔드 NMS 프리 설계: 비최대 억제(NMS) 후처리 과정을 제거하여 배포 복잡성과 지연 시간을 획기적으로 감소시킵니다.
- 최대 43% 빠른 CPU : 에지 컴퓨팅 환경에 최적화되어 전용 GPU 없이도 애플리케이션이 원활하게 실행됩니다.
- MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받은 하이브리드 최적화기로, 매우 안정적인 수렴을 제공하며 훈련 시간을 단축합니다.
- DFL 제거: 분포 초점 손실(Distribution Focal Loss)을 제거하여 모델 내보내기를 간소화하고, 저전력 모바일 기기와의 호환성을 향상시킵니다.
- ProgLoss + STAL: 소형 물체 탐지 성능을 획기적으로 향상시켜 항공 촬영 및 감시 분야에서 최고의 선택이 됩니다.
생태계 내에서 인기 있는 다른 대안으로는 Ultralytics YOLOv8 및 YOLO11가 있으며, 둘 다 인스턴스 분할 및 자세 추정과 같은 작업 전반에 걸쳐 매우 다양한 기능을 제공합니다.
구현 예시
통합 API를 사용하면 이러한 아키텍처 중 어느 것이든 훈련 및 내보내기가 매우 간단합니다. 아래 코드는 Ultralytics 간소화된 훈련 효율성 특성을 보여줍니다.
from ultralytics import YOLO
# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt") # Swap with "yolo26n.pt" for faster edge performance
# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")
메모리 요구 사항
소비자용 하드웨어에서 훈련할 때 메모리 효율성은 매우 중요합니다. Ultralytics YOLOv9 YOLO26 Ultralytics VRAM 급증을 줄이기 위해 극도로 최적화되어 있습니다. 이는 훈련 중 심각한 메모리 부풀림 현상을 자주 겪는 트랜스포머 기반 모델(예: RT-DETR)과 대조적입니다.
실제 적용 사례와 이상적인 사용 사례
이러한 아키텍처 중 하나를 선택하는 것은 종종 생산 환경의 특정 제약 조건에 따라 결정됩니다.
YOLOv9 사용 시점: YOLOv9 미세한 디테일 보존이 필요한 환경에서YOLOv9 . 강력한 특징 추출 능력 덕분에, 선반에 빽빽이 진열된 상품을 계수하는 소매 분석이나 작물의 초기 병변을 작은 잎에서 식별해야 하는 농업 분야에 이상적입니다.
YOLOv7 사용 시점: YOLOv7 기존 배포 파이프라인에YOLOv7 적합한 후보입니다. 구형 하드웨어 시스템(예: 특정 세대의 Google Edge TPU)에 통합하는 경우, YOLOv7 단순한 CNN 아키텍처는 최신 모델의 복잡한 그라디언트 분기보다 컴파일하기 쉬울 YOLOv7 있습니다.
YOLO26 사용 권장 시점: 자율 드론부터 스마트 시티 교통 관리에이르기까지 모든 현대적 배포 환경에서 YOLO26이 최상의 선택입니다. NMS 아키텍처는 결정론적 추론 시간을 보장하여 안전이 중요한 로봇 공학에 필수적이며, 높은 정밀도로 YOLOv9 YOLOv7 능가합니다.