YOLOv9 YOLOv7: 현대 객체 탐지 기술에 대한 심층 분석
실시간 객체 탐지 기술의 진화는 계산 효율성과 높은 정확도 사이의 균형을 지속적으로 추구해온 결과물이다. 이 여정에서 두 가지 획기적인 아키텍처는 대만 중앙연구원 정보과학연구소 연구진이 개발한 YOLOv7. YOLOv7 혁신적인 훈련 가능한 'bag-of-freebies'를 YOLOv7 반면, 최신 버전인 YOLOv9 딥러닝 정보 병목 현상을 정면으로 YOLOv9 .
이 포괄적인 기술 비교는 두 모델의 아키텍처 차이점, 성능 지표 및 이상적인 배포 시나리오를 탐구하여 머신러닝 엔지니어와 연구원이 컴퓨터 비전 파이프라인에 적합한 도구를 선택할 수 있도록 지원합니다.
성능 및 지표 비교
이러한 모델들을 비교할 때, 순수 성능과 효율성은 핵심 요소입니다. 아래 표는 표준 COCO 벤치마크에 대한 평균 정밀도(mAP)와 계산 요구 사항을 상세히 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
성능 균형
YOLOv9c가 YOLOv7x(53.1 mAP)와 거의 동일한 정확도(53.0 mAP)를 달성하면서도 훨씬 적은 매개변수(25.3M vs 71.3M)와 FLOPs를 사용한다는 점에 주목하십시오. 이는 현대 아키텍처의 성능 균형 개선을 보여줍니다.
YOLOv9: 정보 병목 현상 해결
2024년 초에 소개된 YOLOv9 딥 뉴럴 네트워크가 레이어 전반에 걸쳐 데이터를 유지하는 방식을 YOLOv9 변화시켰습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직:정보 과학 연구소, 아카데미아 시니카
- 날짜: 2024년 2월 21일
- 리소스:Arxiv 논문 | GitHub 저장소
아키텍처 혁신
YOLOv9 일반화된 효율적 레이어 집계 네트워크(GELAN)와 프로그래머블 기울기 정보(PGI)를 YOLOv9 . GELAN은 CSPNet과 ELAN의 장점을 결합하여 매개변수 효율성과 계산 비용을 최적화함으로써, 더 적은 매개변수 수로 높은 정밀도를 보장합니다. PGI는 딥 네트워크에서 데이터 손실을 방지하기 위해 설계된 보조 감독 프레임워크로, 훈련 과정 중 가중치 업데이트를 위한 신뢰할 수 있는 기울기를 생성합니다.
장점과 한계
YOLOv9 주요 YOLOv9 막대한 계산 오버헤드 없이도 미묘한 특징을 추출할 수 YOLOv9 , 의료 영상 분석과 같이 높은 특징 충실도가 요구되는 작업에 탁월한 성능을 발휘합니다. 그러나 훈련 과정에서의 복잡한 PGI 구조는 초보자에게 더 통합된 프레임워크에 비해 맞춤형 아키텍처 수정을 더 어렵게 만들 수 있습니다.
YOLOv7: 프리비즈 백의 선구자
2022년 출시된 YOLOv7 소비자용 하드웨어에서 가능한 성능의 새로운 기준을 YOLOv7 , 실시간 추론 속도를 크게 향상시킨 구조적 혁신을 도입했습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직:정보 과학 연구소, 아카데미아 시니카
- 날짜: 2022년 7월 6일
- 리소스:Arxiv 논문 | GitHub 저장소
아키텍처 혁신
YOLOv7 핵심 기여는 확장 효율적 레이어 집계 네트워크(E-ELAN)입니다. 이 아키텍처는 모델이 지속적으로 더 다양한 특징을 학습할 수 있게 합니다. 또한 YOLOv7 계획된 재매개변수화 컨볼루션과 동적 레이블 할당과 같은 기법인 "훈련 가능한 무료 기능 모음(trainable bag-of-freebies)"을 YOLOv7 . 이러한 방법들은 배포 시 추론 비용을 추가하지 않으면서도 훈련 중 모델의 정확도를 향상시킵니다.
장점과 한계
YOLOv7 실시간 에지 처리에 YOLOv7 , 기존 시스템과 구형 CUDA 여전히 핵심 역할을 수행합니다. 현재 주요 한계점은 최신 모델 대비 큰 매개변수 크기입니다. 성능 표에서 확인할 수 있듯, 최상위 정확도를 달성하려면 무거운 YOLOv7x 모델이 필요하며, 이는 동등한 현대적 아키텍처 대비 훨씬 더 많은 GPU 요구합니다.
Ultralytics : 간소화된 배포
YOLOv9 YOLOv7 원본 연구 저장소는 탁월한 학술적 기반을 YOLOv7 , 이러한 모델을 실제 운영 환경에 배포하는 것은 복잡할 수 있습니다. 이를 통해 통합하는 것은 ultralytics 패키지는 비교할 수 없는 사용 편의성.
통합된 Ultralytics 플랫폼을 활용함으로써 개발자는 직관적인 Python API, 활발한 커뮤니티 지원 및 견고한 실험 추적 기능을 갖춘 잘 관리되는 생태계의 이점을 누립니다.
YOLO26으로 미래 대비하기
새로운 컴퓨터 비전 프로젝트를 시작하신다면, 새로 출시된 YOLO26YOLOv7 YOLOv9 YOLOv7 우선적으로 검토하시길 강력히 권장합니다. 최신 최첨단 표준으로 출시된 YOLO26은 획기적인 발전을 가져왔습니다:
- 종단 간 NMS-Free 설계: Non-Maximum Suppression 후처리를 제거하여 배포 복잡성과 지연 시간을 획기적으로 줄입니다.
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 환경에 최적화되어 전용 GPU 없이도 애플리케이션이 원활하게 실행되도록 보장합니다.
- MuSGD 옵티마이저: LLM 훈련에서 영감을 받은 하이브리드 옵티마이저로, 매우 안정적인 수렴을 제공하고 훈련 시간을 단축합니다.
- DFL 제거: Distribution Focal Loss 제거로 모델 내보내기가 간소화되어 저전력 모바일 장치와의 호환성이 향상되었습니다.
- ProgLoss + STAL: 작은 객체 detect 성능을 획기적으로 개선하여 항공 이미지 및 감시에 최고의 선택이 되게 합니다.
생태계 내에서 인기 있는 다른 대안으로는 Ultralytics YOLOv8 및 YOLO11가 있으며, 둘 다 인스턴스 분할 및 자세 추정과 같은 작업 전반에 걸쳐 매우 다양한 기능을 제공합니다.
구현 예시
통합 API를 사용하면 이러한 아키텍처 중 어느 것이든 훈련 및 내보내기가 매우 간단합니다. 아래 코드는 Ultralytics 간소화된 훈련 효율성 특성을 보여줍니다.
from ultralytics import YOLO
# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt") # Swap with "yolo26n.pt" for faster edge performance
# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")
메모리 요구 사항
소비자용 하드웨어에서 훈련할 때 메모리 효율성은 매우 중요합니다. Ultralytics YOLOv9 YOLO26 Ultralytics VRAM 급증을 줄이기 위해 극도로 최적화되어 있습니다. 이는 훈련 중 심각한 메모리 부풀림 현상을 자주 겪는 트랜스포머 기반 모델(예: RT-DETR)과 대조적입니다.
실제 적용 사례와 이상적인 사용 사례
이러한 아키텍처 중 선택은 종종 프로덕션 환경의 특정 제약 조건에 달려 있습니다.
YOLOv9 사용 시기: YOLOv9는 미세한 디테일 유지가 필요한 환경에서 탁월합니다. 강력한 특징 추출 기능 덕분에 선반에 빽빽하게 쌓인 제품을 세는 소매 분석이나 작은 잎에 나타나는 초기 단계 작물 질병을 식별하는 것이 중요한 농업 애플리케이션에 이상적입니다.
YOLOv7 사용 시기: YOLOv7은 레거시 배포 파이프라인에 여전히 강력한 후보입니다. 구형 하드웨어 시스템(예: 특정 세대의 Google Coral Edge TPU)에 통합하는 경우, YOLOv7의 간단한 CNN 아키텍처는 최신 모델의 더 복잡한 그래디언트 브랜치보다 컴파일하기 더 쉬울 수 있습니다.
YOLO26을 사용해야 할 때 (권장): 자율 드론부터 스마트 도시 교통 관리에 이르는 모든 현대적인 배포에서 YOLO26은 탁월한 선택입니다. NMS 없는 아키텍처는 안전에 중요한 로봇 공학에 필수적인 결정론적 추론 시간을 보장하며, 높은 정밀도는 YOLOv9와 YOLOv7을 전반적으로 능가합니다.