Link to this sectionYOLOv9 대 YOLOv7#
실시간 객체 탐지의 발전은 컴퓨팅 효율성과 높은 정확성 사이의 균형을 맞추기 위한 끊임없는 노력으로 추진되었습니다. 이 여정에서 중요한 두 가지 아키텍처는 YOLOv9와 YOLOv7이며, 두 모델 모두 대만 Academia Sinica 정보 과학 연구소의 연구진이 개발했습니다. YOLOv7이 혁신적인 학습 가능한 'bag-of-freebies'를 도입했다면, 더 새로운 YOLOv9는 딥러닝 정보 병목 현상을 정면으로 해결합니다.
이 포괄적인 기술 비교는 두 모델의 아키텍처 차이, 성능 지표 및 이상적인 배포 시나리오를 탐색하여 ML 엔지니어와 연구원이 컴퓨터 비전 파이프라인에 적합한 도구를 선택하도록 돕습니다.
Link to this section성능 및 지표 비교#
이 모델들을 비교할 때, 기본 성능과 효율성은 중요한 요소입니다. 다음 표는 표준 COCO 데이터셋 벤치마크에 대한 평균 정밀도(mAP)와 컴퓨팅 요구 사항을 자세히 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv9c가 YOLOv7x(53.1 mAP)와 거의 동일한 정확도(53.0 mAP)를 달성하면서도 훨씬 적은 매개변수(25.3M 대 71.3M)와 FLOPs를 사용하는 방식에 주목하십시오. 이는 최신 아키텍처에서 성능 균형이 향상되었음을 보여줍니다.
Link to this sectionYOLOv9: 정보 병목 현상 해결#
2024년 초에 도입된 YOLOv9는 심층 신경망이 레이어 전체에서 데이터를 유지하는 방식을 근본적으로 변화시켰습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직: 중앙연구원 정보과학연구소(Institute of Information Science, Academia Sinica)
- 날짜: 2024년 2월 21일
- 리소스: Arxiv 논문 | GitHub 저장소
Link to this section아키텍처 혁신#
YOLOv9는 GELAN(Generalized Efficient Layer Aggregation Network)과 PGI(Programmable Gradient Information)를 도입합니다. GELAN은 CSPNet과 ELAN의 강점을 결합하여 매개변수 효율성과 컴퓨팅 비용을 최적화하며, 더 적은 매개변수 수로 높은 정밀도를 보장합니다. PGI는 심층 네트워크에서 데이터 손실을 방지하도록 설계된 보조 감독 프레임워크로, 학습 과정에서 가중치를 업데이트하기 위한 신뢰할 수 있는 그래디언트를 생성합니다.
Link to this section강점 및 한계#
YOLOv9의 주된 강점은 엄청난 컴퓨팅 오버헤드 없이 미세한 특징을 추출하는 능력으로, 의료 영상 분석과 같이 높은 특징 충실도가 필요한 작업에 매우 유능합니다. 그러나 학습 중 복잡한 PGI 구조로 인해 초보자에게는 더 통합된 프레임워크에 비해 맞춤형 아키텍처 수정이 더 까다로울 수 있습니다.
Link to this sectionYOLOv7: Bag-of-Freebies의 선구자#
2022년에 출시된 YOLOv7은 소비자용 하드웨어에서 가능한 성능에 대한 새로운 벤치마크를 설정했으며, 실시간 추론 속도를 크게 높이는 구조적 혁신을 도입했습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직: 중앙연구원 정보과학연구소(Institute of Information Science, Academia Sinica)
- 날짜: 2022년 7월 6일
- 리소스: Arxiv 논문 | GitHub 저장소
Link to this section아키텍처 혁신#
YOLOv7의 핵심 기여는 E-ELAN(Extended Efficient Layer Aggregation Network)입니다. 이 아키텍처는 모델이 더 다양한 특징을 지속적으로 학습할 수 있게 합니다. 또한, YOLOv7은 계획된 재매개변수화 컨볼루션 및 동적 레이블 할당과 같은 '학습 가능한 bag-of-freebies' 기술을 사용합니다. 이러한 방법은 배포 시 추론 비용을 추가하지 않고도 학습 중에 모델의 정확도를 향상시킵니다.
Link to this section강점 및 한계#
YOLOv7은 실시간 엣지 처리에 매우 최적화되어 있으며 레거시 시스템과 이전 CUDA 환경에서 여전히 주요한 역할을 합니다. 오늘날의 주요 제한 사항은 최신 모델에 비해 더 큰 매개변수 크기입니다. 성능 표에서 볼 수 있듯이, 최고 수준의 정확도를 달성하려면 동급의 최신 아키텍처보다 훨씬 더 많은 GPU 메모리를 요구하는 무거운 YOLOv7x 모델이 필요합니다.
Link to this sectionUltralytics의 강점: 간소화된 배포#
YOLOv9 및 YOLOv7의 원본 연구 저장소가 훌륭한 학문적 기반을 제공하지만, 이러한 모델을 운영 환경에 배포하는 것은 복잡할 수 있습니다. ultralytics 패키지를 통해 통합하면 타의 추종을 불허하는 사용 편의성을 제공합니다.
통합된 Ultralytics Platform을 활용함으로써, 개발자는 직관적인 Python API, 활발한 커뮤니티 지원 및 강력한 실험 추적 기능을 갖춘 잘 관리된 생태계의 이점을 누릴 수 있습니다.
Link to this sectionYOLO26으로 미래를 대비하다#
새로운 컴퓨터 비전 프로젝트를 시작하는 경우, YOLOv9와 YOLOv7 모두보다 새롭게 출시된 **YOLO26**을 살펴보는 것을 강력히 권장합니다. 새로운 최첨단 표준으로 출시된 YOLO26은 획기적인 발전을 가져옵니다.
- 엔드투엔드 NMS-Free 설계: NMS(Non-Maximum Suppression) 후처리를 제거하여 배포 복잡성과 지연 시간을 획기적으로 줄입니다.
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 환경에 최적화되어 전용 GPU 없이도 애플리케이션이 원활하게 실행되도록 합니다.
- MuSGD 옵티마이저: LLM 학습에서 영감을 받은 하이브리드 옵티마이저로, 매우 안정적인 수렴을 제공하고 학습 시간을 단축합니다.
- DFL 제거: Distribution Focal Loss를 제거하여 모델 내보내기를 간소화하고, 저전력 모바일 기기와의 호환성을 향상시킵니다.
- ProgLoss + STAL: 소형 객체 탐지 성능을 대폭 향상시켜 항공 이미지 및 감시 분야의 최고의 선택이 되었습니다.
생태계 내의 다른 인기 있는 대안으로는 Ultralytics YOLOv8 및 YOLO11이 있으며, 두 모델 모두 인스턴스 세그멘테이션 및 포즈 추정과 같은 작업 전반에서 엄청난 범용성을 제공합니다.
Link to this section구현 예시#
통합 API를 사용하면 이러한 아키텍처 중 어떤 것이든 학습하고 내보내는 것이 매우 간단합니다. 아래 코드는 Ultralytics 도구의 특징인 간소화된 학습 효율성을 보여줍니다.
from ultralytics import YOLO
# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt") # Swap with "yolo26n.pt" for faster edge performance
# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")소비자용 하드웨어에서 학습할 때 메모리 효율성은 매우 중요합니다. Ultralytics의 YOLOv9 및 YOLO26 구현은 학습 중에 심각한 메모리 팽창을 겪는 트랜스포머 기반 모델(RT-DETR 등)과 달리 VRAM 스파이크를 줄이기 위해 강력하게 최적화되어 있습니다.
Link to this section실제 애플리케이션 및 이상적인 사용 사례#
이러한 아키텍처 사이의 선택은 종종 운영 환경의 특정 제약 조건에 달려 있습니다.
YOLOv9 사용 시기: YOLOv9는 미세한 디테일 보존이 필요한 환경에서 탁월합니다. 강력한 특징 추출 기능 덕분에 선반에 빽빽하게 쌓인 제품을 세는 소매 분석이나 작은 잎에서 초기 단계의 작물 질병을 식별하는 것이 중요한 농업 응용 분야에 이상적입니다.
YOLOv7 사용 시기: YOLOv7은 레거시 배포 파이프라인에 여전히 강력한 후보입니다. (특정 세대의 Google Coral Edge TPU와 같은) 오래된 하드웨어 시스템에 통합하는 경우, YOLOv7의 직관적인 CNN 아키텍처는 최신 모델의 더 복잡한 그래디언트 분기보다 컴파일하기 쉬울 수 있습니다.
YOLO26 사용 시기 (권장): 자율 드론에서 스마트 시티 교통 관리에 이르기까지, 모든 최신 배포 환경에서는 YOLO26이 우수한 선택입니다. NMS-free 아키텍처는 안전이 중요한 로봇 공학에 필수적인 결정론적 추론 시간을 보장하며, 높은 정밀도는 모든 측면에서 YOLOv9와 YOLOv7을 능가합니다.