Link to this sectionYOLOv9 대 DAMO-YOLO#
컴퓨터 비전의 급격한 발전으로 다양한 배포 제약 조건과 정확도 요구 사항에 맞춘 강력한 아키텍처들이 등장했습니다. 이 분야에서 주목할 만한 두 가지 모델은 정보 병목 현상을 효과적으로 처리하는 것으로 유명한 YOLOv9와, 신경 아키텍처 탐색(NAS) 및 효율적인 피라미드 구조에 중점을 둔 DAMO-YOLO입니다.
본 가이드에서는 YOLOv9와 DAMO-YOLO에 대한 심층적인 기술적 비교를 통해 아키텍처 차이점, 학습 방법론, 그리고 이상적인 배포 시나리오를 살펴봅니다. 또한 Ultralytics 에코시스템이 개발부터 프로덕션까지 어떻게 원활한 경로를 제공하는지, 그리고 왜 YOLO26과 같은 최신 모델이 신규 프로젝트를 위한 권장 표준이 되었는지 알아봅니다.
Link to this section아키텍처 심층 분석#
각 모델을 구동하는 핵심 메커니즘을 이해하면 다양한 지표에서 두 모델이 서로 다른 성능을 보이는 이유를 알 수 있습니다.
Link to this sectionYOLOv9: 프로그래밍 가능한 그래디언트 정보#
YOLOv9는 심층 신경망을 통해 데이터가 흐를 때 발생하는 정보 손실 문제를 직접 해결하도록 설계되었습니다.
저자: Chien-Yao Wang, Hong-Yuan Mark Liao
조직: 대만 중앙연구원 정보과학연구소
날짜: 2024년 2월 21일
링크: Arxiv, GitHub, 문서
YOLOv9는 **PGI(Programmable Gradient Information)**와 **GELAN(Generalized Efficient Layer Aggregation Network)**을 도입했습니다. PGI는 순전파 과정에서 중요한 공간 및 의미론적 정보가 유지되도록 보장하여 가중치 업데이트에 사용되는 그래디언트의 저하를 방지합니다. GELAN은 이를 보완하여 파라미터 효율성을 극대화하며, 기존 CNN 모델보다 적은 FLOPs로 최신 mAP(mean Average Precision) 성능을 달성합니다.
Link to this sectionDAMO-YOLO: NAS 기반 효율성#
Alibaba Group에서 개발한 DAMO-YOLO는 자동화된 아키텍처 탐색을 활용하여 속도와 정확도 사이의 최적의 균형을 찾는 차별화된 접근 방식을 취합니다.
저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
조직: Alibaba Group
날짜: 2022년 11월 23일
링크: Arxiv, GitHub
DAMO-YOLO는 효율적인 네트워크 구조를 자동으로 생성하기 위해 MAE-NAS(Masked Autoencoders for Neural Architecture Search) 백본에 의존합니다. 또한 강력한 특징 융합을 위해 RepGFPN(Reparameterized Generalized Feature Pyramid Network)을 사용하고, 검출 헤드의 계산 부담을 최소화하기 위해 "ZeroHead" 설계를 적용했습니다. 그 외에도 AlignedOTA를 통한 레이블 할당과 지식 증류(Knowledge Distillation)를 결합하여 소형 모델의 성능을 향상시켰습니다.
NAS(신경 아키텍처 탐색)는 인공 신경망 설계를 자동화합니다. DAMO-YOLO와 같이 매우 효율적인 모델을 생성할 수 있지만, 아키텍처 공간을 탐색하는 데 방대한 컴퓨팅 자원이 필요한 경우가 많으며, 이는 YOLOv9와 같은 결정론적 설계 철학과는 대조적입니다.
Link to this section성능 및 지표 비교#
객체 검출 모델을 선택할 때는 정확도, 속도, 컴퓨팅 사용량의 균형을 맞추는 것이 중요합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Link to this section분석#
- 정확도 대 파라미터: YOLOv9는 일반적으로 파라미터 대비 정확도 측면에서 우수한 성능을 보여줍니다. 예를 들어, YOLOv9c는 25.3M 파라미터로 53.0% mAP를 달성하는 반면, DAMO-YOLOl은 50.8% mAP를 기록하지만 더 많은 파라미터(42.1M)를 필요로 합니다.
- 추론 속도: DAMO-YOLO의 아키텍처는 T4 GPU에서 경쟁력 있는 TensorRT 추론 속도를 제공하며, 중간 티어 모델에서는 YOLOv9를 약간 앞서기도 합니다. 하지만 FLOPs와 파라미터 수 측면에서 YOLOv9의 효율성은 뛰어난 GPU 메모리 효율성으로 이어집니다.
- 메모리 요구 사항: YOLOv9를 포함한 Ultralytics YOLO 모델은 복잡한 NAS 생성 모델이나 무거운 Transformer 아키텍처에 비해 학습 및 추론 시 메모리 사용량이 낮아, 리소스가 제한된 엣지 하드웨어에서도 쉽게 배포할 수 있습니다.
Link to this sectionUltralytics 생태계의 이점#
이론적 지표도 중요하지만, 실제 구현이 프로젝트의 성공을 결정합니다. 바로 이 지점에서 Ultralytics 플랫폼과 종합적인 소프트웨어 에코시스템이 DAMO-YOLO와 같은 독립형 저장소보다 더 큰 강점을 발휘합니다.
Link to this section사용 편의성과 학습 효율성#
사용자 지정 YOLOv9 모델을 학습하는 데 필요한 보일러플레이트 코드는 최소한입니다. Ultralytics Python API는 데이터 증강, 분산 학습, 하드웨어 최적화와 같은 복잡한 과정을 추상화합니다.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate model performance
metrics = model.val()
# Export for production deployment
model.export(format="onnx")반면, DAMO-YOLO를 사용하려면 고유한 학습 파이프라인에 필요한 복잡한 설정 파일과 종속성 체인을 다루어야 하며, 이는 더 가파른 학습 곡선을 초래합니다.
Link to this section작업 전반의 범용성#
Ultralytics 모델의 특징은 내재된 범용성입니다. 표준 BBox 검출을 넘어, Ultralytics 프레임워크는 인스턴스 분할, 자세 추정, 이미지 분류, 지향성 BBox(OBB) 검출과 같은 작업을 원활하게 지원합니다. DAMO-YOLO는 2D 객체 검출에만 엄격하게 최적화되어 있어, 다른 비전 패러다임에 적응하려면 상당한 재설계가 필요합니다.
Ultralytics simplifies the deployment pipeline by offering one-click model export to formats like TensorRT, OpenVINO, and CoreML, ensuring maximum performance regardless of your target hardware.
Link to this section활용 사례 및 권장 사항#
YOLOv9와 DAMO-YOLO 중에서 선택하는 것은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건, 에코시스템 선호도에 달려 있습니다.
Link to this sectionYOLOv9를 선택해야 할 때#
YOLOv9는 다음 작업에 강력한 선택입니다:
- 정보 병목 현상 연구: PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 연구하는 학술 프로젝트.
- 그래디언트 흐름 최적화 연구: 학습 중 심층 네트워크 계층에서의 정보 손실을 이해하고 완화하는 데 중점을 둔 연구.
- 고정밀 탐지 벤치마킹: YOLOv9의 강력한 COCO 벤치마크 성능을 아키텍처 비교를 위한 참조 지점으로 활용해야 하는 시나리오.
Link to this sectionDAMO-YOLO를 선택해야 할 때#
DAMO-YOLO는 다음의 경우 권장됩니다:
- 고처리량 영상 분석: 배치-1(batch-1) 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 높은 FPS 영상 스트림을 처리할 때.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
- 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.
Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:
- NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.
Link to this section미래를 향해: YOLO26으로의 전환#
YOLOv9와 DAMO-YOLO가 역사적인 이정표를 세운 강력한 모델이지만, 현대 컴퓨터 비전은 네이티브 엔드투엔드 아키텍처로 변화하고 있습니다. 새로운 프로젝트에는 **YOLO26**을 권장 표준으로 사용하십시오.
2026년에 출시된 YOLO26은 이전 버전들의 성공을 기반으로 정확도와 배포 간결성 모두에서 비약적인 발전을 이루었습니다.
Link to this section주요 YOLO26 혁신#
- 엔드투엔드 NMS-free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 완전히 제거합니다. 이는 YOLOv10에서 처음 선보인 혁신적인 기술로, 네이티브 엔드투엔드 방식의 효율적인 배포 파이프라인을 구현합니다.
- DFL 제거: 내보내기 과정을 간소화하고 엣지/저전력 기기와의 호환성을 개선하기 위해 DFL(Distribution Focal Loss)을 제거했습니다.
- 최대 43% 더 빠른 CPU 추론: 복잡한 후처리를 제거하고 핵심 컨볼루션을 최적화하여, YOLO26은 전용 GPU가 없는 엣지 컴퓨팅 환경에 독보적으로 적합합니다.
- MuSGD 옵티마이저: LLM 학습 혁신에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드인 MuSGD를 사용하여 더 안정적인 학습과 훨씬 빠른 수렴 속도를 보장합니다.
- ProgLoss + STAL: 이 고급 손실 함수들은 작은 객체 인식 기능을 대폭 향상시켜, 고고도 항공 이미지나 IoT 기기 환경에 YOLO26을 이상적으로 만듭니다.
현재 차기 프로젝트를 위해 YOLO11이나 YOLOv8을 검토 중이라면, YOLO26으로 업그레이드하여 오늘날 사용 가능한 가장 최적화되고 최첨단인 비전 AI 프레임워크를 활용하십시오.
Link to this section요약#
적절한 모델 선택은 특정 운영 제약 조건에 따라 달라집니다.
- DAMO-YOLO는 NAS 기반 최적화에 대한 흥미로운 시각을 제공하며, RepGFPN 아키텍처가 빛을 발하는 특정 하드웨어 프로필에서 경쟁력 있는 속도를 제공합니다.
- YOLOv9는 심층 신경망에서의 정보 손실을 방지하는 PGI 아키텍처를 활용하여, 세밀한 시각 정보를 유지하는 데 집중하는 연구자들에게 훌륭한 선택입니다.
- Ultralytics YOLO26은 현대 기업 및 연구 애플리케이션을 위한 결정적인 선택입니다. 독보적인 사용 편의성, NMS-free 아키텍처, 최첨단 MuSGD 학습 최적화는 이 모델을 컴퓨터 비전 분야에서 가장 신뢰할 수 있고 정확하며 배포하기 쉬운 모델로 만듭니다.