DAMO-YOLO vs. YOLOv9: 최신 객체 detect 아키텍처의 포괄적인 기술 비교
실시간 객체 탐지 기술의 발전 속도는 여전히 눈부신 속도로 진화하고 있다. 엔지니어링 팀과 연구자들이 정확도, 추론 속도, 계산 효율성 사이의 완벽한 균형을 추구하는 가운데, 연구계에서는 두 가지 주목할 만한 아키텍처가 등장했다: YOLO YOLOv9입니다. 두 모델 모두 컴퓨터 비전 분야에서 가능한 한계를 넓히기 위한 중대한 아키텍처 혁신을 도입했습니다.
이 상세한 기술 가이드에서는 두 모델의 고유한 아키텍처 접근 방식, 훈련 방법론, 실제 배포 역량을 비교 분석합니다. 또한 현대 AI 개발에서 광범위한 소프트웨어 생태계가 어떻게 핵심적인 역할을 하는지 살펴보고, Ultralytics 같은 통합 플랫폼 및 YOLO26과 같은 차세대 모델의 장점을 부각시킬 것입니다.
요약: 올바른 아키텍처 선택하기
두 모델 모두 딥러닝 연구에서 중요한 이정표를 나타내지만, 약간 다른 배포 철학을 따릅니다.
DAMO-YOLO는 특정 성능 프로파일을 최대한 끌어내기 위해 강력한 신경망 아키텍처 검색(NAS)을 활용할 수 있는 환경에서 탁월한 성능을 발휘하며, 맞춤형 엣지 배포를 위한 흥미로운 연구 대상이 됩니다. 반대로, YOLOv9는 딥러닝 정보 병목 현상 해결에 중점을 두어 매우 높은 파라미터 효율성을 제공합니다.
그러나 실제 운영 환경에 배포할 때는 엔지니어링 팀이 일관되게 통합된 Ultralytics 활용을 권장합니다. 신규 프로젝트의 경우 최신 YOLO26 모델은 두 가지 장점을 모두 제공합니다: 최첨단 정확도와 복잡한 후처리 작업이 필요 없는 네이티브 엔드투엔드 설계입니다.
컴퓨터 비전 파이프라인의 미래 대비
YOLO YOLOv9 강력한 학술 YOLOv9 , 실제 운영 환경에 배포하려면 상당한 맞춤형 엔지니어링이 필요한 경우가 많습니다. Ultralytics 사용하면 간소화되고 유지보수가 용이한 API를 통해 최첨단 성능을 활용할 수 있습니다.
기술 사양 및 저작권
이러한 모델들의 기원과 발전 초점을 이해하는 것은 각각의 강점을 파악하는 데 필수적인 맥락을 제공한다.
DAMO-YOLO
Alibaba Group 연구원들이 개발한 DAMO-YOLO는 자동화된 아키텍처 생성과 효율적인 특징 융합에 중점을 둡니다.
- 작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- 조직:조직: 알리바바 그룹
- 출시일: 2022년 11월 23일
- Arxiv 논문:DAMO-YOLO 연구 논문
- 공식 GitHub:tinyvision/DAMO-YOLO Repository
- 문서:DAMO-YOLO README
9
딥 컨볼루션 네트워크에서의 정보 손실 해결책으로 소개된 YOLOv9 훈련 중 기울기 보존의 이론적 한계를 YOLOv9 .
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직:기관: 대만 학술원 정보 과학 연구소
- 출시일: 2024년 2월 21일
- Arxiv 논문:YOLOv9 연구 논문
- 공식 GitHub:WongKinYiu/yolov9 Repository
- 문서:YOLOv9 Ultralytics 문서
아키텍처 혁신
DAMO-YOLO: 신경망 아키텍처 탐색 기반
DAMO-YOLO는 고도로 맞춤화된, 기계 생성 구성 요소를 통해 차별화됩니다. 백본은 신경망 아키텍처 검색 (NAS)을 사용하여 생성되며, 특히 다양한 하드웨어에서 낮은 지연 시간 추론을 목표로 합니다.
본 아키텍처는 효율적인 RepGFPN (재매개변수화 일반화 피라미드 네트워크)을 특징 융합에 활용하여, 계산 오버헤드를 과도하게 증가시키지 않으면서 다중 스케일 객체 탐지 성능을 향상시킵니다. 또한 탐지 헤드를 단순화하기 위해 ZeroHead 설계를 채택하고, 레이블 할당을 위해 AlignedOTA를 활용하며, 훈련 중 정교한 증류 강화 프로세스를 병행합니다. 이러한 기법들은 빠른 추론을 가능하게 하지만, 다단계 증류 프로세스는 상당한 VRAM과 연장된 훈련 시간을 요구하는 경우가 많습니다.
YOLOv9: 정보 병목 현상 해결
YOLOv9 딥러닝 네트워크의 근본적인 문제인 입력 데이터 정보가 연속적인 레이어를 통과하면서 점차 손실되는 현상을 YOLOv9 .
이를 해결하기 위해 저자들은 프로그래머블 그라디언트 정보(PGI)를 도입했다. 이는 심층 레이어를 위한 핵심 세부 정보를 보존하도록 설계된 보조 감독 프레임워크로, 가중치 업데이트를 위한 매우 신뢰할 수 있는 그라디언트를 생성한다. PGI와 함께 GELAN(일반화된 효율적 레이어 집계 네트워크) 아키텍처가 제안되었다. GELAN은 CSPNet과 ELAN의 장점을 결합하여 매개변수 효율성을 최적화하며, 정보 흐름을 극대화하는 동시에 부동소수점 연산(FLOPs)을 엄격히 최소화한다.
성능 분석 및 지표
성능 평가 시 두 모델 모두 COCO 같은 표준 벤치마크에서 높은 평균 정밀도(mAP)를 보여줍니다. YOLOv9 동등한 모델 크기에서 더 높은 절대 정확도를 YOLOv9 , PGI 아키텍처를 활용해 어려운 데이터셋에서도 높은 정확도를 유지합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
위에서 보듯이, YOLOv9-E는 가장 높은 정확도를 달성하며, 더 작은 DAMO-YOLO 및 YOLOv9 변형은 TensorRT 최적화를 통해 매우 경쟁력 있는 추론 속도를 유지합니다.
학습 방법론 및 생태계
원시 아키텍처도 중요하지만, 실제 적용에서는 모델 생태계가 결정하는 사용성과 훈련 효율성이 가장 중요하다.
DAMO-YOLO가 지식 증류(knowledge distillation)에 의존하는 것은 종종 대상 "student" 모델로 지식을 전이하기 전에 번거로운 "teacher" 모델을 훈련해야 함을 의미합니다. 이러한 전통적인 연구 접근 방식은 메모리 요구 사항과 훈련 주기 시간을 크게 증가시킵니다. 마찬가지로, 원래 YOLOv9 저장소는 애자일 개발을 늦출 수 있는 복잡한 구성 파일을 탐색해야 합니다.
이와 대조적으로, 모델을 Ultralytics Platform에 통합하면 개발자 경험이 완전히 달라집니다. Ultralytics Python 패키지는 상용구 코드를 추상화하여 팀이 데이터 증강, 하이퍼파라미터 튜닝 및 모델 내보내기를 손쉽게 처리할 수 있도록 합니다.
실제 적용 사례 및 사용 사례
다양한 아키텍처는 리소스 요구 사항 및 정확도 프로필에 따라 특정 산업에서 자연스럽게 뛰어난 성능을 발휘합니다.
- 엣지 AI의 DAMO-YOLO: NAS 최적화 백본 덕분에 DAMO-YOLO는 기본적인 제조 품질 관리에서의 맞춤형 ASIC 배포와 같이 하드웨어별 재매개변수화가 필수적인 임베디드 시스템에서 자주 연구됩니다.
- 정밀 분석에서의 YOLOv9: 높은 매개변수 효율성과 PGI 기반 기울기 유지 기능을 갖춘 YOLOv9은 항공 이미지 분석 또는 혼잡한 소매 환경에서 작은 객체를 track하는 것과 같은 밀집 객체 탐지 시나리오에 탁월합니다.
사용 사례 및 권장 사항
DAMO-YOLO와 YOLOv9 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
YOLO 선택해야 할 때
DAMO-YOLO는 다음 경우에 강력한 선택입니다.
- 고처리량 비디오 분석: 배치-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리합니다.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
- 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화된 백본이 detect 성능에 미치는 영향 연구.
9 선택해야 할 때
YOLOv9 다음에 권장YOLOv9 :
- 정보 병목 연구: PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 연구하는 학술 프로젝트.
- 그라디언트 흐름 최적화 연구: 훈련 중 깊은 네트워크 레이어에서 발생하는 정보 손실을 이해하고 완화하는 데 초점을 맞춘 연구.
- 고정확도 감지 벤치마킹: 아키텍처 비교를 위한 참조점으로 YOLOv9의 강력한 COCO 벤치마크 성능이 필요한 시나리오.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
- 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.
Ultralytics : YOLO26으로의 진화
기존 아키텍처를 비교하는 사용자에게는 현대적인 Ultralytics , 특히 최신 YOLO26 모델로의전환이 비교할 수 없는 이점을 제공합니다.
YOLO26은 엔드투엔드 NMS 설계로 배포 환경을 근본적으로 변화시킵니다. 비최대 억제(NMS) 후처리 과정을 완전히 제거함으로써 더 빠르고 획기적으로 단순화된 배포 아키텍처를 제공합니다. 분산 초점 손실(DFL) 제거와 결합된 YOLO26은 에지 및 저전력 장치에 대한 탁월한 호환성을 제공합니다.
또한 YOLO26은 LLM 훈련 혁신에서 영감을 받은 확률적 경사 하강법(Stochastic Gradient Descent)과 뮤온 최적화(Muon optimization)의 하이브리드인 혁신적인 MuSGD 최적화기를 통합합니다. 이는 트랜스포머 기반의 무거운 대안들에 비해 놀라울 정도로 낮은 메모리 사용량을 유지하면서도 매우 안정적인 훈련 수렴을 제공합니다.
YOLO26을 활용한 효율적인 훈련
직관적인 Ultralytics 덕분에, 내장된 실험 추적 기능을 갖춘 최첨단 YOLO26 모델을 단 몇 줄의 Python 코드로 훈련시킬 수 있습니다.
from ultralytics import YOLO
# Load the latest NMS-free YOLO26 model
model = YOLO("yolo26n.pt")
# Train on your custom dataset efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX format
model.export(format="onnx")
고급 인스턴스 분할, 고정밀 자세 추정 또는 표준 바운딩 박스 검출이 필요하든, Ultralytics 다용도성은 팀이 딥러닝 환경 구성에 소요하는 시간을 줄이고 견고한 AI 솔루션 배포에 더 많은 시간을 할애할 수 있도록 보장합니다. 소형 객체 인식 향상을 위한 ProgLoss + STAL과 같은 특수 작업 개선 사항을 갖춘 YOLO26은 차세대 비전 애플리케이션을 위한 최고의 선택으로 자리매김하고 있습니다.