Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO 대 YOLOv9#

실시간 객체 탐지 분야는 매우 빠른 속도로 발전하고 있습니다. 엔지니어링 팀과 연구원들이 정확도, 추론 속도, 연산 효율성의 완벽한 균형을 위해 노력하는 가운데, 연구 커뮤니티에서 DAMO-YOLOYOLOv9라는 두 가지 주목할 만한 아키텍처가 등장했습니다. 두 모델 모두 컴퓨터 비전에서 가능한 영역의 경계를 확장하기 위한 중요한 아키텍처 혁신을 도입했습니다.

이 상세한 기술 가이드는 두 모델에 대한 심층적인 분석을 제공하며, 고유한 아키텍처 접근 방식, 학습 방법론 및 실제 배포 기능을 비교합니다. 또한 더 넓은 소프트웨어 생태계가 현대 AI 개발에서 어떻게 중요한 역할을 하는지 살펴보고, Ultralytics Platform과 같은 통합 플랫폼 및 YOLO26과 같은 차세대 모델의 장점을 강조합니다.

Link to this section요약: 적합한 아키텍처 선택하기#

두 모델 모두 딥러닝 연구의 중요한 이정표를 나타내지만, 배포 철학 면에서는 약간의 차이가 있습니다.

DAMO-YOLO는 특정 성능 프로파일을 추출하기 위해 고도의 신경 아키텍처 탐색(NAS)을 활용할 수 있는 환경에서 뛰어난 성능을 발휘하므로, 맞춤형 엣지 배포를 위한 흥미로운 연구 대상이 됩니다. 반면, YOLOv9은 딥러닝 정보 병목 현상을 해결하는 데 중점을 두며 매우 높은 파라미터 효율성을 제공합니다.

그러나 프로덕션급 배포를 위해서는 엔지니어링 팀에서 통합된 Ultralytics 생태계를 활용할 것을 지속적으로 권장합니다. 새로운 프로젝트의 경우, 최신 YOLO26 모델은 복잡한 후처리가 필요 없는 네이티브 엔드투엔드 설계와 최첨단 정확도를 결합하여 두 장점을 모두 제공합니다.

컴퓨터 비전 파이프라인의 미래 대비

DAMO-YOLO와 YOLOv9은 강력한 학술적 모델이지만, 이를 프로덕션에 배포하려면 상당한 수준의 맞춤형 엔지니어링이 필요한 경우가 많습니다. Ultralytics YOLO26을 사용하면 간소화되고 유지 관리가 쉬운 API를 통해 최첨단 성능을 활용할 수 있습니다.

Link to this section기술 사양 및 저자 정보#

이러한 모델들의 기원과 개발 초점을 이해하는 것은 각 모델의 강점을 파악하는 데 필수적인 맥락을 제공합니다.

Link to this sectionDAMO-YOLO#

Alibaba Group 연구원들이 개발한 DAMO-YOLO는 자동화된 아키텍처 생성 및 효율적인 특징 융합에 중점을 두고 있습니다.

DAMO-YOLO에 대해 더 알아보기

Link to this sectionYOLOv9#

딥 컨볼루션 네트워크의 정보 손실 문제에 대한 해결책으로 도입된 YOLOv9은 학습 중 그래디언트 보존의 이론적 한계를 확장합니다.

YOLOv9에 대해 더 알아보기

Link to this section아키텍처 혁신#

Link to this sectionDAMO-YOLO: 신경 아키텍처 탐색(NAS) 기반#

DAMO-YOLO는 고도로 맞춤화된 기계 생성 구성 요소를 통해 차별화됩니다. 백본은 신경 아키텍처 탐색(NAS)을 사용하여 생성되며, 다양한 하드웨어에서 낮은 지연 시간의 추론을 목표로 합니다.

이 아키텍처는 특징 융합을 위해 효율적인 RepGFPN(Reparameterized Generalized Feature Pyramid Network)을 특징으로 하며, 이는 연산 오버헤드를 과도하게 증가시키지 않으면서 다중 스케일 객체 탐지 성능을 향상시킵니다. 또한, 탐지 헤드를 단순화하기 위해 ZeroHead 설계를 채택하고 레이블 할당을 위해 AlignedOTA를 활용하며, 학습 과정에서 정교한 증류(distillation) 강화 프로세스를 결합합니다. 이러한 기술들은 빠른 추론을 가능하게 하지만, 다단계 증류 과정은 종종 상당한 VRAM과 긴 학습 시간을 요구합니다.

Link to this sectionYOLOv9: 정보 병목 현상 해결#

YOLOv9은 딥 네트워크의 근본적인 문제, 즉 연속적인 계층을 통과할 때 입력 데이터 정보가 점진적으로 손실되는 문제를 해결합니다.

이를 해결하기 위해 연구원들은 가중치 업데이트를 위한 매우 신뢰할 수 있는 그래디언트를 생성하여 깊은 계층에 중요한 세부 정보를 유지하도록 설계된 보조 감독 프레임워크인 **PGI(Programmable Gradient Information)**를 도입했습니다. PGI와 함께 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처가 제공됩니다. GELAN은 CSPNet과 ELAN의 강점을 결합하여 파라미터 효율성을 최적화하고, 부동 소수점 연산(FLOPs)을 엄격하게 최소화하면서 정보 흐름을 극대화합니다.

Link to this section성능 분석 및 지표#

성능 평가 시, 두 모델 모두 COCO와 같은 표준 벤치마크에서 강력한 mAP(mean Average Precision)를 보여줍니다. YOLOv9은 PGI 아키텍처를 활용하여 어려운 데이터셋에서도 높은 충실도를 유지하며 동일한 모델 크기 전반에서 더 높은 절대 정확도를 달성합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

위에서 보듯이 YOLOv9-E는 가장 높은 정확도를 달성하며, 더 작은 DAMO-YOLO 및 YOLOv9 변형 모델들은 TensorRT 최적화를 통해 매우 경쟁력 있는 추론 속도를 유지합니다.

Link to this section학습 방법론 및 생태계#

원시 아키텍처도 중요하지만, 실제 애플리케이션에서는 모델 생태계가 결정하는 사용 편의성과 학습 효율성이 무엇보다 중요합니다.

DAMO-YOLO의 지식 증류 의존성은 종종 대상 '학생' 모델로 지식을 전달하기 전에 번거로운 '교사' 모델을 먼저 학습시켜야 합니다. 이러한 전통적인 연구 방식은 메모리 요구 사항과 학습 주기 시간을 크게 증가시킵니다. 마찬가지로, 기존 YOLOv9 저장소는 민첩한 개발 속도를 늦출 수 있는 복잡한 구성 파일을 탐색해야 합니다.

대조적으로, 모델을 Ultralytics Platform에 통합하면 개발자 경험이 완전히 바뀝니다. Ultralytics Python 패키지는 상용구 코드를 추상화하여 팀이 데이터 증강, 하이퍼파라미터 튜닝, 모델 내보내기를 손쉽게 처리할 수 있도록 지원합니다.

Link to this section실제 적용 및 사용 사례#

서로 다른 아키텍처는 자원 요구 사항과 정확도 프로필에 따라 특정 산업에서 자연스럽게 뛰어난 성능을 발휘합니다.

  • 엣지 AI에서의 DAMO-YOLO: NAS 최적화 백본 덕분에, DAMO-YOLO는 제조 품질 관리와 같은 기본 분야에서의 맞춤형 ASIC 배포처럼 하드웨어별 재매개변수화가 엄격히 필요한 임베디드 시스템에서 자주 탐구됩니다.
  • 정밀 분석에서의 YOLOv9: 높은 파라미터 효율성과 PGI 기반 그래디언트 유지 기능을 갖춘 YOLOv9은 항공 이미지 분석이나 혼잡한 소매 환경에서 아주 작은 객체를 추적하는 것과 같은 밀집 객체 탐지 시나리오에 탁월합니다.

Link to this section활용 사례 및 권장 사항#

DAMO-YOLO와 YOLOv9 중 어떤 것을 선택할지는 특정 프로젝트 요구 사항, 배포 제약 조건, 생태계 선호도에 따라 달라집니다.

Link to this sectionDAMO-YOLO를 선택해야 할 때#

DAMO-YOLO는 다음 상황에 적합합니다:

  • 고처리량 영상 분석: 배치-1(batch-1) 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 높은 FPS 영상 스트림을 처리할 때.
  • 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
  • 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.

Link to this sectionYOLOv9를 선택해야 할 때#

YOLOv9는 다음에 권장됩니다:

  • 정보 병목 현상 연구: PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 연구하는 학술 프로젝트.
  • 그래디언트 흐름 최적화 연구: 학습 중 심층 네트워크 계층에서의 정보 손실을 이해하고 완화하는 데 중점을 둔 연구.
  • 고정밀 탐지 벤치마킹: YOLOv9의 강력한 COCO 벤치마크 성능을 아키텍처 비교를 위한 참조 지점으로 활용해야 하는 시나리오.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 이점: YOLO26으로의 발전#

레거시 아키텍처를 비교하는 사용자에게 현대적인 Ultralytics 생태계, 특히 최신 YOLO26 모델로 전환하는 것은 타의 추종을 불허하는 이점을 제공합니다.

YOLO26은 End-to-End NMS-Free Design을 통해 배포 환경을 근본적으로 변화시킵니다. Non-Maximum Suppression(NMS) 후처리를 완전히 제거함으로써 더 빠르고 훨씬 단순한 배포 아키텍처를 제공합니다. Distribution Focal Loss(DFL) 제거와 결합하여 YOLO26은 엣지 및 저전력 장치에 대한 우수한 호환성을 제공합니다.

또한, YOLO26은 LLM 학습 혁신에서 영감을 받은 Stochastic Gradient Descent와 Muon 최적화의 하이브리드인 혁신적인 MuSGD Optimizer를 통합합니다. 이는 Transformer 기반 대안과 비교하여 매우 낮은 메모리 사용량을 유지하면서도 매우 안정적인 학습 수렴을 제공합니다.

YOLO26을 통한 간소화된 학습

직관적인 Ultralytics API 덕분에 단 몇 줄의 Python 코드로 내장된 실험 추적 기능을 갖춘 최첨단 YOLO26 모델을 학습할 수 있습니다.

from ultralytics import YOLO

# Load the latest NMS-free YOLO26 model
model = YOLO("yolo26n.pt")

# Train on your custom dataset efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format
model.export(format="onnx")

고급 인스턴스 세그멘테이션, 매우 정확한 포즈 추정 또는 표준 바운딩 박스 탐지 중 무엇이 필요하든, Ultralytics 프레임워크의 범용성은 팀이 딥러닝 환경을 구성하는 데 시간을 덜 쓰고 강력한 AI 솔루션을 배포하는 데 더 많은 시간을 할애할 수 있도록 보장합니다. 소형 객체 인식 강화를 위한 ProgLoss + STAL과 같은 특화된 작업 개선 기능을 갖춘 YOLO26은 차세대 비전 애플리케이션을 위한 최고의 선택입니다.

댓글