YOLOv10 vs DAMO-YOLO: 실시간 객체 탐지기 기술 비교
현대적인 컴퓨터 비전 파이프라인을 구축할 때 올바른 실시간 객체 탐지 아키텍처를 선택하는 것은 매우 중요합니다. 이 포괄적인 기술 분석에서는 YOLOv10과 DAMO-YOLO의 아키텍처, 성능 지표 및 이상적인 사용 사례를 살펴봅니다. 두 모델 모두 객체 탐지 기능 측면에서 큰 도약을 이뤄냈으나, 각자의 목표를 달성하기 위해 서로 다른 아키텍처 경로를 따르고 있습니다.
프로젝트가 제한된 에지 AI 하드웨어에 배포되어야 하든, 클라우드 GPU에서 최대 정확도를 요구하든, 이러한 아키텍처의 미묘한 차이를 이해하면 정보에 입각한 결정을 내리는 데 도움이 될 것입니다.
YOLOv10 탐구
칭화대학교 연구진이 발표한 YOLOv10은 기본적으로 엔드투엔드(end-to-end) 방식을 도입하여 후처리 과정에서 비최대 억제(NMS)의 필요성을 효과적으로 제거함으로써 YOLO 제품군에 혁신을 가져왔습니다.
YOLOv10 세부 정보:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
주요 아키텍처 특징
YOLOv10의 가장 큰 혁신은 NMS 없는 학습을 위한 Consistent Dual Assignments(일관된 이중 할당) 전략입니다. 기존 객체 탐지기는 겹치는 경계 상자를 필터링하기 위해 NMS에 크게 의존하는데, 이는 예측할 수 없는 지연 시간을 발생시키며 자율 주행 자동차 및 고속 로봇 공학과 같은 실시간 애플리케이션에 상당한 병목 현상이 됩니다. YOLOv10은 객체당 최적의 경계 상자를 하나만 직접 예측함으로써 예측 가능하고 초저지연 추론을 달성합니다.
또한 이 모델은 **Holistic Efficiency-Accuracy Driven Design(종합적인 효율성-정확도 중심 설계)**을 채택합니다. 이 아키텍처는 경량화된 분류 헤드와 공간-채널 분리 다운샘플링을 포함한 다양한 구성 요소를 최적화하여 계산 중복성을 크게 줄입니다. 그 결과, 경쟁력 있는 평균 정밀도(mAP)를 유지하면서도 더 낮은 파라미터 수와 적은 FLOPs를 자랑하는 아키텍처가 완성되었습니다.
사용 예시
YOLOv10은 Ultralytics 생태계에 깊이 통합되어 있어 Ultralytics Python 패키지를 통해 매우 쉽게 사용할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to TensorRT format
model.export(format="engine", half=True)DAMO-YOLO 탐구
Alibaba Group에서 개발한 DAMO-YOLO는 자동화된 신경망 구조 탐색(NAS)을 통해 매우 효율적인 네트워크 구조를 발견하는 데 중점을 두며, 속도와 정확도의 파레토 프런티어를 확장하는 것을 목표로 합니다.
DAMO-YOLO 세부 정보:
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
- 조직: Alibaba Group
- 날짜: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
주요 아키텍처 특징
DAMO-YOLO는 산업용 애플리케이션에 맞춘 여러 가지 새로운 기술을 도입했습니다. 모델의 핵심은 다목적 진화 탐색(Multi-Objective Evolutionary search)을 통해 생성된 MAE-NAS Backbone입니다. 이 자동화된 프로세스는 사전 정의된 계산 예산을 엄격히 준수하는 백본 구조를 찾아내어 정확도와 추론 지연 시간 사이의 정교한 균형을 맞춥니다.
또한 이 아키텍처는 Efficient RepGFPN 넥을 활용합니다. 이 특징 피라미드 네트워크는 다양한 크기의 객체가 존재하는 항공 이미지 분석과 같은 복잡한 작업에서 핵심적인 특징 융합을 개선하도록 설계되었습니다. 이를 보완하기 위해 DAMO-YOLO는 최종 예측 계층의 복잡성을 대폭 줄여 추론 중 귀중한 계산 시간을 절약하는 미니멀리스트 탐지 헤드인 ZeroHead를 구현합니다.
성능 비교
객체 탐지 아키텍처를 평가할 때는 추론 속도, 파라미터 효율성, 탐지 정확도 사이에서 올바른 균형을 찾는 것이 가장 중요합니다. 아래 표는 각 모델 크기에 따른 YOLOv10과 DAMO-YOLO의 성능을 비교합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
벤치마크에서 알 수 있듯이, YOLOv10은 TensorRT에서 지속적으로 탁월한 지연 시간 프로필을 제공하며, 특히 나노 변형 모델에서는 DAMO-YOLO의 유사 모델보다 훨씬 적은 파라미터와 FLOPs를 요구합니다. DAMO-YOLO의 tiny 변형이 강력한 mAP를 제공하지만, YOLOv10 제품군의 파라미터 효율성과 추론 지연 시간은 제한된 배포 환경에서 뚜렷한 이점을 제공합니다.
사용 사례 및 권장 사항
YOLOv10과 DAMO-YOLO 중에서 선택하는 것은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
YOLOv10을 선택해야 하는 경우
YOLOv10은 다음 경우에 강력한 선택입니다:
- NMS-free 실시간 탐지: Non-Maximum Suppression 없이 엔드투엔드 탐지 기능을 활용하여 배포 복잡성을 줄여야 하는 애플리케이션.
- 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 규모 전반에서 추론 속도와 탐지 정확도 간의 강력한 균형이 필요한 프로젝트.
- Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.
DAMO-YOLO를 선택해야 할 때
DAMO-YOLO는 다음 경우에 권장됩니다:
- 고처리량 비디오 분석: batch-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리할 때.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에 대한 엄격한 GPU 지연 시간 제약 조건이 있는 시나리오.
- 신경 아키텍처 검색 연구: 자동화된 아키텍처 검색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.
Ultralytics(YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최적의 조합을 제공합니다:
- NMS-free 엣지 배포: Non-Maximum Suppression 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속기가 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: 항공 드론 이미지나 IoT 센서 분석과 같은 도전적인 시나리오에서 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 향상시킵니다.
Ultralytics의 강점
두 모델 모두 기술적으로 인상적이지만, 프로덕션을 위한 아키텍처 선택에는 단순한 지표 이상의 고려가 필요합니다. Ultralytics 생태계에서 기본적으로 지원하는 모델로 구축하면 개발자와 연구자 모두에게 독보적인 이점을 제공합니다.
사용 편의성 및 잘 유지되는 생태계
종종 방치되는 독립형 학술 저장소와 달리, Ultralytics는 강력하고 활발하게 유지 관리되는 생태계를 제공합니다. NAS 파이프라인에 크게 의존하는 모델을 위해 복잡한 환경을 설정하는 것은 어려울 수 있습니다. 반면 Ultralytics는 광범위한 문서를 바탕으로 표준화되고 직관적인 Python API와 강력한 CLI를 제공합니다. 이는 맞춤형 비전 솔루션의 시장 출시 시간을 획기적으로 단축합니다.
학습 효율성 및 메모리 요구 사항
대규모 모델을 학습시키는 것은 빠르게 계산 비용이 많이 들 수 있습니다. Ultralytics YOLO 아키텍처는 역사적으로 학습 및 추론 중 낮은 CUDA 메모리 사용량으로 잘 알려져 있습니다. 이러한 효율성 덕분에 개발자는 RT-DETR과 같은 트랜스포머 기반 모델 작업 시 흔히 발생하는 메모리 부족 오류 없이 소비자용 하드웨어나 비용 효율적인 클라우드 인스턴스에서 모델을 학습시킬 수 있습니다.
Ultralytics는 최고의 MLOps 도구와 기본적으로 통합됩니다. 추가적인 상용구 코드 없이도 Weights & Biases, Comet 또는 ClearML과의 통합을 사용하여 모델 학습 진행 상황을 쉽게 추적할 수 있습니다.
작업 전반에 걸친 다재다능함
A significant limitation of many specialized detection models is their narrow focus. Within the Ultralytics ecosystem, you are not limited to just object detection. The tools seamlessly extend to multiple computer vision tasks, including instance segmentation, image classification, pose estimation, and oriented bounding box (OBB) detection.
미래 전망: YOLO26의 진화
YOLOv10이 NMS 없는 추론의 선구자 역할을 했고 DAMO-YOLO가 NAS의 힘을 보여주었지만, 컴퓨터 비전 분야는 빠르게 움직입니다. 최고의 최첨단 솔루션을 찾는 개발자라면 Ultralytics YOLO26을 확인해 보시길 권장합니다.
YOLO11의 확실한 후속작으로 출시된 YOLO26은 YOLOv10이 설정한 NMS 없는 기반을 토대로 더욱 발전했습니다.
YOLO26의 주요 발전 사항은 다음과 같습니다:
- 최대 43% 더 빠른 CPU 추론: 에지 컴퓨팅 및 저전력 장치에 최적화되었습니다.
- DFL 제거: Distribution Focal Loss가 제거되어 내보내기가 단순해지고 다양한 배포 대상과의 호환성이 향상되었습니다.
- MuSGD 옵티마이저: SGD와 Muon의 하이브리드로서, 고급 LLM 학습 안정성과 더 빠른 수렴을 컴퓨터 비전에 직접 도입합니다.
- ProgLoss + STAL: Drastically improved loss functions that offer notable enhancements in small-object recognition, which is essential for use cases like agriculture and remote sensing.
새롭게 개편된 Ultralytics Platform을 활용하면 개발자는 단 몇 번의 클릭만으로 YOLO26과 같은 차세대 모델을 원활하게 주석 처리하고 학습 및 배포할 수 있어 컴퓨터 비전 파이프라인이 최첨단 상태를 유지하고 미래에도 대비할 수 있습니다.