Link to this sectionYOLOv10 대 DAMO-YOLO#
최신 컴퓨터 비전 파이프라인을 구축할 때 적절한 실시간 객체 탐지 아키텍처를 선택하는 것은 매우 중요합니다. 이 포괄적인 기술 분석에서는 YOLOv10과 DAMO-YOLO의 아키텍처, 성능 지표 및 이상적인 사용 사례를 살펴봅니다. 두 모델 모두 객체 탐지 기능에 있어 중요한 도약을 의미하지만, 목표를 달성하기 위해 서로 다른 아키텍처 경로를 따릅니다.
귀하의 프로젝트가 제한된 에지 AI 하드웨어에 배포되어야 하거나 클라우드 GPU에서 최대 정확도를 요구하든, 이러한 아키텍처의 미묘한 차이를 이해하면 정보에 입각한 결정을 내리는 데 도움이 될 것입니다.
Link to this sectionYOLOv10 살펴보기#
칭화대학교 연구진이 도입한 YOLOv10은 기본적으로 엔드투엔드(end-to-end) 접근 방식을 도입하여 YOLO 제품군을 혁신했으며, 후처리 과정에서 NMS(Non-Maximum Suppression)의 필요성을 효과적으로 제거했습니다.
YOLOv10 세부 정보:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 소속 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
Link to this section주요 아키텍처 특징#
YOLOv10의 핵심 혁신은 NMS 없는 학습을 위한 일관된 이중 할당(Consistent Dual Assignments) 전략입니다. 기존 객체 탐지기는 겹치는 BBox를 필터링하기 위해 NMS에 크게 의존하는데, 이는 예측 불가능한 지연 시간을 유발하며 자율 주행차 및 고속 로봇 공학과 같은 실시간 애플리케이션에 상당한 병목 현상을 초래합니다. YOLOv10은 객체당 하나의 최적 BBox를 직접 예측함으로써 예측 가능하고 매우 낮은 지연 시간의 추론을 달성합니다.
또한 이 모델은 **전체적인 효율성-정확도 중심 설계(Holistic Efficiency-Accuracy Driven Design)**를 채택하고 있습니다. 이 아키텍처는 경량 분류 헤드와 공간-채널 분리 다운샘플링을 포함한 다양한 구성 요소를 최적화하여 계산 중복을 크게 줄입니다. 그 결과, 경쟁력 있는 mAP(mean Average Precision)를 유지하면서도 더 낮은 파라미터 수와 더 적은 FLOP를 자랑하는 아키텍처가 탄생했습니다.
Link to this section사용 예시#
YOLOv10은 Ultralytics 생태계에 깊이 통합되어 있어 Ultralytics Python 패키지를 통해 매우 쉽게 사용할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to TensorRT format
model.export(format="engine", quantize=16)Link to this sectionDAMO-YOLO 살펴보기#
Alibaba Group에서 개발한 DAMO-YOLO는 자동화된 신경망 구조 탐색(NAS)을 통해 매우 효율적인 네트워크 구조를 발견하는 데 중점을 두며, 속도와 정확도의 파레토 프런티어를 확장하는 것을 목표로 합니다.
DAMO-YOLO 세부 정보:
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- 조직: Alibaba Group
- 날짜: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
Link to this section주요 아키텍처 특징#
DAMO-YOLO는 산업용 애플리케이션에 맞춘 여러 새로운 기술을 도입했습니다. 모델의 기반은 다목적 진화 탐색(Multi-Objective Evolutionary search)을 통해 생성된 MAE-NAS 백본입니다. 이 자동화된 프로세스는 미리 정의된 계산 예산을 엄격하게 준수하는 백본 구조를 찾아내어 정확도와 추론 지연 시간 사이의 미세한 균형을 유지합니다.
또한, 이 아키텍처는 Efficient RepGFPN 넥을 활용합니다. 이 특징 피라미드 네트워크는 객체 크기가 크게 변하는 항공 이미지 분석과 같은 복잡한 작업에 필수적인 여러 스케일에 걸쳐 특징 융합을 개선하도록 설계되었습니다. 이를 보완하기 위해 DAMO-YOLO는 최종 예측 계층의 복잡성을 대폭 줄여 추론 시 소중한 계산 시간을 절약하는 미니멀리스트 탐지 헤드인 ZeroHead를 구현합니다.
Link to this section성능 비교#
객체 탐지 아키텍처를 평가할 때 추론 속도, 파라미터 효율성 및 탐지 정확도 간의 올바른 절충안을 찾는 것이 가장 중요합니다. 아래 표는 각 모델 크기에 걸쳐 YOLOv10과 DAMO-YOLO의 성능을 비교합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
벤치마크에서 볼 수 있듯이, YOLOv10은 특히 나노 변형 모델에서 TensorRT 상에서 일관되게 뛰어난 지연 시간 프로필을 제공하며, DAMO-YOLO의 유사 모델보다 훨씬 적은 파라미터와 FLOP를 요구합니다. DAMO-YOLO는 tiny 변형 모델에서 강력한 mAP를 제공하지만, YOLOv10 제품군의 파라미터 효율성과 추론 지연 시간은 제약이 있는 배포 환경에서 뚜렷한 이점을 제공합니다.
Link to this section활용 사례 및 권장 사항#
YOLOv10과 DAMO-YOLO 중 선택하는 것은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 다릅니다.
Link to this sectionYOLOv10을 선택해야 할 때#
YOLOv10은 다음 용도에 강력한 선택지입니다:
- NMS 없는 실시간 탐지: Non-Maximum Suppression 없이 엔드 투 엔드 탐지를 수행하여 배포 복잡성을 줄이는 애플리케이션.
- 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 스케일 전반에서 추론 속도와 탐지 정확도 사이의 강력한 균형이 필요한 프로젝트.
- 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.
Link to this sectionDAMO-YOLO를 선택해야 할 때#
DAMO-YOLO는 다음의 경우 권장됩니다:
- 고처리량 영상 분석: 배치-1(batch-1) 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 높은 FPS 영상 스트림을 처리할 때.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
- 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.
Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:
- NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.
Link to this sectionUltralytics의 장점#
두 모델 모두 기술적으로 인상적이지만, 프로덕션을 위한 아키텍처를 선택할 때는 단순한 지표 이상의 것을 고려해야 합니다. Ultralytics 생태계에서 기본적으로 지원하는 모델로 빌드하는 것은 개발자와 연구자 모두에게 독보적인 이점을 제공합니다.
Link to this section사용 편의성 및 잘 유지 관리되는 생태계#
종종 방치되는 독립형 학술 리포지토리와 달리, Ultralytics는 강력하고 활발하게 유지 관리되는 생태계를 제공합니다. NAS 파이프라인에 크게 의존하는 모델을 위해 복잡한 환경을 설정하는 것은 어려울 수 있습니다. 반면, Ultralytics는 광범위한 문서가 뒷받침하는 표준화되고 직관적인 Python API와 강력한 CLI를 제공합니다. 이는 맞춤형 비전 솔루션의 출시 시간을 획기적으로 단축합니다.
Link to this section학습 효율성 및 메모리 요구 사항#
대형 모델을 학습시키는 것은 빠르게 계산 비용이 많이 들 수 있습니다. Ultralytics YOLO 아키텍처는 학습 및 추론 중 낮은 CUDA 메모리 사용량으로 역사적으로 유명합니다. 이러한 효율성 덕분에 개발자는 RT-DETR과 같은 Transformer 기반 모델로 작업할 때 흔히 발생하는 메모리 부족 오류 없이 소비자용 하드웨어 또는 비용 효율적인 클라우드 인스턴스에서 모델을 학습시킬 수 있습니다.
Ultralytics는 최고의 MLOps 도구와 기본적으로 통합됩니다. Weights & Biases, Comet 또는 ClearML과의 통합을 사용하여 추가 보일러플레이트 코드 없이 쉽게 모델 학습 진행 상황을 추적할 수 있습니다.
Link to this section작업 전반의 범용성#
A significant limitation of many specialized detection models is their narrow focus. Within the Ultralytics ecosystem, you are not limited to just object detection. The tools seamlessly extend to multiple computer vision tasks, including instance segmentation, image classification, pose estimation, and oriented bounding box (OBB) detection.
Link to this section향후 전망: YOLO26의 진화#
YOLOv10이 NMS 없는 추론을 개척하고 DAMO-YOLO가 NAS의 힘을 보여주었지만, 컴퓨터 비전 분야는 빠르게 움직이고 있습니다. 최고의 최첨단 솔루션을 찾는 개발자라면 Ultralytics YOLO26을 확인해 보시기 바랍니다.
YOLO11의 확실한 후속작으로 출시된 YOLO26은 YOLOv10이 설정한 NMS 없는 기반을 바탕으로 구축되었지만, 이를 훨씬 더 발전시켰습니다.
YOLO26의 주요 발전 사항은 다음과 같습니다:
- 최대 43% 더 빠른 CPU 추론: 에지 컴퓨팅 및 저전력 장치에 특별히 최적화되었습니다.
- DFL 제거: Distribution Focal Loss가 제거되어 더 간단한 내보내기와 다양한 배포 대상과의 향상된 호환성을 보장합니다.
- MuSGD 최적화 도구: SGD와 Muon의 하이브리드로, 고급 LLM 학습 안정성과 더 빠른 수렴을 컴퓨터 비전에 직접 도입합니다.
- ProgLoss + STAL: 농업 및 원격 탐사와 같은 사용 사례에 필수적인 작은 객체 인식에서 현저한 향상을 제공하는 크게 개선된 손실 함수입니다.
새롭게 개편된 Ultralytics 플랫폼을 활용함으로써, 개발자는 단 몇 번의 클릭만으로 YOLO26과 같은 차세대 모델을 원활하게 주석 처리하고 학습 및 배포할 수 있어 컴퓨터 비전 파이프라인이 최첨단이자 미래를 대비할 수 있도록 보장합니다.