YOLOv10 vs. DAMO-YOLO: 기술 비교
최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 계산 비용 간의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 Ultralytics 생태계에 통합된 최신 고효율 모델인 YOLOv10과 Alibaba Group의 강력한 감지기인 DAMO-YOLO 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 대한 정보에 입각한 선택을 할 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석합니다.
YOLOv10: 실시간 엔드 투 엔드 감지
2024년 5월 칭화대학교 연구진이 발표한 YOLOv10은 실시간 객체 감지 분야에서 중요한 진전을 이루었습니다. 주요 혁신은 Non-Maximum Suppression (NMS)의 필요성을 제거하여 end-to-end 감지를 달성함으로써 사후 처리 오버헤드를 줄이고 추론 지연 시간을 낮추는 것입니다.
기술 세부 사항:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
아키텍처 및 주요 기능
YOLOv10은 강력한 Ultralytics 프레임워크를 기반으로 구축되어 사용 편의성과 강력한 생태계를 계승합니다. 아키텍처는 뛰어난 효율성과 성능을 위해 여러 가지 주요 발전을 도입했습니다.
- NMS-Free 학습: YOLOv10은 학습 중에 레이블에 대해 일관된 이중 할당을 사용합니다. 이를 통해 모델은 NMS 후처리 단계 없이 깔끔한 예측을 생성하여 배포 파이프라인을 단순화하고 진정한 엔드 투 엔드를 구현할 수 있습니다.
- 전체적인 효율성-정확도 설계: 모델 아키텍처는 계산 중복성을 줄이도록 포괄적으로 최적화되었습니다. 여기에는 속도와 기능을 모두 향상시키는 경량 분류 헤드와 공간-채널 분리 다운샘플링이 포함됩니다.
- 원활한 Ultralytics 통합: Ultralytics 에코시스템의 일부인 YOLOv10은 간소화된 사용자 경험을 제공합니다. 여기에는 간단한 Python API, 광범위한 설명서, 효율적인 학습 프로세스 및 즉시 사용 가능한 사전 학습된 가중치가 포함됩니다. 이러한 통합을 통해 개발자는 매우 쉽게 시작하고 모델을 신속하게 배포할 수 있습니다.
강점과 약점
강점:
- 최첨단 효율성: YOLOv10은 뛰어난 속도와 정확도의 균형을 제공하며, 아래 성능 표에 자세히 설명된 바와 같이 더 적은 파라미터와 더 낮은 지연 시간으로 경쟁 모델보다 뛰어난 성능을 보이는 경우가 많습니다.
- 사용 편의성: 이 모델은 Ultralytics 에코시스템과의 통합 덕분에 매우 사용자 친화적이며, 여기에는 노코드 학습 및 배포를 위한 Ultralytics HUB가 포함됩니다.
- End-to-End 배포: NMS가 없는 설계는 훈련에서 추론에 이르기까지 전체 워크플로를 간소화하여 실제 애플리케이션에 이상적입니다.
- 더 낮은 메모리 요구 사항: 더 복잡한 아키텍처와 비교했을 때, YOLOv10은 훈련 및 추론 중 메모리 사용에 효율적이므로 제한된 하드웨어를 가진 사용자도 접근할 수 있습니다.
약점:
- Task Specialization: YOLOv10은 뛰어난 객체 탐지 성능을 제공하지만, 현재는 이 단일 작업에만 집중하고 있습니다. 세분화, 분류, 포즈 추정을 기본적으로 지원하는 다재다능한 Ultralytics YOLOv8과는 대조적입니다.
이상적인 사용 사례
YOLOv10은 실시간 성능과 효율성이 가장 중요한 애플리케이션을 위한 완벽한 선택입니다.
- Edge AI: 작은 공간 차지와 짧은 지연 시간 덕분에 NVIDIA Jetson 또는 Raspberry Pi와 같이 리소스가 제한된 장치에 배포하는 데 이상적입니다.
- 자율 시스템: 빠르고 안정적인 감지는 자율 주행차 및 로봇 공학과 같은 애플리케이션에 매우 중요합니다.
- 실시간 비디오 분석: 교통 관리 및 보안 감시와 같은 높은 처리량 시스템에 적합합니다.
DAMO-YOLO
DAMO-YOLO는 Alibaba Group에서 개발한 빠르고 정확한 객체 감지 모델입니다. 2022년 11월에 출시되었으며 YOLO 스타일 감지기의 성능 한계를 뛰어넘기 위해 여러 새로운 기술을 도입했습니다.
기술 세부 사항:
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen 외
- Organization: Alibaba Group
- 날짜: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- 문서: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
아키텍처 및 주요 기능
DAMO-YOLO는 속도-정확도 절충을 개선하기 위한 고급 기술 탐구의 결과입니다. 아키텍처는 다음과 같은 특징을 갖습니다.
- NAS(Neural Architecture Search): DAMO-YOLO의 백본은 NAS를 사용하여 생성되었으며, 이를 통해 고도로 최적화된 특징 추출기를 사용할 수 있습니다.
- Efficient RepGFPN Neck: 효율적이고 강력한 새로운 기능 피라미드 네트워크(FPN) 설계를 통합했습니다.
- ZeroHead 및 AlignedOTA: 이 모델은 단순화된 제로 파라미터 헤드와 개선된 레이블 할당 전략(AlignedOTA)을 사용하여 감지 정확도를 향상시킵니다.
- 지식 증류: DAMO-YOLO는 증류를 활용하여 소형 모델의 성능을 더욱 향상시킵니다.
강점과 약점
강점:
- 높은 성능: DAMO-YOLO는 경쟁력 있는 정확도와 속도를 달성하여 객체 감지 분야에서 강력한 경쟁자가 됩니다.
- 혁신적인 기술: NAS 및 고급 레이블 할당 전략과 같은 최첨단 연구 개념을 통합합니다.
약점:
- 더 높은 복잡성: 모델의 아키텍처 및 훈련 파이프라인은 YOLOv10에 비해 더 복잡하여 사용자에게 더 가파른 학습 곡선을 만들 수 있습니다.
- 생태계 제한 사항: DAMO-YOLO는 주로 MMDetection 툴박스 내에서 사용할 수 있습니다. 이는 해당 생태계에 익숙하지 않고 Ultralytics에서 제공하는 것과 같이 더 통합되고 사용자 친화적인 솔루션을 선호하는 개발자에게는 장벽이 될 수 있습니다.
- 커뮤니티 및 지원: 중요한 기여이지만 Ultralytics 생태계 내의 모델과 동일한 수준의 활발한 커뮤니티 지원, 빈번한 업데이트 및 광범위한 리소스를 갖지 못할 수 있습니다.
이상적인 사용 사례
DAMO-YOLO는 다음과 같은 연구원 및 개발자에게 적합합니다.
- 새로운 아키텍처 우선: NAS 기반 백본과 같은 최신 연구 동향을 탐구하는 데 관심이 있는 사람들을 위한 것입니다.
- MMDetection 내에서 작업: MMDetection 프레임워크에 이미 익숙한 사용자는 DAMO-YOLO를 워크플로에 통합할 수 있습니다.
- 높은 정확도 요구: 마지막 정확도까지 확보하는 것이 중요하고 추가된 복잡성을 관리할 수 있는 시나리오에서.
성능 비교: YOLOv10 vs. DAMO-YOLO
다음 표는 COCO 데이터 세트에서 다양한 YOLOv10 및 DAMO-YOLO 모델 크기의 성능을 비교합니다. YOLOv10은 일관되게 우수한 성능을 보여주며, 더 낮은 지연 시간과 더 적은 파라미터로 더 높은 정확도를 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
데이터에서 알 수 있듯이 YOLOv10 모델은 DAMO-YOLO보다 지속적으로 더 나은 성능을 보입니다. 예를 들어 YOLOv10-S는 DAMO-YOLO-S보다 더 높은 mAP(46.7 대 46.0)를 달성하는 동시에 훨씬 빠르고(2.66ms 대 3.45ms) 파라미터 수가 절반 미만(7.2M 대 16.3M)입니다. 이러한 추세는 모든 모델 크기에서 유지되며 YOLOv10-X는 54.4의 가장 높은 mAP에 도달합니다.
결론
YOLOv10과 DAMO-YOLO는 모두 인상적인 객체 감지 모델이지만, 서로 다른 요구 사항을 충족합니다. DAMO-YOLO는 혁신적인 아키텍처 아이디어를 보여주는 강력한 연구 모델입니다.
하지만 대다수의 개발자, 연구원 및 기업에게는 YOLOv10이(가) 명확한 선택입니다. 뛰어난 성능과 NMS-free 디자인의 결합으로 실제 배포에서 더 빠르고 효율적입니다. 더욱 중요한 것은 Ultralytics 생태계에 원활하게 통합되어 광범위한 문서, 활발한 커뮤니티 지원 및 전체 MLOps 라이프사이클을 간소화하는 Ultralytics HUB와 같은 도구 모음을 통해 탁월한 사용자 경험을 제공한다는 것입니다.
다른 최첨단 옵션을 찾고 있다면, 다양한 비전 작업에서 다재다능함을 제공하는 Ultralytics YOLOv8을 살펴보거나 프로젝트에 가장 적합한 모델을 찾기 위해 다른 모델 비교를 확인하는 것이 좋습니다.