DAMO-YOLO vs YOLOv5: 상세 기술 비교
정확도, 속도 및 구현 용이성 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 Alibaba Group의 정확도 중심 모델인 DAMO-YOLO와 뛰어난 성능과 유용성의 조화로 유명한 업계 표준 모델인 Ultralytics YOLOv5 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보겠습니다.
DAMO-YOLO: 정확도 중심의 검출
저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
소속: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
문서: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO는 Alibaba Group에서 개발한 객체 감지 모델입니다. 2022년 말에 도입되었으며 아키텍처에 여러 새로운 기술을 통합하여 높은 정확도와 효율적인 추론 간의 균형을 달성하는 데 중점을 둡니다.
아키텍처 및 주요 기능
DAMO-YOLO는 감지 정확도의 한계를 뛰어넘기 위해 설계된 여러 혁신적인 구성 요소를 도입했습니다.
- NAS 백본: NAS(Neural Architecture Search)를 활용하여 객체 감지에 맞게 조정된 고효율 백본 네트워크를 찾아 구현합니다.
- Efficient RepGFPN: 이 모델은 다양한 스케일에서 개선된 특징 융합을 위한 고급 Neck 모듈인 Reparameterized Gradient Feature Pyramid Network를 사용합니다.
- ZeroHead: 높은 성능을 유지하면서 계산 오버헤드를 최소화하도록 설계된 분리된 감지 헤드가 특징입니다.
- AlignedOTA: 이 새로운 레이블 할당 전략인 Aligned Optimal Transport Assignment는 학습 중에 예측과 Ground-Truth 레이블 간의 더 나은 정렬을 보장하여 정확도를 향상시킵니다.
- Distillation 향상: 이 모델은 지식 증류를 활용하여 더 크고 강력한 교사 모델에서 더 작은 학생 모델로 지식을 전송하여 성능을 향상시킵니다.
강점
- 높은 정확도: DAMO-YOLO는 강력한 mAP 점수를 달성하여 뛰어난 감지 정확도를 나타내며, 특히 더 큰 모델에서 더욱 그렇습니다.
- 혁신적인 기술: AlignedOTA 및 RepGFPN과 같은 새로운 방법의 통합을 통해 보다 표준적인 아키텍처를 넘어 성능을 향상시킬 수 있습니다.
약점
- 통합 복잡성: DAMO-YOLO를 기존 워크플로우에 통합하는 것은 특히 Ultralytics 에코시스템 내에서 제공되는 간소화된 경험과 비교할 때 더 복잡할 수 있습니다.
- Ecosystem Support: 문서화 및 커뮤니티 지원이 제공되기는 하지만, 잘 구축되어 활발하게 유지 관리되는 YOLOv5만큼 광범위하지 않을 수 있습니다.
- Task Versatility: DAMO-YOLO는 주로 객체 탐지에 중점을 두며 Ultralytics 모델에서 볼 수 있는 세분화 또는 분류와 같은 다른 작업에 대한 기본 지원이 부족할 수 있습니다.
사용 사례
DAMO-YOLO는 높은 감지 정확도가 주요 요구 사항인 애플리케이션에 적합합니다.
- 고정밀 애플리케이션: 의료 영상 및 과학 연구와 같은 상세 이미지 분석에 적합합니다.
- 복잡한 시나리오: 객체가 심하게 가려진 환경 또는 장면에 대한 깊은 이해가 필요한 환경.
- 연구 및 개발: 고급 객체 감지 아키텍처 및 기술을 탐구하는 연구자에게 유용한 도구입니다.
Ultralytics YOLOv5: 확고한 산업 표준
작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentation: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5는 출시 후 빠른 속도, 정확성 및 뛰어난 사용 편의성의 균형으로 업계 표준이 되었습니다. PyTorch에서 완전히 개발된 YOLOv5는 효과적인 특징 집계를 위해 CSPDarknet53 백본과 PANet neck을 결합한 강력한 아키텍처를 특징으로 합니다. 다양한 모델 크기(n, s, m, l, x)를 통해 개발자는 특정 컴퓨팅 및 성능 요구 사항에 맞는 완벽한 균형을 선택할 수 있습니다.
강점
- 탁월한 속도 및 효율성: YOLOv5는 빠른 추론에 매우 최적화되어 있어 강력한 클라우드 GPU에서 리소스가 제한된 에지 장치에 이르기까지 광범위한 하드웨어에서 실시간 애플리케이션을 위한 최고의 선택입니다.
- 사용 편의성: YOLOv5의 주요 장점은 간소화된 사용자 경험입니다. 간단한 Python 및 CLI 인터페이스, 포괄적인 문서 및 간단한 설정 프로세스를 제공합니다.
- 잘 관리되는 에코시스템: YOLOv5는 활발한 개발, 대규모의 유용한 커뮤니티, 잦은 업데이트, 그리고 노코드 학습 및 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 포함하는 강력한 Ultralytics 에코시스템에 의해 지원됩니다.
- 성능 균형: 추론 속도와 감지 정확도 사이에서 뛰어난 균형을 달성하여 다양한 실제 배포 시나리오에 매우 실용적입니다.
- 다재다능함: YOLOv5는 객체 감지 외에도 인스턴스 분할 및 이미지 분류를 지원하여 다목적 솔루션을 제공합니다.
- 학습 효율성: YOLOv5는 효율적인 학습 프로세스를 제공하며, 즉시 사용 가능한 사전 학습된 가중치를 제공하고, 일반적으로 많은 경쟁 아키텍처보다 더 낮은 메모리를 요구합니다.
약점
- 정확도: 매우 정확했지만, 이후 최신 모델이 COCO와 같은 표준 벤치마크에서 YOLOv5의 mAP 점수를 능가했습니다.
- Anchor-Based: 사전 정의된 앵커 박스에 대한 의존성으로 인해 앵커 프리 방식에 비해 기존에 없던 객체 종횡비를 가진 데이터 세트에 대해 추가 튜닝이 필요할 수 있습니다.
사용 사례
YOLOv5는 속도, 효율성 및 간편한 배포가 중요한 시나리오에서 뛰어난 성능을 발휘합니다.
- 보안 시스템: 도난 방지 및 이상 감지와 같은 애플리케이션을 위한 실시간 모니터링.
- 로보틱스: 로봇이 실시간으로 환경을 인식하고 상호 작용할 수 있도록 지원하며, 이는 자율 내비게이션 및 조작에 매우 중요합니다.
- 산업 자동화: 제조 공정에서 품질 관리 및 결함 감지, 재활용 효율성 및 생산 라인 모니터링 강화.
- Edge AI 배포: 장치 내 처리를 위해 Raspberry Pi 및 NVIDIA Jetson과 같이 리소스가 제한된 장치에서 객체 감지를 효율적으로 실행합니다.
성능 비교
DAMO-YOLO와 YOLOv5를 비교할 때 정확도와 속도 간의 명확한 절충점이 나타납니다. DAMO-YOLO 모델은 일반적으로 더 높은 mAP 점수를 달성하여 순수한 감지 정확도에서 강점을 입증합니다. 그러나 YOLOv5 모델, 특히 더 작은 변형은 특히 CPU 하드웨어에서 훨씬 빠른 추론 속도를 제공합니다. 따라서 YOLOv5는 낮은 대기 시간이 필수적인 실시간 애플리케이션에 더 실용적인 선택입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
결론
DAMO-YOLO와 Ultralytics YOLOv5는 모두 강력한 객체 탐지 모델이지만, 서로 다른 우선순위를 충족합니다. DAMO-YOLO는 가능한 최고의 정확도를 달성하는 것이 주요 목표이고 개발자가 더 복잡한 통합을 처리할 의향이 있는 애플리케이션에 탁월한 선택입니다.
그러나 대다수의 개발자와 실제 애플리케이션에서 Ultralytics YOLOv5가 더욱 강력하고 실용적인 솔루션을 제공합니다. 속도와 정확도의 뛰어난 균형과 타의 추종을 불허하는 사용 편의성이 결합되어 접근성이 매우 뛰어납니다. 잘 관리되는 생태계는 강력한 문서, 활발한 커뮤니티 지원 및 Ultralytics HUB와 같은 강력한 도구를 제공하여 상당한 이점을 제공합니다. YOLOv5의 학습 효율성과 여러 비전 작업에서 다재다능함은 신속한 프로토타입 제작에서 생산 배포에 이르기까지 프로젝트에 매우 효율적이고 개발자 친화적인 선택입니다.
최신 기술 발전에 관심이 있다면 YOLOv8 및 YOLO11과 같은 최신 Ultralytics 모델은 YOLOv5의 강점을 기반으로 더욱 향상된 성능과 더 많은 기능을 제공합니다.
기타 모델 비교
자세한 탐색을 위해 DAMO-YOLO, YOLOv5 및 기타 관련 모델과 관련된 다음 비교를 고려하십시오.
- DAMO-YOLO vs YOLOv8
- YOLOv5 vs YOLOv7
- YOLOv5 vs YOLOv8
- YOLOv5 vs YOLOv9
- RT-DETR vs YOLOv5
- EfficientDet 대 YOLOv5
- YOLOv10 및 YOLO11과 같은 최신 모델을 살펴보세요.