YOLOv5 vs. DAMO-YOLO: 상세 기술 비교
정확도, 속도 및 배포 용이성의 필요성 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 효율성과 사용자 친화성으로 알려진 업계 표준인 Ultralytics YOLOv5와 감지 정확도의 경계를 넓히는 Alibaba Group의 모델인 DAMO-YOLO라는 두 가지 강력한 모델 간의 자세한 기술 비교를 제공합니다.
두 모델 모두 상당한 기여를 했지만, YOLOv5는 성숙하고 잘 관리된 생태계와 뛰어난 성능 균형으로 돋보이며 광범위한 실제 애플리케이션에 매우 실용적인 선택입니다. 다음 컴퓨터 비전 프로젝트에 대한 정보를 바탕으로 결정을 내릴 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보겠습니다.
Ultralytics YOLOv5: 확고한 산업 표준
작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Docs: https://docs.ultralytics.com/models/yolov5/
2020년에 출시된 Ultralytics YOLOv5는 세계에서 가장 인기 있는 객체 감지 모델 중 하나가 되었습니다. 그 성공은 뛰어난 속도, 신뢰할 수 있는 정확성 및 탁월한 사용 편의성을 기반으로 합니다. PyTorch에서 개발된 YOLOv5는 빠른 학습, 강력한 추론 및 간단한 배포를 위해 설계되어 개발자와 연구원 모두에게 적합한 솔루션입니다.
아키텍처 및 주요 기능
YOLOv5의 아키텍처는 CSPDarknet53 백본, 특징 통합을 위한 PANet 넥, 앵커 기반 감지 헤드로 구성됩니다. 이 디자인은 매우 효율적이고 확장 가능하며 다양한 계산 예산 및 성능 요구 사항에 적합하도록 다양한 크기(n, s, m, l, x)로 제공됩니다. 이 모델의 핵심 강점은 아키텍처뿐만 아니라 Ultralytics에서 구축한 주변 에코시스템에도 있습니다.
강점
- 탁월한 속도 및 효율성: YOLOv5는 빠른 추론에 매우 최적화되어 있어 강력한 GPU에서 리소스가 제한된 에지 장치에 이르기까지 광범위한 하드웨어에서 실시간 애플리케이션에 이상적입니다.
- 사용 편의성: 간소화된 사용자 경험으로 유명한 YOLOv5는 간단한 Python 및 CLI 인터페이스, 광범위한 문서 및 빠른 설정 프로세스를 제공합니다.
- 잘 관리되는 에코시스템: YOLOv5는 활발한 개발, 대규모의 유용한 커뮤니티, 잦은 업데이트, 그리고 노코드 학습 및 배포를 위한 Ultralytics HUB와 같은 강력한 도구를 포함하는 포괄적인 Ultralytics 에코시스템에 의해 지원됩니다.
- 성능 균형: 추론 속도와 감지 정확도 사이에서 뛰어난 균형을 유지하므로 다양한 실제 배포 시나리오에 실용적이고 안정적인 선택입니다.
- 다재다능함: YOLOv5는 객체 감지 외에도 인스턴스 분할 및 이미지 분류를 지원하여 다양한 비전 작업을 위한 유연한 솔루션을 제공합니다.
- 학습 효율성: YOLOv5는 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치를 특징으로 하며 일반적으로 많은 경쟁 아키텍처보다 더 적은 메모리가 필요하므로 개발 주기가 더 빨라집니다.
약점
- 정확도: 당시에는 매우 정확했지만, DAMO-YOLO와 같은 최신 모델은 특히 더 큰 모델 변형에서 COCO와 같은 벤치마크에서 더 높은 mAP 점수를 달성할 수 있습니다.
- Anchor-Based: 사전 정의된 앵커 박스에 대한 의존성으로 인해 앵커 프리 방식에 비해 기존에 없던 객체 모양을 가진 데이터 세트에 대해 더 많은 튜닝이 필요한 경우가 있습니다.
사용 사례
YOLOv5는 다음을 포함한 실시간 객체 감지 시나리오에서 뛰어납니다.
- 보안 시스템: 도난 방지 및 이상 감지와 같은 애플리케이션을 위한 실시간 모니터링.
- 로보틱스: 로봇이 실시간으로 환경을 인식하고 상호 작용할 수 있도록 지원하며, 이는 자율 내비게이션 및 조작에 매우 중요합니다.
- 산업 자동화: 제조 공정에서 품질 관리 및 결함 감지, 재활용 효율성 및 생산 라인 모니터링 강화.
- Edge AI 배포: 장치 내 처리를 위해 Raspberry Pi 및 NVIDIA Jetson과 같이 리소스가 제한된 장치에서 객체 감지를 효율적으로 실행합니다.
DAMO-YOLO: 정확도 중심의 검출
작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
기관: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Documentation: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO는 Alibaba Group에서 개발한 객체 감지 모델입니다. 2022년 말에 소개되었으며, 아키텍처에 몇 가지 새로운 기술을 통합하여 높은 정확도와 효율적인 추론 간의 균형을 맞추는 데 중점을 둡니다.
아키텍처 및 주요 기능
DAMO-YOLO는 몇 가지 혁신적인 구성 요소를 도입했습니다.
- NAS 백본: NAS(Neural Architecture Search)를 사용하여 백본 네트워크를 최적화합니다.
- Efficient RepGFPN: 개선된 특징 융합을 위해 Reparameterized Gradient Feature Pyramid Network를 사용합니다.
- ZeroHead: 계산 오버헤드를 최소화하도록 설계된 분리된 감지 헤드입니다.
- AlignedOTA: 학습 중 더 나은 레이블 할당을 위해 Aligned Optimal Transport Assignment 전략을 제공합니다.
- Distillation 향상: 성능을 향상시키기 위해 지식 증류 기술을 통합합니다.
강점
- 높은 정확도: 강력한 mAP 점수를 달성하여 뛰어난 감지 정확도를 나타내며, 특히 더 큰 모델에서 더욱 그렇습니다.
- 혁신적인 기술: 표준 아키텍처를 넘어 성능 향상을 목표로 하는 AlignedOTA 및 RepGFPN과 같은 새로운 방법을 통합합니다.
약점
- 통합 복잡성: 기존 워크플로우에 통합하는 데 더 많은 노력이 필요할 수 있으며, 특히 Ultralytics 에코시스템 내에서 제공되는 간소화된 경험과 비교할 때 더욱 그렇습니다.
- Ecosystem Support: 문서화 및 커뮤니티 지원은 잘 구축되어 활발하게 유지 관리되는 YOLOv5에 비해 부족할 수 있습니다.
- 작업 다양성: 주로 객체 탐지에 중점을 두며, 이후 Ultralytics 모델에서 제공하는 분할 또는 분류와 같은 다른 작업에 대한 기본 지원이 부족할 수 있습니다.
사용 사례
DAMO-YOLO는 높은 감지 정확도가 가장 중요한 애플리케이션에 적합합니다.
- 고정밀 애플리케이션: 상세 이미지 분석, 의료 영상 및 과학 연구에 적합합니다.
- 복잡한 시나리오: 가려진 객체가 있거나 상세한 장면 이해가 필요한 환경.
- 연구 개발: 고급 객체 감지 아키텍처를 탐색합니다.
성능 분석: 속도 vs. 정확도
다음 표는 COCO val2017 데이터 세트에서 YOLOv5와 DAMO-YOLO 모델의 성능을 비교합니다. YOLOv5는 뛰어난 균형을 보여주며, YOLOv5n은 CPU와 GPU 모두에서 탁월한 속도를 제공하는 반면, 더 큰 모델은 매우 경쟁력이 있습니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
DAMO-YOLO 모델이 높은 mAP를 달성하지만, YOLOv5는 특히 실시간 애플리케이션에서 더욱 실용적인 속도-정확도 절충안을 제공합니다. YOLOv5의 CPU 벤치마크 가용성은 GPU를 사용할 수 없는 더 광범위한 하드웨어 플랫폼에 배포하기에 적합함을 더욱 강조합니다.
결론: 어떤 모델을 선택해야 할까요?
YOLOv5와 DAMO-YOLO는 모두 강력한 객체 감지 모델이지만, 서로 다른 우선순위를 충족합니다.
-
DAMO-YOLO는 특히 복잡한 장면에서 최첨단 정확도를 달성하는 데 중점을 둔 연구원 및 개발자에게 탁월한 선택입니다. 혁신적인 아키텍처는 정밀도가 최우선인 학문적 탐구 및 애플리케이션을 위한 강력한 기반을 제공합니다.
-
그러나 Ultralytics YOLOv5는 대다수의 실용적인 실제 애플리케이션에서 여전히 최고의 선택입니다. 속도와 정확성의 놀라운 균형은 사용 편의성, 학습 효율성, 그리고 다양성과 결합되어 매우 효과적입니다. 핵심적인 차별화 요소는 잘 관리되는 Ultralytics 생태계로, 강력한 지원, 광범위한 문서, 그리고 학습에서 배포까지 원활한 사용자 경험을 제공합니다. 이는 개발 시간과 복잡성을 획기적으로 줄입니다.
안정적이고 고성능이며 통합하기 쉬운 모델을 찾는 개발자에게 YOLOv5는 명확한 승자입니다. 더욱 발전된 기능으로 이 기반을 구축하려는 사람들을 위해 YOLOv8 및 YOLO11과 같은 최신 Ultralytics 모델은 동일한 사용자 친화적인 원칙을 유지하면서 정확성과 다재다능성을 더욱 향상시킵니다.
이러한 모델이 해당 분야의 다른 모델과 어떻게 비교되는지 다른 비교를 살펴보세요.