YOLOv8 vs DAMO-YOLO: 기술 비교
적합한 객체 감지 모델을 선택하려면 정확도, 속도 및 사용 편의성 간의 균형을 고려해야 합니다. 이 페이지에서는 두 가지 강력한 모델인 Ultralytics의 최첨단 모델인 Ultralytics YOLOv8과 Alibaba Group의 고성능 모델인 DAMO-YOLO 간의 자세한 기술 비교를 제공합니다. 두 모델 모두 뛰어난 성능을 제공하지만 서로 다른 설계 철학을 기반으로 구축되었으며 뚜렷한 개발 요구 사항을 충족합니다. 정보에 입각한 결정을 내릴 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 살펴보겠습니다.
Ultralytics YOLOv8
작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8은 이전 YOLO 버전의 성공을 기반으로 하는 최첨단 모델입니다. 빠르고 정확하며 사용하기 쉽도록 설계되어 광범위한 객체 감지 및 비전 AI 작업에 이상적인 선택입니다. YOLOv8은 단순한 모델이 아니라 훈련 및 검증에서 실제 애플리케이션 배포에 이르기까지 AI 모델 개발의 전체 수명 주기를 지원하는 포괄적인 프레임워크입니다.
주요 기능 및 강점
-
고급 아키텍처: YOLOv8은 앵커 프리, 분리된 헤드 디자인을 도입하여 정확도를 향상시키고 일부 경우 NMS(Non-Maximum Suppression)의 필요성을 없애 사후 처리를 가속화합니다. 개선된 CSPDarknet 백본과 향상된 기능 융합을 위한 새로운 C2f 넥 모듈을 사용합니다.
-
탁월한 다재다능함: YOLOv8의 주요 장점은 단일 통합 프레임워크 내에서 여러 비전 작업을 기본적으로 지원한다는 것입니다. 객체 감지, 인스턴스 분할, 이미지 분류, 자세 추정 및 OBB(Oriented Object Detection)를 원활하게 처리합니다. 이러한 다재다능함 덕분에 복잡한 컴퓨터 비전 프로젝트를 위한 원스톱 솔루션이 됩니다.
-
사용 편의성: Ultralytics는 개발자 경험을 우선시합니다. YOLOv8은 광범위한 documentation 및 튜토리얼을 기반으로 하는 간단하고 직관적인 Python API와 강력한 CLI를 제공합니다. 이를 통해 초보자와 전문가 모두 모델을 매우 쉽게 학습, 검증 및 배포할 수 있습니다.
-
잘 관리되는 에코시스템: YOLOv8은 활발한 개발, 잦은 업데이트, 그리고 강력한 커뮤니티 지원을 갖춘 번성하는 오픈 소스 에코시스템의 일부입니다. 이는 노코드 학습 및 배포를 위한 Ultralytics HUB, 그리고 Weights & Biases 및 Comet와 같은 수많은 MLOps 플랫폼과 통합됩니다.
-
성능 및 효율성: YOLOv8은 다양한 모델 크기(Nano에서 Extra-Large까지)에서 속도와 정확도 간의 뛰어난 균형을 제공합니다. CPU 및 GPU 추론 모두에 대해 고도로 최적화되어 에지 장치에서 클라우드 서버에 이르기까지 다양한 하드웨어에서 효율적인 배포를 보장합니다. 또한 메모리 효율성을 위해 설계되어 다른 많은 아키텍처에 비해 훈련에 더 적은 CUDA 메모리가 필요합니다.
약점
- 원-스테이지 검출기이므로 대부분의 범용 시나리오에서 매우 우수한 성능을 보이지만 일부 특수 2단계 검출기에 비해 매우 작거나 심하게 가려진 객체를 탐지하는 데 어려움을 겪을 수 있습니다.
DAMO-YOLO
작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
기관: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
DAMO-YOLO는 Alibaba Group에서 개발한 빠르고 정확한 객체 감지 모델입니다. YOLO 스타일 감지기의 성능을 향상시키기 위해 여러 새로운 기술을 도입했습니다. "DAMO"라는 이름은 "Discovery, Adventure, Momentum, and Outlook"의 약자로, 프로젝트의 연구 중심적인 성격을 반영합니다.
주요 기능 및 강점
- NAS(Neural Architecture Search): DAMO-YOLO는 NAS를 활용하여 최적의 백본 아키텍처(MAE-NAS)를 찾아 정확도와 지연 시간 사이의 더 나은 균형을 달성하는 데 도움을 줍니다.
- 고급 Neck 디자인: 백본의 여러 수준에서 특징 융합을 향상시키도록 설계된 효율적인 RepGFPN(Generalized Feature Pyramid Network) neck을 통합합니다.
- ZeroHead: DAMO-YOLO는 높은 성능을 유지하면서 계산 오버헤드를 줄이기 위해 가벼운 결합 헤드를 사용하는 "ZeroHead" 방식을 제안합니다.
- AlignedOTA 레이블 할당: AlignedOTA라는 동적 레이블 할당 전략을 사용하여 훈련 중에 분류 및 회귀 작업을 정렬하여 모델이 더 잘 학습할 수 있도록 돕습니다.
- 높은 GPU 성능: 이 모델은 GPU 추론에 매우 최적화되어 공식 벤치마크에서 볼 수 있듯이 고급 하드웨어에서 매우 낮은 지연 시간을 제공합니다.
약점
- 복잡성: NAS 및 사용자 정의 모듈(RepGFPN, ZeroHead)과 같은 고급 기술을 사용하면 모델의 내부 작동 방식을 사용자 정의하거나 이해해야 하는 개발자에게 아키텍처가 더 복잡하고 덜 직관적으로 느껴질 수 있습니다.
- 제한적인 다양성: DAMO-YOLO는 주로 객체 감지를 위해 설계되었습니다. Ultralytics YOLOv8 프레임워크에서 표준인 분할, 분류 및 포즈 추정에 대한 기본 멀티태스크 지원이 부족합니다.
- 생태계 및 지원: 오픈 소스 프로젝트이긴 하지만 Ultralytics만큼 생태계가 포괄적이거나 잘 유지 관리되지는 않습니다. 설명서가 부족할 수 있고 커뮤니티 지원이 덜 광범위하여 개발자가 채택하고 문제를 해결하기가 더 어려울 수 있습니다.
- CPU 성능: 이 모델은 GPU에 매우 최적화되어 있습니다. CPU 성능에 대한 정보 및 벤치마크를 쉽게 구할 수 없어 GPU가 아닌 하드웨어에 배포하는 데 제한이 될 수 있습니다.
성능 분석: YOLOv8 vs. DAMO-YOLO
성능을 비교할 때 다양한 하드웨어에서 정확도(mAP)와 추론 속도를 모두 살펴보는 것이 중요합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
표에서 다음과 같은 몇 가지 결론을 내릴 수 있습니다.
- 정확도: YOLOv8 모델은 유사한 규모에서 DAMO-YOLO 모델보다 일관되게 성능이 뛰어납니다. 예를 들어 YOLOv8m은 50.2 mAP를 달성하여 DAMO-YOLOm의 49.2 mAP를 능가합니다. 더 큰 YOLOv8l 및 YOLOv8x 모델은 이러한 우위를 크게 확장합니다.
- 속도: DAMO-YOLO가 매우 경쟁력 있는 GPU 속도를 보여주지만, YOLOv8n은 GPU에서 가장 빠른 모델입니다. 중요한 점은 Ultralytics가 GPU 리소스를 사용할 수 없는 많은 실제 애플리케이션에 필수적인 투명한 CPU 벤치마크를 제공한다는 것입니다. YOLOv8은 CPU에서 훌륭하고 잘 문서화된 성능을 보여줍니다.
- 효율성: YOLOv8 모델은 일반적으로 주어진 정확도에 대해 파라미터와 FLOP의 균형이 더 좋습니다. 예를 들어 YOLOv8s는 11.2M 파라미터만으로 44.9 mAP를 달성하는 반면, DAMO-YOLOs는 유사한 46.0 mAP에 도달하기 위해 16.3M 파라미터가 필요합니다.
결론
DAMO-YOLO는 NAS와 같은 고급 연구 기술의 힘을 보여주어 GPU 하드웨어에서 높은 성능을 달성하는 인상적인 모델입니다. 원시 GPU 속도가 주요 지표이고 개발 팀이 더 복잡한 아키텍처를 관리할 전문 지식을 갖춘 애플리케이션에 적합합니다.
하지만 대다수의 개발자, 연구원 및 기업에게는 Ultralytics YOLOv8이(가) 명확하고 우수한 선택입니다. 더 높은 정확도, CPU와 GPU 모두에서 뛰어난 성능, 그리고 멀티태스크 지원을 통한 탁월한 다재다능성을 제공하여 전반적으로 더 나은 패키지를 제공합니다.
사용 편의성, 광범위한 문서, 활발한 커뮤니티 지원, 원활한 통합을 포함한 Ultralytics 에코시스템의 주요 이점은 YOLOv8을 강력한 모델일 뿐만 아니라 강력하고 실제적인 컴퓨터 비전 솔루션을 구축하기 위한 실용적이고 생산적인 도구로 만듭니다. 첫 번째 프로젝트를 시작하는 초보자이든 복잡한 시스템을 배포하는 전문가이든 YOLOv8은 더욱 안정적이고 효율적이며 사용자 친화적인 성공 경로를 제공합니다.
다른 모델 살펴보기
다른 모델 비교에 관심이 있다면 다음 페이지에서 YOLOv8이 다른 최첨단 아키텍처와 어떻게 비교되는지 확인해 보세요.