콘텐츠로 건너뛰기

DAMO-YOLO vs. YOLOv8: 기술 비교

적합한 객체 감지 모델을 선택하는 것은 정확도, 속도 및 구현 용이성의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 Alibaba Group의 고성능 모델인 DAMO-YOLO와 다재다능성과 강력한 생태계로 유명한 최첨단 모델인 Ultralytics YOLOv8 간의 자세한 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택할 수 있도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보겠습니다.

DAMO-YOLO: Alibaba의 빠르고 정확한 방법

작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
기관: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Docs: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

아키텍처 및 주요 기능

DAMO-YOLO는 Alibaba의 연구에서 탄생한 강력한 객체 감지기로, 속도-정확도 절충의 한계를 뛰어넘기 위해 여러 혁신적인 기술을 도입했습니다. 아키텍처는 NAS(Neural Architecture Search)와 고급 설계 원칙을 결합한 포괄적인 접근 방식의 결과입니다.

  • NAS 기반 백본: DAMO-YOLO는 NAS를 통해 생성된 백본을 사용하여 객체 감지에 맞게 조정된 고효율 특징 추출 구조를 찾을 수 있습니다.
  • Efficient RepGFPN Neck: 최소한의 계산 오버헤드로 특징 융합을 개선하기 위해 재파라미터화 기술로 향상된 새로운 Neck 구조인 GFPN(Generalized Feature Pyramid Network)을 도입했습니다.
  • ZeroHead: 이 모델은 높은 성능을 유지하면서 계산 복잡성을 줄이는 ZeroHead라는 가벼운 앵커 프리(anchor-free) 감지 헤드를 활용합니다.
  • AlignedOTA Label Assignment: AlignedOTA라는 고급 레이블 할당 전략을 사용하여 긍정적 샘플을 적절한 Ground-Truth 객체에 더 잘 정렬함으로써 학습 안정성과 모델 정확도를 향상시킵니다.
  • 지식 증류: DAMO-YOLO 제품군의 더 큰 모델은 지식 증류를 통해 성능이 더욱 향상되었습니다.

DAMO-YOLO에 대해 자세히 알아보세요.

강점

  • GPU에서 높은 정확도와 속도: DAMO-YOLO는 GPU 하드웨어에 매우 최적화되어 mAP와 추론 속도 간의 탁월한 균형을 제공하므로 GPU 성능이 중요한 애플리케이션에 강력한 경쟁자가 됩니다.
  • 혁신적인 아키텍처: NAS의 사용과 RepGFPN 및 ZeroHead와 같은 사용자 정의 구성 요소는 고급 연구를 보여주고 매우 효율적인 아키텍처를 제공합니다.

약점

  • 제한된 생태계: Ultralytics YOLO와 비교했을 때 DAMO-YOLO 주변의 생태계는 덜 개발되었습니다. 엔드 투 엔드 워크플로우를 단순화하는 광범위한 문서, 튜토리얼 및 Ultralytics HUB와 같은 통합 도구가 부족합니다.
  • Task Specificity: DAMO-YOLO는 주로 객체 탐지를 위해 설계되었습니다. 동일한 프레임워크 내에서 세분화, 포즈 추정 또는 분류와 같은 다른 비전 작업에 대한 기본 지원은 제공하지 않습니다.
  • 커뮤니티 및 지원: 가치 있는 오픈 소스 기여이지만 Ultralytics YOLO 시리즈와 동일한 수준의 활발한 커뮤니티 지원 또는 빈번한 업데이트를 제공하지 않습니다.

Ultralytics YOLOv8: 다재다능성 및 성능

작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/

아키텍처 및 주요 기능

Ultralytics YOLOv8은 이전 YOLO 버전의 성공을 기반으로 구축된 최첨단 모델입니다. 빠르고 정확하며 사용하기 매우 쉽도록 설계되었으며, 다양한 컴퓨터 비전 작업을 위한 통합 프레임워크를 제공합니다.

  • 개선된 CSPDarknet 백본: YOLOv8은 고급 CSPDarknet 백본을 사용하여 더 나은 성능을 위해 특징 추출 프로세스를 최적화합니다.
  • C2f Neck: YOLOv5의 C3 모듈을 대체하는 C2f 모듈을 Neck에 통합하여 더욱 효율적인 특징 융합을 가능하게 합니다.
  • Anchor-Free Decoupled Head: DAMO-YOLO와 마찬가지로 YOLOv8은 앵커 프리를 채택하여 학습 중 매칭 프로세스를 단순화합니다. 분리된 헤드는 분류 및 회귀 작업을 분리하여 전체 모델 정확도를 향상시킵니다.

YOLOv8에 대해 자세히 알아보세요

강점

  • 사용 편의성: YOLOv8은 사용자 친화적인 디자인으로 유명합니다. 간소화된 Python APICLI를 통해 개발자는 몇 줄의 코드만으로 모델을 학습, 검증 및 배포할 수 있습니다.
  • 잘 관리되는 에코시스템: 광범위한 문서, 활발한 개발, 강력한 커뮤니티 지원, 노코드 학습을 위한 Ultralytics HUBMLOps와 같은 도구와의 원활한 통합을 포함하는 포괄적인 Ultralytics 에코시스템에 의해 지원됩니다.
  • 성능 균형: YOLOv8은 엣지 장치에서 강력한 클라우드 GPU에 이르기까지 다양한 하드웨어에서 속도와 정확도 간의 뛰어난 균형을 제공합니다.
  • 다재다능함: YOLOv8의 주요 장점은 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정OBB(oriented object detection)와 같은 여러 작업을 기본적으로 지원한다는 것입니다. 따라서 복잡한 비전 프로젝트를 위한 원스톱 솔루션이 됩니다.
  • 학습 및 메모리 효율성: YOLOv8 모델은 효율적인 학습을 위해 설계되었으며, 종종 다른 대안보다 적은 CUDA 메모리를 필요로 합니다. COCO와 같은 데이터 세트에서 사전 학습된 가중치를 사용할 수 있어 사용자 정의 모델 개발이 가속화됩니다.

약점

  • 대형 모델의 리소스 요구 사항: 가장 큰 모델인 YOLOv8x는 가장 높은 정확도를 제공하지만 상당한 컴퓨팅 리소스가 필요하며, 이는 최고 성능 모델의 일반적인 절충점입니다.

성능 분석: 속도 및 정확도

COCO 데이터 세트에서 직접 비교하면 DAMO-YOLO와 YOLOv8 간의 경쟁 환경을 알 수 있습니다. 다음 표는 성능 지표를 요약한 것입니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

표에서 다음과 같은 몇 가지 결론을 내릴 수 있습니다.

  • 정확도: YOLOv8x는 가장 높은 mAP인 53.9%를 달성하여 모든 DAMO-YOLO 변형보다 성능이 뛰어납니다. 중간 크기에서 YOLOv8m(50.2 mAP)은 DAMO-YOLOm(49.2 mAP)보다 정확합니다. 그러나 DAMO-YOLOs(46.0 mAP)는 YOLOv8s(44.9 mAP)보다 약간 우위를 보입니다.
  • GPU 속도: 두 모델 제품군 모두 GPU에서 매우 빠릅니다. YOLOv8n이 1.47ms로 전체적으로 가장 빠릅니다. DAMO-YOLOt은 2.32ms로 인상적인 속도를 보여주는데, 이는 YOLOv8s보다 빠릅니다.
  • CPU 속도: YOLOv8은 많은 에지 AI 애플리케이션에 중요한 요소인 CPU 추론에 대한 명확한 벤치마크를 제공합니다. DAMO-YOLO의 공식 CPU 벤치마크가 없으면 CPU 바운드 배포에 대한 평가가 어렵지만 YOLOv8은 이러한 시나리오에서 입증된 성능을 제공합니다.
  • 효율성: YOLOv8 모델은 일반적으로 파라미터 효율성이 더 높습니다. 예를 들어 YOLOv8s는 DAMO-YOLOs보다 파라미터(11.2M vs. 16.3M)와 FLOP(28.6B vs. 37.8B)이 더 적으면서도 비슷한 정확도를 제공합니다.

학습 방법론 및 사용성

DAMO-YOLO의 훈련 프로세스는 AlignedOTA 및 지식 증류와 같은 고급 기술을 활용하여 높은 성능을 달성할 수 있지만 구성 및 조정에 더 깊은 전문 지식이 필요할 수 있습니다.

반면, Ultralytics 프레임워크는 원활한 사용자 경험을 우선시합니다. YOLOv8 모델 학습은 CLI 또는 python SDK를 사용하든 간단합니다. 이 프레임워크는 복잡성을 추상화하여 사용자가 데이터 및 애플리케이션 목표에 집중할 수 있도록 합니다. 효율적인 학습 과정은 하이퍼파라미터 튜닝과 같은 주제에 대한 광범위한 가이드와 즉시 사용 가능한 사전 학습된 가중치와 결합되어 YOLOv8을 초보자와 전문가 모두가 접근할 수 있도록 합니다.

결론: 어떤 모델을 선택해야 할까요?

DAMO-YOLO와 YOLOv8은 모두 최첨단 기술을 발전시키는 뛰어난 객체 탐지 모델입니다.

DAMO-YOLO는 원시 GPU 성능을 우선시하고 보다 연구 중심 프레임워크 내에서 편안하게 작업하는 연구원 및 개발자에게 탁월한 선택입니다. 혁신적인 아키텍처는 특히 GPU 리소스가 풍부한 시나리오에서 인상적인 결과를 제공합니다.

그러나 대다수의 개발자와 애플리케이션에서 Ultralytics YOLOv8이 최고의 선택으로 두드러집니다. 주요 이점은 실제 컴퓨터 비전 솔루션을 구축하기 위한 더욱 실용적이고 강력한 도구로 만들어 줍니다.

  • 탁월한 다재다능함: 하나의 프레임워크에서 detection, segmentation, 포즈, classification 및 추적을 지원하므로 개발 시간을 크게 절약할 수 있습니다.
  • 탁월한 사용 편의성: 간단하고 직관적인 API와 광범위한 문서를 통해 진입 장벽을 낮추고 프로젝트 일정을 가속화합니다.
  • 견고한 생태계: 지속적인 업데이트, 강력한 커뮤니티 지원 및 Ultralytics HUB와 같은 도구는 전체 AI 수명 주기를 위한 포괄적인 환경을 제공합니다.
  • 균형 잡힌 성능: YOLOv8은 CPU와 GPU 모두에서 뛰어난 속도와 정확도의 조화를 제공하여 다양한 배포 대상에 대한 유연성을 보장합니다.

궁극적으로 DAMO-YOLO는 최첨단 연구의 증거이지만 YOLOv8은 보다 완벽하고 사용자 친화적이며 다재다능한 패키지를 제공하므로 강력하고 확장 가능한 AI 솔루션을 구축하는 데 권장되는 선택입니다.

다른 모델 비교 살펴보기

이러한 모델이 다른 주요 아키텍처와 어떻게 비교되는지 궁금하다면 다음 추가 비교를 확인해 보세요.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글