콘텐츠로 건너뛰기

YOLO11 대 DAMO-YOLO: 기술 비교

이 페이지에서는 Ultralytics YOLO11과 DAMO-YOLO라는 두 가지 최첨단 객체 감지 모델 간의 자세한 기술 비교를 제공합니다. 아키텍처 차이점, 성능 지표 및 이상적인 애플리케이션을 분석하여 귀사의 컴퓨터 비전 프로젝트에 대한 정보에 입각한 결정을 내리는 데 도움을 드립니다. 두 모델 모두 고성능 객체 감지를 위해 설계되었지만 뚜렷한 접근 방식을 채택하고 서로 다른 강점을 나타내며, YOLO11은 뛰어난 다재다능함과 실제 배포를 위한 더욱 강력한 에코시스템을 제공합니다.

Ultralytics YOLO11

작성자: Glenn Jocher, Jing Qiu
기관: Ultralytics
날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11은 빠르고 효과적인 객체 탐지 기능으로 유명한 YOLO(You Only Look Once) 시리즈의 최신 기술입니다. YOLO11은 이전 YOLO 반복에서 정밀도와 속도를 모두 향상시키는 것을 목표로 아키텍처 개선을 통해 향상되었습니다. 실시간 성능을 위해 이미지를 단일 패스로 처리하는 단일 단계 탐지 방법을 유지합니다.

YOLO11의 주요 장점은 다재다능함입니다. 주로 감지에 중점을 둔 DAMO-YOLO와 달리 YOLO11은 객체 감지, 인스턴스 분할, 이미지 분류포즈 추정를 지원하는 다중 작업 프레임워크입니다. 따라서 복잡한 컴퓨터 비전 파이프라인을 위한 포괄적인 솔루션입니다.

아키텍처 및 주요 기능

YOLO11은 아키텍처 개선을 통해 모델 크기와 정확도의 균형을 맞추는 데 중점을 둡니다. 여기에는 더 풍부한 특징 포착을 위한 개선된 특징 추출 레이어와 계산 비용을 절감하기 위한 간소화된 네트워크가 포함되어 있어 더 빠르고 파라미터 효율적인 모델을 만들 수 있습니다. 적응형 설계를 통해 NVIDIA Jetson과 같은 에지 장치부터 강력한 클라우드 서버에 이르기까지 광범위한 하드웨어에 배포할 수 있습니다.

결정적으로, YOLO11은 잘 관리되고 있는 Ultralytics 생태계로부터 막대한 이점을 얻습니다. 이는 개발자와 연구자에게 중요한 이점을 제공합니다.

  • 사용 편의성: 간단한 Python API, 명확한 CLI 및 광범위한 문서를 통해 시작하기가 간단합니다.
  • 통합된 워크플로: Ultralytics HUB와의 원활한 통합은 데이터 세트 관리, 훈련 및 배포를 간소화하여 전체 MLOps 라이프사이클을 간소화합니다.
  • 학습 효율성: 효율적인 학습 프로세스, COCO와 같은 데이터 세트에서 즉시 사용 가능한 사전 학습된 가중치, 그리고 일반적으로 다른 복잡한 아키텍처에 비해 더 낮은 메모리 요구 사항을 제공합니다.
  • 활발한 개발: GitHub 및 Discord를 통한 강력한 커뮤니티 지원과 TensorRTOpenVINO와 같은 도구와의 수많은 통합이 있습니다.

YOLO11에 대해 자세히 알아보세요

DAMO-YOLO

작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
기관: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Docs: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO는 속도와 정확도 간의 강력한 균형을 달성하기 위해 여러 가지 새로운 기술을 도입한 Alibaba Group에서 개발한 객체 감지 모델입니다. YOLO 제품군에 속하지만 고급 연구 개념에서 파생된 고유한 아키텍처 구성 요소를 통합합니다.

아키텍처 및 주요 기능

DAMO-YOLO의 아키텍처는 몇 가지 주요 혁신을 기반으로 구축되었습니다.

  • MAE-NAS 백본: NAS(Neural Architecture Search) 방식을 사용하여 최적의 백본 구조를 찾아 효율적인 특징 추출을 가능하게 합니다.
  • 효율적인 RepGFPN Neck: 다양한 스케일에서 특징 융합을 효과적으로 향상시키기 위해 재매개변수화를 통해 일반화된 특징 피라미드 네트워크를 사용합니다.
  • ZeroHead: 이 모델은 최소한의 오버헤드로 분류 및 회귀 작업을 분리하는 가볍고 분리된 헤드를 사용합니다.
  • AlignedOTA 레이블 할당: 정확도를 높이는 데 도움이 되는 훈련 중에 분류 및 회귀 대상을 더 잘 정렬하기 위해 개선된 레이블 할당 전략을 도입했습니다.

이러한 기능 덕분에 DAMO-YOLO는 강력한 검출기이지만, 주요 초점은 여전히 객체 탐지에 있습니다. YOLO11에서 제공하는 분할 또는 자세 추정과 같은 다른 비전 작업에 대한 기본 제공 지원이 부족합니다. 또한 Ultralytics YOLO에 비해 공식 튜토리얼, 통합 및 커뮤니티 규모가 작아 생태계가 덜 포괄적입니다.

DAMO-YOLO에 대해 자세히 알아보세요.

성능 및 벤치마크: 직접 비교

COCO val2017 데이터 세트에서 두 모델의 성능은 주요 차이점을 보여줍니다. YOLO11은 비슷한 모델 크기에서 일관되게 우수한 정확도를 보여줍니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

표에서 다음과 같은 몇 가지 결론을 내릴 수 있습니다.

  • 정확도: YOLO11 모델은 DAMO-YOLO 모델보다 일관되게 더 높은 mAP 점수를 달성합니다. 예를 들어 YOLO11m은 51.5 mAP에 도달하여 DAMO-YOLOm의 49.2 mAP보다 성능이 뛰어납니다. 가장 큰 모델인 YOLO11x는 최첨단 54.7 mAP를 달성합니다.
  • 효율성: YOLO11 모델은 파라미터 효율성이 더 높습니다. YOLO11m은 DAMO-YOLOm의 28.2M 파라미터에 비해 20.1M 파라미터만으로 우수한 정확도를 달성합니다.
  • 추론 속도: YOLO11n은 CPU와 GPU 모두에서 가장 빠른 모델이므로 제약이 많은 에지 컴퓨팅 시나리오에 적합합니다. 특히 Ultralytics는 DAMO-YOLO의 공식 결과에서 생략된 많은 실제 애플리케이션에 중요한 지표인 투명한 CPU 벤치마크를 제공합니다.

주요 차별화 요소 및 사용 사례

Ultralytics YOLO11을 선택해야 하는 경우

YOLO11은 다음이 필요한 프로젝트에 이상적인 선택입니다.

  • 다중 작업 기능: 애플리케이션에 인스턴스 분할 또는 자세 추정과 같이 객체 감지 이상의 기능이 필요한 경우 YOLO11은 통합되고 효율적인 프레임워크를 제공합니다.
  • 사용 편의성 및 빠른 개발: 포괄적인 문서, 간단한 API 및 통합된 Ultralytics HUB 플랫폼은 개발 및 배포를 상당히 가속화합니다.
  • 배포 유연성: CPU와 GPU 모두에서 강력한 성능을 제공하고 다양한 모델 크기를 지원하는 YOLO11은 Raspberry Pi에서 클라우드 서버에 이르기까지 어디든 배포할 수 있습니다.
  • 강력한 지원 및 유지 관리: 활발한 개발과 대규모 커뮤니티를 통해 프레임워크가 최신 상태로 유지되고 안정적이며 잘 지원됩니다.

DAMO-YOLO를 고려해야 하는 경우

DAMO-YOLO는 다음과 같은 경우에 고려할 수 있습니다:

  • 학술 연구: RepGFPN 및 AlignedOTA와 같은 새로운 아키텍처 구성 요소 덕분에 새로운 객체 감지 기술을 탐구하는 연구자에게 흥미로운 모델입니다.
  • GPU 특정 배포: GPU에서 실행되는 것이 보장되고 객체 감지만 필요한 애플리케이션의 경우 DAMO-YOLO는 경쟁력 있는 추론 속도를 제공합니다.

결론

DAMO-YOLO는 객체 감지를 위한 흥미로운 학문적 혁신을 제시하지만, Ultralytics YOLO11은 대다수의 실제 애플리케이션에 탁월한 선택으로 두드러집니다. 더 높은 정확도, 더 나은 성능 균형 및 타의 추종을 불허하는 다재다능함은 이를 더욱 강력하고 실용적인 도구로 만듭니다.

YOLO11의 주요 장점은 최첨단 성능뿐만 아니라 강력하고 사용자 친화적이며 잘 관리되는 에코시스템에 있습니다. 이러한 조합을 통해 개발자와 연구원은 고급 컴퓨터 비전 솔루션을 더 빠르고 효과적으로 구축하고 배포할 수 있습니다. 안정성, 확장성 및 포괄적인 기능 세트가 필요한 프로젝트의 경우 YOLO11이 확실한 승자입니다.

다른 모델 비교 살펴보기

이러한 모델이 다른 모델과 어떻게 비교되는지 궁금하다면 다른 비교 페이지를 확인해 보세요.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글