DAMO-YOLO vs. YOLO11: 기술 비교
빠르게 진화하는 컴퓨터 비전 환경에서 올바른 물체 감지 모델을 선택하는 것은 애플리케이션의 성공을 위해 매우 중요합니다. 이 포괄적인 비교에서는 두 가지 중요한 아키텍처를 분석합니다: 알리바바 그룹에서 개발한 YOLOUltralytics YOLO11의 최신 최신 모델입니다. 두 모델 모두 속도와 정확성 간의 균형을 최적화하는 것을 목표로 하지만, 주요 목적이 다르며 배포 시나리오에 따라 뚜렷한 이점을 제공합니다.
이 가이드에서는 개발자와 연구자가 정보에 입각한 결정을 내릴 수 있도록 아키텍처, 성능 지표, 이상적인 사용 사례에 대해 자세히 살펴봅니다.
DAMO-YOLO
저자 저자: Xianzhe Xu, 이치 장, 웨이화 첸, 일룬 황, 위안 장, 시우위 선
조직:알리바바 그룹
날짜: 2022-11-23
아카이브:https://arxiv.org/abs/2211.15444v2
깃허브YOLO
문서YOLO
YOLO 고성능을 달성하기 위해 여러 첨단 기술을 통합한 객체 감지 프레임워크입니다. 알리바바의 연구를 기반으로 한 일련의 아키텍처 혁신을 통해 경쟁력 있는 정확도를 유지하면서 지연 시간을 줄이는 데 중점을 둡니다.
아키텍처 및 혁신
YOLO '증류 후 선택' 방식을 도입하고 다음과 같은 핵심 요소를 통합합니다:
- MAE-NAS 백본: 신경망 아키텍처 검색(NAS)을 활용하여 특정 제약 조건에서 백본을 최적화하여 효율적인 특징 추출을 보장합니다.
- 효율적인 RepGFPN: 일반화된 특징 피라미드 네트워크(GFPN)는 추론 중에 많은 계산 비용을 들이지 않고도 다양한 규모에서 특징 융합을 개선하기 위해 재파라미터화 메커니즘을 많이 사용합니다.
- 제로헤드: 이 경량 감지 헤드는 분류와 회귀 작업을 분리하여 추론 속도를 극대화하는 것을 목표로 합니다.
- AlignedOTA: 분류 대상과 회귀 대상 간의 정렬 불일치를 해결하여 훈련 중 수렴을 향상시키는 라벨 할당 전략입니다.
YOLO 인상적인 이론적 진보를 보여주지만, 주로 물체 감지에 초점을 맞춘 연구 중심의 프레임워크입니다. 일반적으로 보다 포괄적인 에코시스템에서 볼 수 있는 기본 멀티태스크 지원 기능이 부족합니다.
Ultralytics YOLO11
저자 저자: Glenn Jocher, Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11
실시간 컴퓨터 비전의 정점을 보여주는 Ultralytics YOLO11 아키텍처, 효율성, 사용 편의성을 대폭 개선하여 기존 YOLO 시리즈를 더욱 발전시킨 제품입니다. 단순한 모델이 아니라 다양한 하드웨어 환경에서 실제 배포할 수 있는 다용도 도구로 설계되었습니다.
아키텍처 및 에코시스템
YOLO11 세련된 앵커 프리 아키텍처로 이전의 성공을 기반으로 합니다. 뛰어난 특징 추출을 위해 개선된 백본과 다양한 규모에서 정보 흐름을 향상시키는 수정된 넥 디자인이 특징입니다.
Ultralytics YOLO11 프레임워크의 주요 장점은 다음과 같습니다:
- 다목적성: 다른 경쟁사와 달리 YOLO11 기본적으로 객체 감지, 인스턴스 분할, 포즈 추정, 이미지 분류, 방향성 바운딩 박스(OBB) 등 다양한 작업을 지원합니다.
- 사용 편의성: 이 모델은 사용자 친화적인 Python API와 CLI로 구성되어 있어 초보자와 전문가 모두 쉽게 사용할 수 있습니다.
- 훈련 효율성: 더 빠른 융합을 위해 최적화된 YOLO11 효율적인 데이터 증강 및 손실 기능을 활용하여 사용자가 다음과 같은 데이터 세트에서 맞춤형 모델을 학습할 수 있습니다. COCO 와 같은 데이터 세트에서 사용자 지정 모델을 훈련할 수 있습니다.
- 잘 관리된 생태계: 지원 Ultralytics 팀의 지원을 받아 사용자는 잦은 업데이트, 광범위한 문서, 그리고 Ultralytics HUB와 같은 MLOps 도구와의 원활한 통합을 활용할 수 있습니다.
알고 계셨나요?
YOLO11 엣지 AI 장치에서 매우 효율적으로 작동하도록 설계되었습니다. 최적화된 아키텍처로 NVIDIA Jetson 및 Raspberry Pi와 같은 하드웨어에서 낮은 메모리 사용량과 빠른 추론 속도를 보장하므로 무거운 트랜스포머 기반 모델에 비해 임베디드 애플리케이션에 탁월한 선택이 될 수 있습니다.
성능 비교
다음 차트와 표는 YOLO YOLO11 성능 차이를 보여줍니다. 특히 공식 벤치마크가 없는 CPU 하드웨어에서 Ultralytics YOLO11 우수한 정확도mAP와 유리한 추론 속도를 일관되게 보여주며, 특히 YOLO 공식 벤치마크가 없습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
결과 분석
- 정확도: YOLO11 비교 가능한 YOLO 모델보다 훨씬 뛰어난 성능을 발휘합니다. 예를 들어, YOLO11m은 더 적은 매개변수(20.1억 대 28.2억)에도 불구하고 51. mAP 달성하여 49. mAP DAMO-YOLOm보다 눈에 띄게 높습니다.
- 추론 속도: GPU (T4 TensorRT)에서 YOLO11 매우 경쟁력 있는 지연 시간을 제공합니다. YOLO11n은 1.5ms로 매우 빠르기 때문에 초저지연 애플리케이션에 적합합니다.
- CPU 성능: Ultralytics 모델의 가장 큰 장점은 CPU 성능에 대한 투명성입니다. YOLO11 다음을 통해 CPU 추론에 최적화되어 있습니다. ONNX 및 OpenVINO 통한 CPU 추론에 최적화된 반면, YOLO GPU 중점을 두기 때문에 CPU 배포 성능이 정의되지 않은 경우가 많습니다.
- 모델 효율성: YOLO11 파라미터와 성능 간의 균형이 더 잘 맞습니다. 아키텍처의 효율성을 통해 모델 파일을 더 작게 만들 수 있으므로 다운로드 속도가 빨라지고 엣지 디바이스의 스토리지 요구 사항이 줄어듭니다.
주요 차별화 요소 및 사용 사례
Ultralytics YOLO11
다음을 활용하는 개발자 Ultralytics YOLO11 는 강력한 프로덕션급 환경에 액세스할 수 있습니다.
- 성능 균형: 모델 아키텍처는 실시간 비디오 분석에 필수적인 추론 속도와 정확도 사이에서 최상의 균형을 제공하도록 세심하게 조정되었습니다.
- 멀티태스크 기능: 프로젝트 범위가 탐지에서 추적 또는 세분화로 확장되는 경우, YOLO11 동일한 코드베이스 내에서 이를 원활하게 처리합니다.
- 사용 편의성: 에 지정되어 있습니다.
ultralytics패키지는 전체 파이프라인을 간소화합니다. 몇 줄의 코드만으로 모델을 로드하고, 예측을 실행하고, CoreML, TFLite 또는 TensorRT 같은 형식으로 내보낼 수 있습니다. - 메모리 요구 사항 감소: 트랜스포머 기반 검출기나 최적화되지 않은 아키텍처에 비해 YOLO11 일반적으로 훈련 시 CUDA 메모리를 덜 필요로 하기 때문에 연구자들이 일반 소비자용 GPU로 훈련할 수 있습니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
YOLO 강점
YOLO 학술 연구계에서 강력한 경쟁자입니다.
- 연구 혁신: MAE-NAS 및 제로헤드와 같은 기능은 신경 구조 검색 및 헤드 디커플링에 대한 흥미로운 인사이트를 제공합니다.
- GPU 처리량: 지원되는 GPU에서만 실행되는 특정 산업용 애플리케이션의 경우, YOLO 높은 처리량을 제공하지만 순수한 정확도당 효율성에서는 YOLO11 뒤처지는 경우가 많습니다.
결론
YOLO 알리바바 연구팀의 새로운 개념을 소개합니다, Ultralytics YOLO11 는 대다수의 개발자와 기업에게 탁월한 선택으로 돋보입니다. 이 제품의 우위는 단순히 더 높은 mAP 점수와 빠른 추론 속도뿐만 아니라 이를 지원하는 포괄적인 에코시스템에 의해 정의됩니다.
사용 편의성과 다용도성부터 잘 관리된 코드베이스와 활발한 커뮤니티 지원까지, YOLO11 고급 AI 솔루션 개발의 진입 장벽을 낮춰줍니다. 클라우드 서버에 배포하든 리소스의 제약이 있는 엣지 디바이스에 배포하든 YOLO11 최신 컴퓨터 비전 애플리케이션에 필요한 안정성과 성능을 제공합니다.
다른 모델 비교 살펴보기
다른 아키텍처와 Ultralytics 모델을 비교하는 방법을 더 잘 이해하려면 자세한 비교 페이지를 살펴보세요: