YOLO11 대 DAMO-YOLO: 기술 비교
빠르게 진화하는 컴퓨터 비전 환경에서 올바른 물체 감지 모델을 선택하는 것은 프로젝트 성공을 위해 매우 중요합니다. 이 페이지에서는 다음과 같은 기술 비교를 자세히 설명합니다. Ultralytics YOLO11 와 속도와 정확성을 위해 설계된 두 가지 고성능 아키텍처인 YOLO 자세히 비교합니다. YOLO 학술 연구를 통한 혁신적인 기술을 도입한 반면, YOLO11 강력한 에코시스템으로 뒷받침되는 다목적, 프로덕션 지원 솔루션으로 돋보입니다.
경영진 요약
Ultralytics YOLO11 은 엣지 디바이스에서 클라우드 서버에 이르기까지 다양한 하드웨어에서 실시간 추론을 최적화하는 YOLO 시리즈의 최신 버전입니다. 기본적으로 감지, 세분화, 포즈 추정을 비롯한 여러 작업을 지원하므로 복잡한 AI 파이프라인을 위한 통합 솔루션이 될 수 있습니다.
알리바바 그룹에서 개발한 YOLO 신경망 아키텍처 검색(NAS)과 새로운 특징 융합 기술을 사용하여 탐지 속도와 정확도의 균형을 맞추는 데 중점을 둡니다. 주로 GPU 처리량에 최적화된 연구용 검출기입니다.
Ultralytics YOLO11
저자 저자: Glenn Jocher, Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11
YOLO11 높은 효율성을 유지하면서 특징 추출을 향상시키는 아키텍처 개선 사항을 도입하여 최첨단 기술을 더욱 발전시켰습니다. 수정된 CSPNet 백본과 고급 앵커 프리 헤드를 사용하여 이전 세대에 비해 더 적은 수의 매개변수로 뛰어난 정확도를 제공합니다.
주요 기능 및 강점
- 다용도성: 많은 전문 모델과 달리 YOLO11 멀티태스크 프레임워크입니다. 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정, 방향성 바운딩 박스(OBB)를 지원합니다.
- 세련된 아키텍처: 복잡한 패턴을 효과적으로 캡처하기 위해 C3k2 블록과 C2PSA(크로스 스테이지 부분 공간 주의) 모듈을 통합하여 작은 물체와 어려운 배경에서 성능을 향상시킵니다.
- 광범위한 하드웨어 지원: 최적화 대상 CPU 및 GPU 추론에 최적화되어 있으며, 라즈베리 파이부터 NVIDIA A100 클러스터까지 다양한 제약 조건에 맞는 다양한 모델 규모(나노에서 대형까지)를 제공합니다.
- 사용의 용이성: 개발자는 최소한의 코딩으로 모델을 훈련, 검증 및 배포할 수 있는 Ultralytics Python API 및 CLI 사용할 수 있습니다.
프로덕션 준비된 에코시스템
YOLO11 데이터 관리 도구, Ultralytics HUB를 통한 모델 교육, 다음과 같은 형식으로의 원클릭 내보내기 등 Ultralytics 에코시스템과 원활하게 통합됩니다. ONNX, TensorRT및 CoreML 같은 형식으로 클릭 한 번으로 내보낼 수 있습니다.
DAMO-YOLO
저자 저자: Xianzhe Xu, 이치 장, 웨이화 첸, 일룬 황, 위안 장, 시우위 선
조직:알리바바 그룹
날짜: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO
YOLO 산업용 애플리케이션을 위한 짧은 지연 시간과 높은 처리량에 중점을 두고 설계되었습니다. 속도-정확도 트레이드 오프의 한계를 뛰어넘기 위해 YOLO 제품군에 몇 가지 "새로운 기술" 구성 요소를 도입했습니다.
아키텍처 혁신
- MAE-NAS 백본: 평균 절대 오차(MAE)에 따라 신경망 아키텍처 검색(NAS)을 활용하여 효율적인 네트워크 토폴로지를 자동으로 발견합니다.
- 효율적인 RepGFPN: 재파라미터화를 사용하는 일반화된 특징 피라미드 네트워크(GFPN)로, 훈련 중에는 복잡한 특징을 융합하고 추론 중에는 더 빠르고 단순한 구조로 축소할 수 있습니다.
- 제로헤드: 분류와 회귀 작업을 분리하여 최종 출력 레이어의 계산 오버헤드를 크게 줄여주는 경량 감지 헤드입니다.
- AlignedOTA: 훈련 중 분류 신뢰도와 회귀 정확도 간의 불일치를 해결하는 향상된 라벨 할당 전략입니다.
YOLO 특정 메트릭에서는 탁월하지만, 주로 리서치 저장소입니다. 광범위한 문서, 지속적인 업데이트 및 광범위한 커뮤니티 지원은 Ultralytics 에코시스템에 비해 부족합니다.
성능 지표: 헤드 투 헤드
다음 표는 COCO val2017 데이터 세트에서 YOLO11 YOLO 성능을 비교한 것입니다. 주요 메트릭에는 CPU 및 GPU 하드웨어의 평균 정밀도mAP와 추론 속도가 포함됩니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
결과 분석
- 효율성 우위: YOLO11 뛰어난 파라미터 효율성을 보여줍니다. 예를 들어, YOLO11m 모델은 2,010만 개의 매개변수만으로 51. mAP 달성하는 반면, 비교 대상인 DAMO-YOLOm은 2,820만 개의 매개변수로 49. mAP 뒤쳐져 있습니다.
- 최고의 정확도: 가장 큰 모델인 YOLO11x는 54. mAP 달해 가장 큰 모델인 YOLO 능가합니다. 따라서 의료 영상이나 결함 감지와 같은 고정밀 작업에 YOLO11 가장 적합한 선택입니다.
- 엣지 배포: YOLO11n (Nano) 모델은 매우 가볍고(2.6M 매개변수) 빠르기 때문에(T4에서 1.5ms) 메모리가 부족한 임베디드 시스템에 적합합니다. 반면, 가장 작은 YOLO 모델은 훨씬 더 무겁습니다(8.5M 매개변수).
- CPU 성능: Ultralytics 투명한 CPU 벤치마크를 제공하여 전용 가속기 없이도 배포할 수 있는 YOLO11 실행 가능성을 강조합니다. YOLO 공식적으로 CPU 속도를 보고하지 않기 때문에 저전력 IoT 애플리케이션에 대한 평가가 제한적입니다.
기술 심층 분석
교육 및 아키텍처
YOLO 백본을 정의하기 위해 신경망 아키텍처 검색(NAS) 에 크게 의존합니다. 이는 이론적으로 최적의 구조를 생성할 수 있지만, 모든 디바이스에서 하드웨어 친화적이지 않을 수 있는 불규칙한 블록을 생성하는 경우가 많습니다. 반면, YOLO11 직관적으로 설계된 수작업으로 제작된 정제된 블록(C3k2, C2PSA)을 사용하여 표준화된 GPU 및 CPU 가속 라이브러리를 위해 직관적으로 설계된 블록을 사용합니다.
YOLO11 또한 훈련 효율성을 강조합니다. 최적화된 하이퍼파라미터와 데이터 증강 전략 덕분에 빠르게 수렴합니다. 훈련 시 메모리 요구 사항은 일반적으로 복잡한 트랜스포머 기반 또는 NAS 기반 아키텍처보다 낮기 때문에 연구자들은 소비자급 하드웨어에서 효과적인 모델을 훈련할 수 있습니다.
에코시스템 및 사용성
가장 중요한 차별화 요소 중 하나는 생태계입니다. YOLO 주로 연구 논문 결과를 재생산하기 위한 코드 저장소입니다.
하지만 Ultralytics YOLO11 풀서비스 플랫폼입니다:
- 문서: 문서: 파이프라인의 모든 측면에 대한 종합적인 가이드입니다.
- 통합: MLFlow, TensorBoard 및 Weights & Biases 를 지원합니다.
- 커뮤니티: 버그가 신속하게 수정되고 질문에 대한 답변이 제공되는 GitHub 및 Discord의 대규모 커뮤니티입니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for deployment
path = model.export(format="onnx")
사용 사례 권장 사항
Ultralytics YOLO11을 선택해야 하는 경우
- 실제 배포: 다양한 하드웨어에 배포해야 하는 경우(iOS, Android, Edge TPU, Jetson)에 배포해야 하는 경우 YOLO11 내보내기 기능은 타의 추종을 불허합니다.
- 복잡한 비전 파이프라인: 프로젝트에 오브젝트 추적이나 신체 자세추정과 같이 단순한 바운딩 박스 이상의 기능이 필요한 경우 ,YOLO11 이를 기본적으로 처리합니다.
- 신속한 프로토타이핑: 사용 편의성: 개발자는 데이터에서 작동하는 데모로 몇 분 만에 전환할 수 있습니다.
- 리소스 제약: 나노 및 소형 모델은 배터리로 구동되는 디바이스에 가장 적합한 크기 대비 정확도를 제공합니다.
DAMO-YOLO를 고려해야 하는 경우
- 학술 연구: 객체 감지 또는 재매개변수화 기술에서 NAS의 효율성을 연구하는 연구자들은 YOLO 유용한 기준이 될 수 있습니다.
- 특정 GPU 설정: 특정 아키텍처 블록이 대상 가속기의 캐시 계층 구조와 완벽하게 일치하는 경우, YOLO 경쟁력 있는 처리량을 제공할 수 있습니다.
결론
YOLO MAE-NAS, RepGFPN과 같은 인상적인 학문적 개념을 소개합니다, Ultralytics YOLO11 은 여전히 대다수의 개발자와 기업에게 탁월한 선택입니다. 최첨단 정확도, 경량 아키텍처, 번성하는 에코시스템의 조합은 프로젝트의 성능뿐만 아니라 유지 관리 및 확장성을 보장합니다.
안정적이고 다재다능한 고성능 컴퓨터 비전 솔루션을 찾는 개발자를 위해 YOLO11 2025년 이후에도 성공에 필요한 도구와 지표를 제공합니다.
다른 모델 비교 살펴보기
객체 감지 모델의 환경을 더 자세히 이해하려면 다음과 같은 관련 비교를 살펴보세요: