YOLO11 YOLO: 차세대 객체 탐지기 비교

최적의 아키텍처를 선택하는 것은 모든 컴퓨터 비전 프로젝트에서 중요한 단계입니다. 이 기술 가이드는 두 가지 강력한 객체 detect 모델인 Ultralytics YOLO11과 DAMO-YOLO에 대한 포괄적인 비교를 제공합니다. 우리는 배포 요구 사항에 가장 적합한 도구를 선택하는 데 도움이 되도록 이들의 아키텍처 혁신, 학습 패러다임 및 실제 적용 가능성을 심층적으로 다룰 것입니다.

모델 개요

Ultralytics YOLO11

Ultralytics 팀에서 개발한 YOLO11은 YOLO 제품군에서 고도로 정제된 반복 버전을 나타내며, 정확도와 효율성을 모두 크게 최적화합니다. 이는 데이터셋 관리부터 엣지 배포에 이르는 통합된, 프로덕션 준비가 된 생태계를 찾는 연구원과 엔지니어를 위해 설계되었습니다.

저자: 글렌 조커와 징 치우
조직:Ultralytics
날짜:27
GitHub:https://github.com/ultralytics/ultralytics
Docs:https://docs.ultralytics.com/models/yolo11/

YOLO11에 대해 자세히 알아보세요

YOLO11 다재다능함으로 YOLO11 . 많은 기존 모델들이 경계 상자에만 집중하는 반면, YOLO11 객체 탐지, 인스턴스 분할, 이미지 분류, 자세 추정 기능을 YOLO11 지원합니다. 이러한 다중 모드 기능 덕분에 개발자들은 단일하고 잘 관리되는 프레임워크 아래에서 비전 AI 파이프라인을 통합할 수 있습니다.

DAMO-YOLO

DAMO-YOLO는 Alibaba 그룹의 연구원들이 개발했습니다. 이 모델은 신경망 아키텍처 검색(NAS)을 활용하여 GPU 및 기타 가속기에서 실시간 추론에 최적화된 고도로 효율적인 백본을 발견합니다.

작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
조직:조직: 알리바바 그룹
날짜:23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO
Docs:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO에 대해 자세히 알아보세요.

YOLO 핵심 철학은 반복 매개변수화(rep-parameterization)와 자동화된 검색(automated search)을 중심으로YOLO . 저자들은 MAE-NAS(다중 목표 진화 신경망 구조 검색)를 활용하여 특수 하드웨어에서 추론 속도를 크게 향상시키는 맞춤형 백본을 설계했습니다. 또한 지연 시간을 최소화하기 위해 고도로 최적화된 목 구조인 Efficient RepGFPN과 단순화된 ZeroHead 구조를 통합했습니다.

고려할 다른 모델

YOLO11 YOLO 비교할 때, 최신 Ultralytics 살펴보는 것도 고려해 보세요. 이 모델은 기본적으로 엔드투엔드 NMS 추론을 도입하여 CPU 최대 43%까지 향상시킵니다. YOLOX 또는 YOLOv8를 포함한 비교도 살펴볼 수 있습니다.

성능 및 아키텍처 비교

엣지 AI 애플리케이션을 배포할 때 성능 상의 절충점을 이해하는 것이 매우 중요합니다. 아래 표는 평균 정밀도(mAP), 지연 시간, 계산 규모와 같은 주요 지표를 요약합니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

심층적인 아키텍처 분석

YOLO11은 파라미터 수와 표현 능력을 완벽하게 균형 잡는 고효율의 맞춤형 백본에 의존합니다. 다양한 하드웨어에서 원활하게 작동하도록 최적화되어 있으며, 학습 및 추론 시 최소한의 CUDA memory 사용으로 탁월한 성능을 발휘합니다. 이는 표준 소비자 하드웨어 또는 리소스 제약이 있는 IoT 장치에 탁월한 선택이 됩니다.

반대로, DAMO-YOLO의 MAE-NAS 생성 백본은 고처리량 GPU 환경에 최적화되어 있습니다. Efficient RepGFPN(Generalized Feature Pyramid Network)은 여러 스케일을 적극적으로 통합합니다. 그러나 재매개변수화(rep-parameterization)가 추론 속도를 높이지만, 하드웨어 스택이 이러한 작업을 명시적으로 잘 지원하지 않으면 배포 프로세스를 복잡하게 만들 수 있습니다.

사용성 및 교육 효율성

개발 시간을 고려할 때 모델의 사용 편의성은 순수 벤치마크 점수만큼 중요해진다.

YOLO11 개발자 접근성 원칙을 중점으로 구축되었습니다. 포괄적인 ultralytics 패키지는 데이터셋 파싱, 증강 및 하이퍼파라미터 튜닝과 같은 복잡한 작업을 추상화합니다. 모델을 다음과 같은 프로덕션 형식으로 내보내는 기능도 제공합니다: ONNX, TensorRT및 OpenVINO 단 하나의 명령만 필요합니다.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

DAMO-YOLO는 학술적이고 연구 중심적인 배경에서 비롯되어 더 가파른 학습 곡선을 제시합니다. 최고 정확도를 달성하려면 종종 복잡한 지식 증류 파이프라인이 필요합니다. 이는 먼저 대규모 "교사" 네트워크를 훈련한 다음 해당 지식을 더 작은 "학생" 네트워크에 전달해야 함을 의미합니다. 이는 Ultralytics 모델의 간결한 훈련 루프와 비교할 때 필요한 GPU 컴퓨팅 오버헤드와 전체 훈련 기간을 크게 증가시킵니다.

사용 사례 및 권장 사항

YOLO11과 DAMO-YOLO 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

YOLO11 선택해야 할 때

YOLO11 다음에 대한 강력한 YOLO11 :

엣지 상용 배포: 신뢰성과 적극적인 유지보수가 가장 중요한 Raspberry Pi 또는 NVIDIA Jetson과 같은 장치에서의 상업용 애플리케이션.
다중 작업 비전 애플리케이션: 단일 통합 프레임워크 내에서 detect, segmentation, 포즈 추정 및 OBB를 요구하는 프로젝트.
신속한 프로토타이핑 및 배포: 간소화된 Ultralytics python API를 사용하여 데이터 수집에서 프로덕션으로 빠르게 전환해야 하는 팀.

YOLO 선택해야 할 때

DAMO-YOLO는 다음 경우에 권장됩니다.

고처리량 비디오 분석: 배치-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리합니다.
산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화된 백본이 detect 성능에 미치는 영향 연구.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.

실제 적용 사례 및 사용 사례

자율 시스템 및 드론

항공 촬영 및 무인 항공기(UAV) 배치에 관하여, YOLO11 은 매우 유리한 성능 균형을 제공합니다. 소형 물체 탐지는 드론 분석에서 큰 장애물이지만, YOLO11 다양한 규모를 기본적으로 즉시 YOLO11 . 또한 낮은 메모리 요구 사항 덕분에 YOLO11 및 Small 변형은 드론에 장착된 경량 에지 CPU 또는 NPU에서 직접 실행될 수 있습니다.

산업 자동화 및 품질 관리

스마트 공장에서는 지연 시간이 가장 중요합니다. YOLO RepGFPN 목 구조 덕분에 고성능 서버급 GPU에서 강력한 추론 속도를 제공하지만, 경직된 통합 방식은 과잉 설계일 수 있습니다. YOLO11 단순한 추적 API와 결함의 각도 경계 인식이 필요한 경우 순수 탐지에서 방향성 바운딩 박스(OBB) 작업으로 원활하게 전환할 수 있는 능력 덕분에 자동화된 품질 관리에 YOLO11 더 우수한 대안으로 작용합니다.

스마트 헬스케어 및 의료 영상

의료 영상 데이터셋은 상대적으로 규모가 작은 경우가 많으며, 과적합을 피하는 것이 어렵습니다. Ultralytics 잘 관리된 생태계가 제공하는 표준 전이 학습 파이프라인과 결합된 능동적 증강 기법은 임상의와 개발자가 정확한 종양 탐지 모델을 안정적으로 배포하는 데 도움을 줍니다. 방대한 커뮤니티 지원은 의료와 같은 복잡한 분야의 문제들이 신속히 해결되도록 보장합니다.

YOLO26과 함께 미래를 맞이하다

새로운 애플리케이션을 처음부터 구축 중이라면 YOLO26을 고려해 보세요. 2026년 초에 출시된 이 모델은 MuSGD 최적화기와 ProgLoss 함수를 활용하여 아주 작은 물체에 대한 탁월한 정확도를 제공하며, 기본적으로 NMS 엔드투엔드 파이프라인을 제공합니다!

궁극적으로,YOLO 신경망 구조 탐색(Neural Architecture Search)의 강력한 사례임에도 불구하고, YOLO11 과 확장된 Ultralytics 신속한 배포, 개발자 편의성, 최상위 다중 모달 성능을 최우선으로 하는 실제 컴퓨터 비전 작업에 대한 결정적인 권장 사항으로 남아 있습니다.