YOLO11 YOLO: 실시간 객체 탐지 아키텍처의 진화
컴퓨터 비전 연구는 눈부신 속도로 발전하며, 새로운 아키텍처가 끊임없이 속도와 정확성의 한계를 재정의하고 있습니다. 이 분야에 기여한 두 가지 중요한 성과는 다음과 같습니다. YOLO11Ultralytics 알리바바 그룹의 YOLO. 두 모델 모두 실시간 객체 탐지 문제를 해결하는 것을 목표로 하지만, 서로 다른 철학으로 접근합니다. 하나는 원활한 사용성과 배포에 중점을 두고, 다른 하나는 엄격한 신경망 아키텍처 탐색(NAS)과 학술적 탐구에 초점을 맞춥니다.
이 가이드는 개발자, 연구원 및 엔지니어가 특정 컴퓨터 비전 애플리케이션에 적합한 도구를 선택할 수 있도록 심층적인 기술 비교를 제공합니다.
모델 개요
YOLO11
YOLO11YOLO You Only Look Once) 제품군의 수년간의 반복적 개선을 집대성한 결과물입니다. 2024년 말 Ultralytics 출시된 이 제품은 YOLOv8 의 성공을 바탕으로, "bag-of-freebies" 철학을 유지하면서 특징 추출 효율성을 높이는 아키텍처 개선을 도입했습니다. 이는 복잡한 훈련 설정 없이도 높은 성능을 제공합니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜: 2024년 9월 27일
- GitHub:ultralyticsultralytics
- Docs:YOLO11 문서
DAMO-YOLO
YOLO DAMO 아카데미(알리바바 그룹)가 개발한 연구 중심 모델입니다. 이 모델은 백본 최적화를 위한 신경망 구조 탐색(NAS), 효율적인 재매개변수화 일반화 FPN(RepGFPN), 증류 기반 훈련 프레임워크 등 여러 혁신적인 기술을 도입했습니다. 자동화된 설계 탐색을 통해 지연 시간과 정확도 간의 균형을 극대화하는 데 중점을 둡니다.
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen 외
- Organization: Alibaba Group
- 날짜: 2022년 11월 23일
- Arxiv:YOLO: 실시간 객체 감지 설계에 관한 보고서
- GitHub:YOLO
기술적 비교
건축 및 디자인 철학
이 두 모델의 핵심적인 차이는 설계 기원에 있습니다. YOLO11 은 다용도와 사용 편의성을 위해 수작업으로 제작되었습니다. 정제된 C3k2(Cross Stage Partial) 백본과 매개변수 수와 특징 표현 간의 균형을 맞춘 개선된 detect 사용합니다. 이 설계는 모델이 객체 탐지뿐만 아니라 인스턴스 분할, 자세 추정, 분류, 방향성 경계 상자(OBB) 작업 등 다양한 작업 전반에 걸쳐 견고함을 보장합니다.
반면 YOLO MAE-NAS (자동화된 효율적 신경망 구조 탐색 방법)를 활용해 백본 구조를 발견합니다. 이로 인해 특정 하드웨어 제약 조건에 대해 이론적으로 최적화된 네트워크 토폴로지가 생성되지만, 수동으로 수정하기 어렵고 불투명할 수 있습니다. 또한YOLO "ZeroHead" 설계와 대규모 교사 모델로부터의 디스틸레이션을 포함하는 복잡한 훈련 파이프라인에 크게YOLO , 맞춤형 데이터셋에서의 훈련 복잡성을 증가시킵니다.
성능 지표
아래 표는 다양한 모델 스케일의 성능을 비교합니다. YOLO11 특히 낮은 지연 시간 시나리오(N/S/M 모델)에서 우수한 효율성을 YOLO11 최첨단 정확도를 유지합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
성능 분석
YOLO11 동등한YOLO 비해 더 적은 매개변수로 지속적으로 더 높은 mAP 달성합니다. 예를 들어, YOLO11s는 DAMO-YOLOs보다 1.0 mAP 높은 성능을 mAP 매개변수는 거의 40% 적게 사용합니다(940만 vs 1,630만). 이러한 효율성은 에지 디바이스에서 메모리 사용량 감소와 더 빠른 추론 속도로 직접 연결됩니다.
훈련 효율성과 사용성
YOLO11 접근성에서 빛을 발한다. 통합된 ultralytics Python 사용하면 모델 훈련이 데이터셋 YAML 파일을 정의하고 단일 명령어를 실행하는 것만큼 간단합니다. 생태계가 하이퍼파라미터 튜닝, 데이터 증강 및 실험 추적 자동으로.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with one line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
반면, YOLO 다단계 훈련 과정을 채택합니다. 이는 종종 먼저 무거운 "교사" 모델을 훈련시켜 지식을 더 작은 "학생" 모델로 정제해야 합니다. 이로 인해 훈련에 필요한 GPU 시간과 VRAM이 크게 증가합니다. 학술 벤치마크에서 정확도의 마지막 한 줌을 짜내는 데는 효과적이지만, 이러한 복잡성은 민첩한 엔지니어링 팀에게 병목 현상이 될 수 있습니다.
이상적인 사용 사례
왜 Ultralytics 모델을 선택해야 할까요?
실제 세계의 대부분의 응용 프로그램에서는, YOLO11 (그리고 최신 버전인 YOLO26)은 성능과 실용성 사이에서 최적의 균형을 제공합니다.
- 사용 편의성: Ultralytics 개발자의 만족도를 위해 설계되었습니다. 포괄적인 가이드와 통합된 CLI 프로토타입에서 실제 운영 환경으로의 전환이 CLI .
- 잘 관리되는 생태계: 출판 후 방치되는 많은 연구 저장소와 달리, Ultralytics 지속적으로 관리됩니다. 정기적인 업데이트를 통해 최신 버전과의 호환성을 보장합니다. PyTorch 버전, CUDA 및 OpenVINO , CoreML.
- 다용도성:YOLO 순수한 객체 탐지YOLO 반면, YOLO11 본질적으로 자세 추정 (키포인트)과 인스턴스 분할을 YOLO11 . 이를 통해 단일 아키텍처 계열로 복잡한 파이프라인 내 다양한 비전 작업을 처리할 수 있습니다.
- 메모리 효율성: Ultralytics YOLO 낮은 VRAM 사용량을 위해 최적화되었습니다. 트랜스포머 기반 아키텍처나 복잡한 디스틸레이션 파이프라인에서 흔히 발생하는 과도한 메모리 오버헤드를 피함으로써, 일반 소비자용 하드웨어에서도 훈련이 가능합니다.
YOLO 언제 사용해야 하는가
- 학술 연구: YOLO 에서 제시된 신경망 구조 탐색(NAS) 또는 특정 재현-매개변수화 기법의 재현을 연구하는 것이 목표라면.
- 특정 하드웨어 제약 사항: 매우 특이하고 비표준적인 하드웨어 가속기에 완벽하게 맞춤화된 백본을 찾기 위해 광범위한 NAS 검색을 실행할 자원이 있다면.
실제 응용 분야
YOLO11 견고성 덕분에 다양한 산업 분야에서 널리 배포되고 있습니다:
- 스마트 리테일: 객체 탐지를 활용한고객 행동 분석 및 자동화된 재고 관리
- 의료: 의료 영상에서의종양 검출, 속도가 신속한 검진을 가능하게 하는 분야.
- 제조: 조립 라인에서 detect 위해 에지 디바이스에서 고속 추론이 필요한품질 관리 시스템.
앞으로 나아가기: YOLO26의 장점
YOLO11 우수한 YOLO11 , 해당 분야는 계속 발전해 왔습니다. 2026년부터 시작되는 신규 프로젝트에는 YOLO26을 권장합니다.
YOLO26은 다음과 같은 획기적인 기능을 도입합니다:
- 엔드투엔드 NMS 프리: 비최대 억제(NMS)를 제거함으로써 YOLOv2는 배포 로직을 단순화하고 지연 변동성을 줄입니다. 이 개념은 YOLOv10에서 선구적으로 제시된 개념입니다.
- MuSGD 최적화기: LLM 훈련에서 영감을 받은 하이브리드 최적화기로 안정적인 수렴을 보장합니다.
- 소형 물체 탐지 성능 향상: ProgLoss 및 STAL과 같은 손실 함수는 드론 영상 및 IoT 센서에 중요한 소형 표적에 대한 성능을 크게 향상시킵니다.
결론
둘 다 YOLO11 와 YOLO 모두 객체 탐지 기술 발전에 크게 기여했습니다.YOLO 자동화된 아키텍처 탐색의 가능성을YOLO . 그러나 YOLO11 는 간소화된 워크플로, 광범위한 작업 지원, 효율적인 매개변수 활용 덕분에 실용적 적용 측면에서 여전히 우월한 선택지입니다.
최첨단을 유지하고자 하는 개발자들에게 YOLO26으로의 마이그레이션은 더욱 향상된 속도와 간편함을 제공하여 컴퓨터 비전 프로젝트가 미래에도 대응 가능하도록 보장합니다.
프로젝트 시작하기
훈련을 시작할 준비가 되셨나요? 복잡한 인프라 관리 없이 몇 분 만에 모델에 주석을 달고, 훈련하고, 배포할 수 있는 Ultralytics 방문하세요.