YOLOv10 YOLO11: 학술적 혁신과 실제 적용 규모의 가교 역할
실시간 객체 탐지의 진화는 속도, 정확도 및 아키텍처 효율성 측면에서 급속한 발전을 이루었습니다. 최근 역사에서 두 가지 핵심 주역은 YOLOv10 와 YOLO11입니다. 두 모델 모두 컴퓨터 비전 기술의 한계를 뛰어넘었지만, 서로 다른 설계 철학에서 비롯되었으며 AI 커뮤니티 내 각기 다른 요구 사항을 목표로 합니다. 본 비교 분석은 두 모델의 기술적 사양, 아키텍처 차이점, 실제 적용 사례를 탐구하여 개발자가 특정 요구 사항에 맞는 적절한 도구를 선택할 수 있도록 돕습니다.
YOLOv10: 엔드투엔드 탐지의 학술적 선구자
2024년 5월 칭화대학교 연구진에 의해 공개된 YOLOv10NMS Suppression) NMS 훈련 전략에 초점을 맞춰 YOLO 패러다임 전환을 가져왔습니다. 기존 YOLO 추론 과정에서 중첩된 바운딩 박스를 걸러내기 위해 NMS 의존해 왔습니다. 효과적이긴 하지만, NMS 배포 지연 시간의 병목 현상을 NMS TensorRT와 같은 형식으로의 내보내기 과정을 복잡하게 만듭니다. TensorRT 이나 ONNX 내보내기 과정을 복잡하게 만들었습니다.
주요 아키텍처 혁신
YOLOv10 훈련 과정에서 이중 할당 전략을 통해 이러한 과제를 YOLOv10 . 학습 시 풍부한 감독을 위해 일대다 헤드를 사용하고 추론 시 일대일 헤드를 활용함으로써, 모델이 객체당 단일 최적 박스를 직접 예측할 수 있게 합니다. 이를 통해 NMS 과정이 불필요해져 에지 디바이스에서의 지연 시간을 크게 줄입니다.
또한 YOLOv10 전체적 효율성-정확도 중심 모델 설계를 YOLOv10 . 여기에는 경량 분류 헤드, 공간-채널 분리 다운샘플링, 순위 기반 블록 설계가 포함되며, 이들이 함께 계산적 중복을 줄입니다.
기술적 메타데이터:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직:조직: 칭화 대학교
- 날짜:23
- Arxiv:YOLOv10: 실시간 종단 간 객체 detect
- GitHub:THU-MIG/yolov10
Ultralytics YOLO11: 기업 규모에 최적화됨
2024년 9월 출시, Ultralytics YOLO11 는 YOLOv8 과 YOLOv9의 견고한 프레임워크를 기반으로 합니다. 전통적인 NMS 접근 방식을 유지하면서도(네이티브 엔드투엔드 YOLOv10 달리), YOLO11 특징 추출 효율성과 매개변수 최적화에 중점을 YOLO11 . 컴퓨터 비전의 "만능 도구"로 설계되어, 탐지뿐만 아니라 인스턴스 분할, 자세 추정, 분류, 방향성 바운딩 박스(OBB) 탐지 등 다양한 작업에서 탁월한 성능을 발휘합니다.
YOLO11의 발전
YOLO11 정교한 백본 아키텍처(C3k2)를 YOLO11 다양한 규모에 걸친 특징 통합을 개선합니다. 이를 통해 모델은 항공 촬영 이미지의 작은 물체와 같은 복잡한 장면 속 정교한 세부 사항을 기존 모델보다 효과적으로 포착할 수 있습니다. 또한 Ultralytics 통합되어 NVIDIA 기본 CPU에 이르기까지 다양한 하드웨어 플랫폼에서 훈련, 검증 및 배포를 원활하게 지원합니다.
기술적 메타데이터:
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜:27
- Docs:YOLO11 문서
- GitHub:ultralyticsultralytics
성능 비교
성능을 비교할 때는 단순한 mAP 살펴보는 것을 넘어 속도, 모델 크기(매개변수), 계산 비용(FLOPs) 간의 상충 관계를 고려하는 것이 중요하다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
데이터 분석
한편 YOLOv10 일부 구성(예: 'M' 모델)에서 더 낮은 매개변수 수를 자랑하지만, YOLO11 는 더 높은 mAP 점수를 달성하며 T4 GPU에서 경쟁력 있거나 우수한 추론 속도를 보여줌으로써 최적화된 백본 아키텍처의 효과성을 입증합니다.
이상적인 사용 사례
10 선택해야 할 때
YOLOv10 연구 중심 프로젝트나 특정 에지 배포 시나리오에서 지연 시간 감소를 위해 NMS 제거하는 것이 중요한 경우 탁월한 YOLOv10 . 이 모델의 종단 간 아키텍처는 후처리 로직을 효율적으로 구현하기 어려운 특정 임베디드 시스템에서 내보내기 파이프라인을 단순화합니다.
- 임베디드 시스템: 후처리를 위한 CPU 제한된 장치.
- 학술 연구: NMS 아키텍처 및 이중 할당 훈련 전략 연구.
- 지연 시간이 중요한 애플리케이션: 추론 지연 시간이 1밀리초 단위로 중요한 고속 로봇 공학.
Ultralytics YOLO11을 선택해야 하는 경우
YOLO11 높은 정확도, 다용도성, 사용 편의성의 균형이 요구되는 생산 등급 애플리케이션에 최적의 YOLO11 . Ultralytics 기반으로 하여 데이터 주석 작업부터 모델 모니터링까지 간소화된 워크플로를 제공합니다.
- 엔터프라이즈 솔루션: 신뢰할 수 있고 유지보수되는 코드베이스 및 상업적 라이선싱이 필요한 대규모 배포 환경.
- 복합 시각 작업: 탐지와 함께 자세 추정 또는 분할이 필요한 프로젝트.
- 클라우드 트레이닝: 데이터셋 및 트레이닝 실행 관리를 위한 Ultralytics 플랫폼과의 원활한 통합.
- 다용도성: 분류, 탐지, 분할을 단일 프레임워크로 처리하고 통합된 API를 필요로 하는 개발자.
Ultralytics 에코시스템의 이점
가장 중요한 차별화 요소 중 하나는 YOLO11 주변 생태계입니다. YOLOv10 인상적인 학술적 YOLOv10 반면, YOLO11 지속적인 업데이트, 방대한 문서화, 그리고 Ultralytics 같은 도구와의 긴밀한 통합이라는 이점을 YOLO11 .
- 사용 편의성: 간단한 Python 통해 단 몇 줄의 코드로 모델을 훈련시킬 수 있습니다.
- 메모리 효율성: Ultralytics 많은 트랜스포머 기반 대안들에 비해 훈련 중 메모리 사용량을 낮추도록 최적화되어 있어, 소비자용 GPU에서도 활용 가능합니다.
- 광범위한 호환성: YOLO11 CoreML로 내보내기 CoreML, OpenVINO, TensorRT, 그리고 더 많은 것을 단일 명령어로.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
앞으로 바라보기: YOLO26과 함께하는 미래
YOLOv10 YOLO11 중요한 YOLO11 하지만, 이 분야는 빠르게 진화하고 있습니다. 최첨단을 추구하는 개발자들에게는 YOLO26 (2026년 1월 출시)는 두 가지 장점을 모두 결합합니다.
YOLO26은 YOLOv10 개척한 NMS 없는 엔드투엔드 설계를 YOLOv10 기업 규모에 맞춰 Ultralytics 시그니처 최적화로 개선했습니다. DFL(분포 초점 손실) 제거로 더 간편한 내보내기가 가능하며, LLM에서 영감을 받은 안정적인 훈련 수렴을 위한 혁신적인 MuSGD 최적화기를 탑재했습니다. 이전 세대 대비 최대 43% 빠른 CPU 성능과 ProgLoss + STAL과 같은 개선된 손실 함수를 갖춘 YOLO26은 현대적인 컴퓨터 비전 프로젝트를 위한 최고의 선택입니다.
다른 특수 아키텍처에 관심이 있는 사용자를 위해, 문서에서는 또한 다음을 다룹니다. RT-DETR 변환기 기반 탐지를 위한 RT-DETR과 개방형 어휘 작업을 위한 YOLO 다룹니다.