YOLO11 YOLOv7: 아키텍처와 성능에 대한 기술적 비교
컴퓨터 비전 분야가 가속화됨에 따라, 올바른 객체 탐지 아키텍처를 선택하는 것이 성공의 핵심 요소가 됩니다. YOLO 두 주요 경쟁자는 YOLO11( Ultralytics 개발)과 YOLOv7입니다. 두 모델 모두 최신 기술 발전에 크게 기여했지만, 속도, 유연성, 배포 용이성 측면에서 서로 다른 요구사항을 충족시킵니다.
이 가이드는 개발자와 연구원이 프로젝트에 가장 적합한 도구를 선택할 수 있도록 그들의 아키텍처, 성능 지표 및 이상적인 사용 사례에 대한 심층적인 기술적 분석을 제공합니다.
모델 개요 및 기원
이러한 모델들의 계보를 이해하는 것은 그들의 아키텍처적 결정에 대한 맥락을 제공한다.
YOLO11
2024년 9월 출시 Ultralytics에서 출시된 YOLO11 해당 기업의 생산성 중심 철학을 정교화한 YOLO11 . 현대 하드웨어에서 효율성을 극대화하도록 설계되어 높은 처리량과 경쟁력 있는 정확도를 균형 있게 구현합니다.
- 저자: 글렌 조커와 징 치우
- 조직:Ultralytics
- 날짜: 2024년 9월
- 주요 초점: 실시간 사용 편의성, 광범위한 작업 지원(검출, 분할, 자세 추정, OBB, 분류), 그리고 Ultralytics 통한 간소화된 배포.
7
2022년 7월 출시된 YOLOv7 YOLOv4 개발팀이 선보인 주요 학술적 YOLOv7 . 이 모델은 추론 비용을 증가시키지 않으면서 정확도를 향상시키기 위해 여러 가지 '무료 기능 모음'을 도입했으며, 특히 훈련 가능한 아키텍처 최적화에 중점을 두었다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직: 정보 과학 연구소, 아카데미아 시니카
- 날짜: 2022년 7월
- 주요 초점: 경사 경로 분석, 모델 재매개변수화, 동적 레이블 할당.
성능 분석
이러한 아키텍처를 비교할 때 평균 정밀도(mAP) 및 추론 지연 시간과 같은 지표가 가장 중요합니다. 아래 표는 YOLO11 최신 기술이 기존 YOLOv7 대비 효율성 향상을 어떻게 YOLO11 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
주요 내용
- 효율성: YOLO11m 모델은 표준 YOLOv7 51.4%)보다 약 45% 적은 매개변수 (20.1M vs 36.9M)와 현저히 적은 FLOPs를 사용하면서도 약간 더 높은 정확도(51.5% mAP)를 달성합니다.
- 속도: T4 GPU에서 YOLO11 자율 주행이나 영상 분석과 같은 실시간 애플리케이션에 있어 핵심 요소인 추론 지연 시간 측면에서 YOLOv7 지속적으로 능가합니다.
- 확장성: YOLO11 더 넓은 범위의 모델 규모(Nano부터 X-Large까지)를 YOLO11 , 라즈베리 파이나 모바일 기기와 같은 리소스 제약이 있는 하드웨어에 더 쉽게 배포할 수 있습니다.
아키텍처의 차이점
Ultralytics YOLO11
YOLO11 CSPNet(Cross-Stage Partial Network)의 핵심 개념을 YOLO11 하지만, 더 나은 기울기 흐름과 특징 추출을 위해 블록 설계를 개선합니다.
- 정제된 백본: 개선된 C3k2 블록(CSP 병목 현상의 고속 구현체)을 활용하여 계산량을 줄이면서 기능 재사용성을 향상시킵니다.
- 앵커 프리 탐지: 직전 버전들과 마찬가지로 YOLO11 앵커 프리 헤드를 YOLO11 수동 앵커 박스 클러스터링의 필요성을 제거함으로써 훈련 과정을 단순화합니다.
- 멀티태스크 헤드: 아키텍처는 통합 헤드 구조를 통해 다중 태스크를 원활하게 지원하도록 설계되어, 객체 탐지, 인스턴스 분할, 자세 추정 간에 끊김 없이 전환할 수 있습니다.
7
YOLOv7 가장 짧고 긴 기울기 경로를 효과적으로 제어하기 위해 "확장된 ELAN"(E-ELAN)을 YOLOv7 .
- E-ELAN: 기울기 경로를 파괴하지 않으면서 네트워크가 더 다양한 특징을 학습할 수 있도록 설계된 계산 블록.
- 모델 재매개변수화: 추론 과정에서 별도의 컨볼루션 레이어를 단일 레이어로 병합하기 위해 재매개변수화 기법(RepConv)을 활용하여, 훈련 정확도를 저하시키지 않으면서 속도를 향상시킵니다.
- 보조 헤드 거칠기-세밀도: 훈련 감독을 위한 보조 헤드를 도입합니다. 이는 모델의 심층 감독을 돕지만 훈련 파이프라인에 복잡성을 추가합니다.
YOLO26로의 진화
YOLO11 상당한 개선을 YOLO11 , 최신 YOLO26 은 한계를 더욱 확장합니다. 2026년 1월 출시된 YOLO26은 엔드투엔드 NMS 프리 ( End-to-End NMS-Free ) 설계를 특징으로 하여 후처리 필요성을 없애고 CPU 최대 43%까지 가속화합니다 . 또한 LLM 훈련에서 영감을 받은 MuSGD 최적화기를 채택하여 더 빠른 수렴을 실현합니다 .
교육 및 사용 편의성
개발자에게 모델의 "사용자 경험"—훈련, 검증, 배포의 용이성—은 종종 순수한 지표만큼 중요합니다.
Ultralytics 에코시스템의 이점
YOLO11 Python 완전히 YOLO11 "초보자부터 전문가까지"의 워크플로를 제공합니다.
- 통합 API: YOLO11, YOLOv8 또는 YOLO26 사이를 단일 문자열 변경으로 전환할 수 있습니다.
- 메모리 효율성: Ultralytics 많은 연구 저장소와 비교하여 훈련 중 CUDA 사용량을 줄이도록 최적화되었습니다. 이를 통해 소비자용 GPU에서 더 큰 배치 크기를 사용할 수 있습니다.
- 원클릭 내보내기: 다음과 같은 형식으로 내보내기 ONNX, TensorRT, CoreML 또는 TFLite 같은 형식으로의 TFLite 단일 명령 모드를 통해 TFLite .
from ultralytics import YOLO
# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for deployment
path = model.export(format="onnx")
YOLOv7
YOLOv7 독립형 저장소에 의존합니다. 강력하지만 종종 다음이 필요합니다:
- 수동 구성
.yaml앵커용 파일 (앵커 프리 버전을 사용하지 않을 경우). - 내보내기 전에 재매개변수화된 가중치를 병합하기 위한 특정 "배포" 스크립트.
- 훈련 중 보조 헤드 관리를 위한 보다 복잡한 명령줄 인수.
실제 응용 분야
YOLO11 선택해야 할 때
YOLO11 신뢰성과 유지보수가 핵심인 상업 및 산업용 애플리케이션에 최적의 YOLO11 .
- 엣지 AI: "나노" 및 "소형" 모델의 가용성 덕분에 YOLO11 스마트 카메라 및 제조 라인을 모니터링하는 IoT 기기에 YOLO11
- 다중 작업 프로젝트: 애플리케이션에서 객체 추적과 동시에 키포인트 추정(예: 스포츠 분석)이 필요한 경우, YOLO11 통합 프레임워크가 코드베이스를 단순화합니다.
- 신속한 프로토타이핑: 사용 편의성 덕분에 팀은 Ultralytics 활용해 맞춤형 데이터셋에 대해 신속하게 반복 작업을 수행할 수 있어 시장 출시 시간을 단축합니다.
7 선택해야 할 때
- 학술적 벤치마킹: 2022-2023년 문헌의 결과를 재현하거나 E-ELAN 아키텍처의 특정 효과를 연구하는 경우.
- 레거시 시스템: 기존 다크넷 스타일 YOLO 특정 입력/출력 구조와 이미 깊이 통합된 시스템들을 위한 것입니다.
결론
한편 YOLOv7 물체 탐지 역사에서 여전히 존경받는 이정표로 남아 있지만, YOLO11 는 보다 현대적이고 효율적이며 개발자 친화적인 솔루션을 제공합니다. 우수한 속도-정확도 비율, 낮은 메모리 요구 사항, 그리고 강력한 Ultralytics 지원을 바탕으로, YOLO11 실제 환경 배포를 위한 보다 명확한 길을 YOLO11 .
최첨단을 추구하는 분들께는 YOLO26를 살펴보시길 권합니다. 이 모델은 NMS(네트워크 다중 스레드) 없이 추론이 가능하며 차세대 최적화기를 탑재하여 기존 기반을 더욱 발전시켰습니다.
추가 자료
- YOLO11 :공식 문서
- YOLOv7 :훈련 가능한 프리비즈 백(Trainable bag-of-freebies)이 새로운 최첨단 성능을 제시하다
- Ultralytics :쉽게 훈련하고 배포하세요
- GitHub:Ultralytics 리포지토리