Link to this sectionYOLO11 vs YOLOv5: Ultralytics 아키텍처에 대한 포괄적인 기술 비교#
올바른 신경망 아키텍처를 선택하는 것은 모든 computer vision 프로젝트의 핵심적인 결정 사항입니다. artificial intelligence 분야가 발전함에 따라 개발자와 연구자가 사용할 수 있는 도구도 함께 발전하고 있습니다. 본 포괄적인 가이드는 Ultralytics 생태계의 기념비적인 두 모델인, 널리 알려진 YOLOv5와 최첨단 YOLO11 사이의 심층적인 기술적 비교를 제공합니다.
edge AI 애플리케이션용 경량 모델을 배포하든 클라우드 GPU에서 고해상도 비디오 스트림을 처리하든, 아키텍처적 특성, performance metrics 및 각 모델의 이상적인 사용 사례를 이해하면 특정 배포 제약 조건에 맞춰 데이터 기반의 선택을 내릴 수 있습니다.
Link to this section모델 계보 및 기술 세부 정보#
두 모델 모두 오픈 소스 협업, 강력한 성능, 타의 추종을 불허하는 사용 편의성에 대한 Ultralytics의 헌신을 반영하며, 전 세계 머신 러닝 커뮤니티에서 높은 평가를 받고 있습니다.
Link to this sectionYOLO11 세부 정보#
- 저자: Glenn Jocher 및 Jing Qiu
- 조직: Ultralytics
- 날짜: 2024-09-27
- GitHub: ultralytics/ultralytics
- 문서: YOLO11 Documentation
Link to this sectionYOLOv5 세부 정보#
- 저자: Glenn Jocher
- 조직: Ultralytics
- 날짜: 2020-06-26
- GitHub: ultralytics/yolov5
- 문서: YOLOv5 Documentation
Link to this section아키텍처 차이점#
YOLOv5에서 YOLO11로의 진화는 정확도와 파라미터 효율성을 최적화하기 위해 설계된 몇 가지 심오한 아키텍처 변화를 도입했습니다.
YOLOv5는 PyTorch 생태계의 선구자로서, 고도로 최적화된 CSPNet(Cross Stage Partial Network) 백본과 PANet(Path Aggregation Network) 넥을 도입했습니다. 이 모델은 앵커 기반 감지 방식에 의존했으며, 객체 경계를 예측하기 위해 사전에 정의된 anchor boxes가 필요했습니다. 매우 효과적이었지만, 맞춤형 computer vision datasets에 대해 이러한 앵커를 튜닝하는 것은 번거로울 수 있었습니다.
In contrast, YOLO11 transitions to a more modern, anchor-free detection paradigm. This eliminates the need for manual anchor box tuning, streamlining the training process and improving generalization across diverse datasets like the COCO dataset. Additionally, YOLO11 features a decoupled head, meaning classification and bounding box regression tasks are processed in separate branches. This separation significantly improves convergence speed and mean Average Precision (mAP), particularly for complex object detection scenarios.
Link to this section성능 지표 및 벤치마크#
아래 표는 다양한 모델 크기에 따른 주요 지표를 비교합니다. Ultralytics 모델은 메모리 요구 사항 면에서 정평이 나 있으며, 일반적으로 무거운 Transformer 기반 대안과 비교하여 학습 중 CUDA 메모리 사용량이 적어 하드웨어 진입 장벽을 크게 낮춥니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
보시다시피, YOLO11은 성능의 균형이 매우 뛰어나며, YOLOv5 대응 모델과 유사한 파라미터 수에서 지속적으로 더 높은 mAP 점수를 제공합니다.
Link to this section학습 방법론 및 사용성#
Ultralytics 철학의 핵심 신조는 잘 관리된 생태계와 광범위한 커뮤니티 지원을 바탕으로 한 탁월한 사용 편의성입니다.
YOLOv5는 역사적으로 실행을 위해 강력한 CLI(Command-Line Interface) 스크립트(train.py, detect.py)에 의존했습니다. 이 스크립트들은 강력했지만, 직접 사용자 정의 Python 애플리케이션에 통합하려면 종종 우회적인 방법이 필요했습니다.
YOLO11 revolutionized this by introducing the streamlined ultralytics Python package. This unified API handles everything from training to exporting models formats like ONNX, OpenVINO, and TensorRT natively.
완벽한 노코드(no-code) 경험을 위해 개발자는 Ultralytics Platform을 사용하여 데이터를 어노테이션하고, 클라우드에서 모델을 학습시키며, 엣지 장치에 원활하게 배포할 수 있습니다.
Link to this section코드 비교#
오늘날 Ultralytics 모델을 학습시키는 것은 매우 효율적입니다. 네이티브 Python API를 사용하여 YOLO11을 학습시키는 방법은 다음과 같습니다:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")YOLOv5를 사용하는 레거시 시스템의 경우, CLI를 통한 학습은 다음과 같습니다:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.ptLink to this section이상적인 사용 사례 및 실제 애플리케이션#
두 모델 모두 서로 다른 운영 환경에 맞춘 고유한 강점을 가지고 있습니다.
Link to this sectionYOLOv5를 활용해야 할 때#
더 최신 세대임에도 불구하고 YOLOv5는 여전히 강력한 성능을 자랑합니다. 다음과 같은 경우에 적극 권장됩니다:
- 레거시 시스템 통합: 쉽게 리팩토링할 수 없는 YOLOv5의 특정 텐서 구조나 배포 파이프라인과 깊이 통합된 환경.
- 학술적 베이스라인: medical image analysis 분야의 재현 가능한 학술 연구를 위해 확립된, 장기간 검증된 베이스라인이 필요한 연구자.
Link to this sectionYOLO11을 활용해야 할 때#
YOLO11은 놀라운 범용성 덕분에 현대적인 프로덕션 파이프라인을 위한 이상적인 선택입니다:
- 멀티 태스크 환경: 주로 감지기 역할을 하는 YOLOv5(추후 세그멘테이션 추가)와 달리, YOLO11은 instance segmentation, image classification, pose estimation 및 Oriented Bounding Box (OBB) 감지를 기본적으로 지원합니다.
- 고밀도 비디오 분석: 복잡한 장면에서 최대 정밀도를 추출하는 것이 중요한 지능형 교통 시스템이나 retail inventory management에 이상적입니다.
Link to this section향후 전망: YOLO26 아키텍처#
YOLO11이 뛰어난 표준으로 자리 잡고 있지만, 컴퓨터 비전의 최전선은 계속해서 빠르게 발전하고 있습니다. 최고의 효율성을 추구하는 개발자라면 최신 Ultralytics YOLO26(2026년 1월 출시)을 고려해야 합니다.
YOLO26은 엣지 최적화와 엔터프라이즈 규모 모두를 위해 명시적으로 설계된 거대한 도약을 의미합니다. 주요 혁신 사항은 다음과 같습니다:
- 종단간(End-to-End) NMS-Free 설계: YOLO26은 기본적으로 종단간 설계를 채택하여 더 빠르고 간단한 배포를 위해 Non-Maximum Suppression (NMS) 후처리를 제거했습니다.
- DFL 제거: 모델 내보내기를 단순화하고 저전력 장치와의 호환성을 향상시키기 위해 Distribution Focal Loss(DFL)가 제거되었습니다.
- MuSGD 옵티마이저: SGD와 Muon의 획기적인 하이브리드로, 더 빠른 수렴을 위해 컴퓨터 비전에 LLM 학습 안정성을 가져왔습니다.
- 최대 43% 더 빠른 CPU 추론: IoT 배포 및 전용 GPUs가 없는 장치를 위해 강력하게 최적화되었습니다.
- ProgLoss + STAL: 소형 객체 인식에서 현저한 개선을 가져오는 획기적으로 개선된 손실 함수로, 공중 드론 이미지 분석에 필수적입니다.
Link to this section요약#
YOLO11과 YOLOv5 사이의 선택은 궁극적으로 프로젝트의 수명 주기 단계에 달려 있습니다. YOLOv5의 레거시는 부인할 수 없으며 극도의 안정성과 방대한 커뮤니티 지원을 제공합니다. 그러나 모든 신규 프로젝트의 경우, 이전 세대보다 YOLO11을 강력히 권장합니다. 이는 최첨단 정확도, 매우 우아한 Python API, 더 낮은 학습 메모리 오버헤드를 결합하여 AI 혁신의 최전선에서 Ultralytics의 위치를 공고히 합니다. 경계를 더욱 확장하고자 하는 분들을 위해 Ultralytics Platform에서 최첨단 YOLO26을 살펴보시면 타의 추종을 불허하는 결과를 얻을 수 있을 것입니다.