YOLOv5 YOLO: 포괄적인 기술 비교
실시간 컴퓨터 비전 분야는 정확성, 속도, 사용성의 완벽한 균형을 추구하는 연구자와 엔지니어들의 노력으로 지속적으로 진화하고 있습니다. 이 여정을 주도해 온 두 가지 주요 모델은 Ultralytics YOLOv5 와 알리바바의 YOLO.
이 가이드는 아키텍처, 성능 지표 및 훈련 방법론에 대한 심층적인 기술 분석을 제공하여 다음 배포에 적합한 모델을 선택하는 데 도움을 드립니다.
모델 배경
기술적 미묘한 차이를 자세히 살펴보기 전에, 이 영향력 있는 각 비전 모델의 기원과 주요 설계 철학을 이해하는 것이 중요합니다.
Ultralytics YOLOv5
Ultralytics의 Glenn Jocher와 팀이 개발한 YOLOv5는 출시 이후 업계 표준이 되었습니다. PyTorch 프레임워크를 기반으로 구축되어, 즉시 사용 가능한 간소화된 개발자 경험과 강력한 배포 기능을 우선시했습니다.
- 작성자: Glenn Jocher
- 조직:Ultralytics
- 날짜:26
- GitHub:https://github.com/ultralytics/yolov5
- 문서:Ultralytics 5 문서
DAMO-YOLO
Alibaba Group 연구원들이 개발한 DAMO-YOLO는 신경망 아키텍처 검색(NAS)과 고급 증류 기술에 중점을 둡니다. 이는 하드웨어별 성능의 이론적 한계를 확장하며, 극도의 튜닝이 필요한 연구 및 엣지 환경에 강력하게 부합합니다.
- 작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- 조직:조직: 알리바바 그룹
- 날짜:23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
아키텍처 혁신
두 모델 모두 고유한 구조적 개념을 활용하여 실시간 성능을 달성하지만, 접근 방식은 상당히 다릅니다.
YOLOv5: 안정성과 다용도성
YOLOv5 수정된 CSP(Cross Stage Partial) 백본과 PANet(Path Aggregation Network) 넥을 결합하여 YOLOv5 . 이 구조는 매우 효율적이며, CUDA 메모리 사용량을 극대화합니다.
YOLOv5 가장 큰 장점 중 하나는 다양한 작업에 걸친 다용도성입니다. 바운딩 박스 예측을 넘어, 이미지 분할 및 이미지 분류를 위한 전용 아키텍처를 제공하여 개발자가 단일하고 일관된 프레임워크를 중심으로 비전 파이프라인을 표준화할 수 있게 합니다.
DAMO-YOLO: 자동화된 아키텍처 탐색
DAMO-YOLO의 핵심 혁신은 MAE-NAS 백본입니다. Alibaba 팀은 다목적 진화 검색을 사용하여 detect 정확도와 추론 속도의 균형을 동적으로 맞추는 백본을 발견했습니다.
또한, Efficient RepGFPN 넥을 특징으로 하여 피처 융합을 개선합니다. 이는 위성 이미지 분석에서 흔히 볼 수 있는 복잡한 스케일 변화에 매우 유용합니다. ZeroHead 설계는 최종 예측 레이어를 단순화하여 지연 시간을 줄이지만, 이러한 복잡한 구조 생성은 아키텍처를 경직되게 만들고 사용자 지정 애플리케이션에 맞게 수정하기 어렵게 만들 수 있습니다.
메모리 요구 사항
트랜스포머 기반 아키텍처는 높은 VRAM 소비로 어려움을 겪는 경우가 많습니다. YOLOv5 YOLO 모두 효율적인 컨볼루션 설계를YOLO 메모리 사용량을 낮추지만, Ultralytics 특히 소비자용 GPU에 최적화되어 있어 독립 연구자나 스타트업이 훨씬 더 쉽게 접근할 수 있습니다.
성과 및 지표
실시간 객체 탐지기를 평가하려면 mAP 평균 정밀도), 추론 속도, 모델 크기 매개변수로 구성된 행렬을 살펴봐야 합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLO 특정 매개변수 개수에서 매우 경쟁력 있는 mAP YOLO , YOLOv5 탁월한 성능을 보여줍니다. TensorRT 속도와 놀라울 정도로 낮은 매개변수 수를 보여줍니다. 이러한 성능 균형 덕분에 YOLOv5 다양한 엣지 배포 시나리오에서 효율적으로 YOLOv5 .
교육 효율성 및 에코시스템
모델의 이론적 정확도는 실제 구현 가능성만큼만 유용합니다. 이 지점에서 모델들은 상당히 차이가 납니다.
증류의 복잡성
DAMO-YOLO는 다단계 학습 방법론에 크게 의존합니다. 이는 AlignedOTA로 알려진 교사-학생 지식 증류(knowledge distillation) 기술을 구현합니다. 이 기술은 학생 모델에서 최대 성능을 추출하지만, 초기에는 거대한 교사 모델을 학습해야 합니다. 이는 컴퓨팅 시간, 에너지 비용 및 필요한 하드웨어를 크게 증가시켜 민첩한 ML 팀에게 병목 현상을 초래합니다.
Ultralytics : 사용 편의성
반대로, Ultralytics 생태계는 직관적인 API와 학습 효율성으로 세계적으로 유명합니다. 활발한 개발과 방대한 오픈 소스 커뮤니티의 지원을 받아 개발자들은 모델을 원활하게 학습, 검증 및 배포할 수 있습니다.
from ultralytics import YOLO
# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")
Ultralytics Weights & Biases Comet 같은 도구를 통한 실험 추적에 대한 내장 지원을 제공하여 마찰 없는 워크플로를 구축합니다.
실제 사용 사례
- YOLOv5는 빠르게 변화하는 생산 환경에서 탁월합니다. 간편한 내보내기 기능 덕분에 스마트 소매 분석, 고속 제조 결함 detect 및 CoreML을 통한 모바일 애플리케이션 통합을 위한 최적의 선택입니다.
- DAMO-YOLO는 엄격한 학술 벤치마킹과, 특정 고정 하드웨어 목표를 위해 미미한 mAP 개선을 이끌어내는 것을 목표로 길고 정제된 훈련 실행을 수행할 수 있는 방대한 컴퓨팅 자원이 있는 시나리오에 매우 적합합니다.
사용 사례 및 권장 사항
YOLOv5와 DAMO-YOLO 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
5 선택해야 할 때
YOLOv5 다음과 같은 경우에 강력한 YOLOv5 :
- 검증된 프로덕션 시스템: YOLOv5의 오랜 안정성 기록, 광범위한 문서 및 대규모 커뮤니티 지원이 중요하게 평가되는 기존 배포 환경.
- 리소스 제약이 있는 훈련: YOLOv5의 효율적인 훈련 파이프라인과 낮은 메모리 요구 사항이 유리한 제한된 GPU 리소스 환경.
- 광범위한 내보내기 형식 지원: ONNX, TensorRT, CoreML 및 TFLite를 포함한 다양한 형식으로 배포해야 하는 프로젝트.
YOLO 선택해야 할 때
DAMO-YOLO는 다음 경우에 권장됩니다.
- 고처리량 비디오 분석: 배치-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리합니다.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
- 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화된 백본이 detect 성능에 미치는 영향 연구.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
- 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.
다음 진화: YOLO26
새로운 프로젝트를 시작한다면 미래를 내다보는 것이 매우 권장됩니다. Ultralytics YOLOv5 놀라운 기반 위에 구축되어, 최첨단 비전 AI를 재정의하는 혁신적인 발전을 통합합니다.
왜 YOLO26으로 업그레이드해야 할까요?
보편적인 찬사를 받으며 출시된 YOLO26은 본질적으로 엔드투엔드(end-to-end) 방식입니다. 엔드투엔드 NMS( NMS) 설계를 특징으로 하여, 비최대 억제(Non-Maximum Suppression) 후처리 과정을 완전히 제거함으로써 훨씬 빠르고 간편한 배포를 가능하게 합니다.
YOLO26 의 주요 혁신은 다음과 같습니다:
- MuSGD Optimizer: LLM 훈련 혁신에서 영감을 받은 SGD와 Muon의 이 하이브리드는 매우 안정적인 훈련과 빠른 수렴을 보장합니다.
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅에 고도로 최적화되어 전용 GPU 없이 작동하는 IoT 장치에 완벽합니다.
- ProgLoss + STAL: 항공 드론 이미지 및 로봇 공학에 필수적인 작은 객체 인식을 획기적으로 개선하는 고급 손실 함수.
- 작업별 개선 사항: Oriented Bounding Boxes (OBB)를 위한 특화된 각도 손실부터 정확한 자세 추정을 위한 Residual Log-Likelihood Estimation (RLE)까지, YOLO26은 복잡한 도메인을 쉽게 처리합니다.
결론
YOLOv5와 DAMO-YOLO 모두 객체 detect 역사에 확고한 자리를 잡았습니다. DAMO-YOLO는 신경 아키텍처 검색 및 증류에 대한 흥미로운 연구로 남아 있습니다. 그러나 잘 관리되는 생태계, 사용 편의성, 그리고 빠른 생산 경로를 우선시하는 조직에게는 Ultralytics 모델이 비할 데 없이 뛰어납니다.
차세대 모델(예: YOLO26)을 주석 처리하고, 훈련시키고, 배포하기 위해 Ultralytics 적극 활용하시길 권장합니다. 이를 통해 컴퓨터 비전 파이프라인이 미래에도 대응 가능하고, 빠르며, 놀라울 정도로 정확하도록 보장할 수 있습니다.
추가 자료
- 트랜스포머 기반 RT-DETR 를 고정밀 애플리케이션에 활용해 보십시오.
- 이전 세대에 대해 알아보기 YOLO11 모델에 대해 알아보세요.
- OpenVINO를 사용하여 배포를 최적화하는 방법을 알아보세요.