객체 탐지의 진화: YOLOv5 대 YOLOv7
컴퓨터 비전 분야는 지난 몇 년간 더 빠르고 정확한 실시간 객체 탐지에 대한 필요성으로 인해 급격히 발전해 왔습니다. 컴퓨터 비전 프로젝트를 위한 적절한 아키텍처를 선택할 때는 Ultralytics YOLOv5 및 YOLOv7과 같은 인기 모델 간의 미묘한 차이를 이해하는 것이 중요합니다. 이 종합적인 기술 비교에서는 정보에 입각한 결정을 내릴 수 있도록 각 아키텍처, 학습 방법론, 성능 지표 및 이상적인 배포 시나리오를 심도 있게 다룹니다.
한눈에 보기: 모델의 기원
이러한 모델의 기원과 설계 철학을 이해하면 각 아키텍처 선택에 대한 배경을 파악할 수 있습니다.
YOLOv5 세부 정보:
- 저자: Glenn Jocher
- 조직: Ultralytics
- 날짜: 2020-06-26
- GitHub: YOLOv5 리포지토리
- 문서: YOLOv5 문서
YOLOv7 상세 정보:
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 기관: 대만 중앙연구원 정보과학연구소
- 날짜: 2022-07-06
- Arxiv: YOLOv7 논문
- GitHub: YOLOv7 저장소
- 문서: YOLOv7 문서
이 모델들이 다른 모델과 어떻게 비교되는지 궁금하십니까? YOLOv5 대 YOLO11 또는 YOLOv7 대 EfficientDet과 같은 비교 자료를 확인하여 객체 탐지 생태계에 대한 이해를 넓혀 보십시오.
아키텍처 혁신 및 차이점
YOLOv5: 접근성의 표준
2020년 Ultralytics가 도입한 YOLOv5는 PyTorch 프레임워크를 기본적으로 활용함으로써 패러다임의 변화를 가져왔으며, 연구자와 개발자의 진입 장벽을 크게 낮추었습니다. 이 아키텍처는 Modified CSPDarknet53 백본에 의존하며, Cross Stage Partial (CSP) 네트워크를 통합하여 그래디언트 흐름을 유지하면서 매개변수 수를 줄였습니다.
이 모델의 가장 큰 장점 중 하나는 메모리 요구 사항입니다. 이전의 2단계 탐지기나 RT-DETR과 같은 무거운 Transformer 모델과 비교할 때, YOLOv5는 학습 중 훨씬 적은 CUDA 메모리를 사용하여 일반 소비자용 GPU에서도 더 큰 배치 크기를 지원합니다. 또한, 기본적으로 통합된 범용성은 이미지 분류, 객체 탐지 및 이미지 세그멘테이션을 원활하게 지원합니다.
YOLOv7: 실시간 정확도의 한계를 넘어서
2022년 중반에 출시된 YOLOv7은 MS COCO 벤치마크에서 실시간 탐지의 최첨단 경계를 넓히는 데 집중했습니다. 저자들은 원래의 그래디언트 경로를 훼손하지 않으면서 네트워크의 학습 능력을 향상시키는 E-ELAN(Extended Efficient Layer Aggregation Network)을 도입했습니다.
YOLOv7은 또한 "학습 가능한 bag-of-freebies"로 유명하며, 특히 학습 중 여러 모듈을 단일 합성곱 계층으로 변환하여 추론 속도를 높이면서도 정확도를 유지하는 재파라미터화(re-parameterization) 기술이 뛰어납니다. 그러나 이러한 복잡한 학습 방법론은 종종 더 가파른 학습 곡선을 유발하며, 기본 Ultralytics 생태계에 비해 내보내기 파이프라인이 덜 직관적일 수 있습니다.
성능 비교
이 모델들을 평가할 때는 속도, 정확도 및 계산 비용 간의 성능 균형이 가장 중요합니다. 아래는 MS COCO val2017 데이터셋을 기반으로 한 성능 지표 상세 비교입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv7이 더 큰 모델 변형에서 더 높은 절대 mAP 점수를 달성하는 반면, YOLOv5는 초소형 엣지 장치를 위한 Nano(YOLOv5n)부터 클라우드 추론을 위한 Extra-Large(YOLOv5x)에 이르기까지 타의 추종을 불허하는 다양한 모델 라인업을 제공합니다.
Ultralytics 생태계의 이점
모델의 유용성은 단순히 아키텍처 그 이상이며, 그 주변 생태계가 프로덕션 환경에 얼마나 빨리 배포될 수 있는지를 결정합니다. 이것이 바로 Ultralytics 모델이 빛을 발하는 지점입니다.
- 사용 편의성: Ultralytics Platform과 통합 Python API는 간소화된 사용자 경험, 간단한 구문 및 방대한 문서를 제공합니다. 사용자 지정 데이터셋을 학습하는 데 상용구 코드가 전혀 필요하지 않습니다.
- 잘 관리된 생태계: Ultralytics는 활발한 개발, 빈번한 업데이트 및 강력한 커뮤니티 지원의 이점을 누리고 있습니다. Comet ML 및 Weights & Biases와 같은 도구와의 통합이 내장되어 있습니다.
- 학습 효율성: 데이터 로더, 스마트 캐싱 및 다중 GPU 지원으로 Ultralytics 모델은 학습 효율이 매우 뛰어납니다. 즉시 사용 가능한 사전 학습된 가중치는 전이 학습을 획기적으로 가속화합니다.
코드 예제: 시작하기
Ultralytics를 사용하면 몇 줄의 코드만으로 모델을 배포할 수 있습니다. 다음 Python 스니펫은 권장되는 ultralytics 패키지를 사용하여 모델을 로드, 학습 및 추론하는 것이 얼마나 간단한지 보여줍니다.
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()이와 대조적으로 기존 YOLOv7 저장소를 활용하는 것은 일반적으로 복잡한 저장소를 클론하고, 종속성을 수동으로 관리하며, 긴 명령줄 인수를 사용해야 합니다.
실제 애플리케이션 및 이상적인 사용 사례
YOLOv7을 선택해야 하는 경우
YOLOv7은 최대 mAP가 유일한 목표이고 시스템이 이미 앵커 기반 출력 텐서에 맞게 조정된 학술 벤치마킹 또는 특정 레거시 GPU 파이프라인에 여전히 강력한 후보입니다. 그래디언트 경로 분석을 연구하는 연구자들은 종종 YOLOv7을 기준 모델로 활용합니다.
YOLOv5를 선택해야 할 때
YOLOv5는 뛰어난 안정성 덕분에 프로덕션 환경에서 매우 선호됩니다. 다음과 같은 분야에서 가장 선호되는 선택지입니다:
- 모바일 및 엣지 컴퓨팅: CoreML을 통한 iOS 또는 TFLite를 통한 Android로 YOLOv5n을 배포하는 경우입니다.
- 민첩한 스타트업: 데이터셋 관리 및 클라우드 학습을 위해 Ultralytics Platform의 원활한 통합이 필요한 팀이 빠른 반복 주기의 혜택을 누릴 수 있습니다.
- 다중 작업 환경: 객체 탐지, 분류 및 세그멘테이션을 동시에 수행해야 하는 시스템입니다.
미래: YOLO26으로의 전환
YOLOv5와 YOLOv7을 비교하는 것은 비전 AI의 진화를 이해하는 데 좋은 연습이지만, 최첨단 기술은 계속 발전하고 있습니다. 2026년 1월에 출시된 Ultralytics YOLO26은 획기적인 도약을 이뤄냈으며, 새로운 프로젝트에서 구형 아키텍처는 대부분 쓸모없게 되었습니다.
최고의 성능을 추구하는 개발자에게 YOLO26은 YOLOv5와 YOLOv7 모두에 비해 몇 가지 획기적인 장점을 제공합니다:
- 엔드 투 엔드 NMS 프리 설계: 비최대 억제(NMS) 후처리를 제거함으로써 YOLO26은 배포가 훨씬 간편해지고 더 빠르고 일관된 지연 시간을 제공합니다.
- MuSGD 최적화 도구: Moonshot AI의 LLM 혁신에서 영감을 받은 이 하이브리드 최적화 도구는 매우 안정적인 학습과 빠른 수렴을 제공합니다.
- 비교할 수 없는 엣지 속도: 엣지 환경에 맞게 특별히 최적화된 Nano 변형 모델은 DFL(Distribution Focal Loss)을 제거하여 최대 43% 빠른 CPU 추론을 자랑합니다.
- 탁월한 정확도: ProgLoss + STAL과 같은 새로운 손실 함수는 소형 객체 인식 성능을 크게 향상시켜 드론 영상 및 로봇 공학에 이상적입니다.
기존 YOLOv5 파이프라인을 유지 관리 중이든 최첨단 YOLO26을 구현하려 하든, Ultralytics Platform은 현대 컴퓨터 비전에서 성공하는 데 필요한 모든 도구를 제공합니다.