Link to this sectionYOLOv7 대 YOLOv5#
현대적인 컴퓨터 비전 파이프라인을 구축할 때, 정확도, 추론 속도, 리소스 활용 간의 균형을 맞추기 위해 올바른 객체 탐지 아키텍처를 선택하는 것은 매우 중요합니다. 이 종합적인 비교에서는 컴퓨터 비전 분야에서 매우 영향력 있는 두 모델인 YOLOv7과 Ultralytics YOLOv5를 살펴봅니다.
아키텍처의 차이점, 성능 지표, 이상적인 배포 시나리오를 분석하여 개발자와 연구자가 자신의 특정 요구 사항에 가장 적합한 모델을 선택할 수 있도록 돕고자 합니다.
Link to this section모델 배경 및 기원#
이 모델들의 기원을 이해하면 설계 철학과 목표 사용 사례에 대한 맥락을 파악할 수 있습니다.
Link to this sectionYOLOv5#
2020년 6월 26일 Ultralytics의 Glenn Jocher와 팀에 의해 출시된 YOLOv5는 성능 저하 없이 사용 편의성을 우선시하는 네이티브 PyTorch 구현을 제공함으로써 해당 분야를 혁신했습니다. 이 모델은 놀라울 정도로 간소화된 생태계와 안정적인 학습 동역학 덕분에 빠르게 업계 표준이 되었습니다. YOLOv5 GitHub 저장소에서 소스 코드를 탐색하거나 Ultralytics 플랫폼을 통해 직접 모델에 액세스할 수 있습니다.
Link to this sectionYOLOv7#
2022년 7월 6일 대만 중앙연구원 정보과학연구소의 Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao가 발표했습니다. YOLOv7은 정확도 면에서 최첨단 기술을 구현하기 위해 E-ELAN(Extended Efficient Layer Aggregation Networks)과 같은 아키텍처 혁신 및 학습 가능한 "bag-of-freebies"에 집중했습니다. 자세한 내용은 공식 Arxiv 논문과 YOLOv7 GitHub 저장소에서 확인할 수 있습니다. 원활한 통합을 위해 Ultralytics YOLOv7 문서를 참조하십시오.
두 모델 모두 Ultralytics Python 패키지에 완전히 통합되어 있어 코드에서 모델 문자열을 변경하기만 하면 모델 간에 쉽게 전환할 수 있습니다!
Link to this section아키텍처 혁신#
Link to this sectionUltralytics YOLOv5 설계#
YOLOv5는 수정된 CSPDarknet53 백본과 PANet(Path Aggregation Network) 넥을 사용합니다. 이 설계는 빠른 특징 추출과 메모리 효율성에 최적화되어 있습니다. 이전 아키텍처나 무거운 Transformer 모델과 달리, YOLOv5는 학습 중 CUDA 메모리 사용량이 훨씬 적어 표준 소비자급 GPU에서 더 큰 배치 크기를 사용할 수 있습니다. 또한 Ultralytics 프레임워크는 이미지 분할 및 이미지 분류를 포함하여 표준 경계 상자를 넘어선 광범위한 작업을 기본적으로 지원합니다.
Link to this sectionYOLOv7 설계#
YOLOv7은 몇 가지 구조적 재매개변수화와 E-ELAN 아키텍처를 도입하여 네트워크가 원래의 그래디언트 경로를 파괴하지 않으면서도 더 다양한 특징을 학습할 수 있도록 했습니다. 또한 학습 중 중간 감독을 위해 보조 헤드를 구현합니다. 이러한 발전으로 높은 mAP(mean Average Precision)를 달성하지만, 종종 복잡한 텐서 구조를 도입하여 ONNX나 TensorRT와 같은 에지 형식으로 내보내는 것이 Ultralytics 모델의 간소화된 내보내기 방식보다 더 까다로울 수 있습니다.
Link to this section성능 분석#
이 모델들을 비교할 때 개발자는 mAPval, 추론 속도 및 계산 복잡성(FLOPs) 사이에서 균형을 찾아야 합니다. 아래 표는 COCO 데이터셋에서 평가된 두 아키텍처의 성능을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this section핵심 요약#
- 정확도 상한: YOLOv7x는 53.1 mAPval이라는 인상적인 수치로 전체 정확도에서 최고를 달성하여, 탐지 성능을 극대화하는 것이 주된 목표인 시나리오에서 매우 경쟁력이 있습니다.
- 속도 및 효율성: Ultralytics YOLOv5n은 효율성의 정점으로, 2.6M 파라미터라는 작은 메모리 점유율로 번개처럼 빠른 추론 지연 시간(T4 TensorRT에서 1.12ms)을 제공합니다. 이는 매우 제한적인 에지 배포 환경에 탁월한 선택입니다.
- 성능 균형: YOLOv5 시리즈는 뛰어난 모델 구배를 제공합니다. YOLOv5l은 YOLOv7l보다 정확도 차이가 약간 나지만 매우 성숙한 배포 파이프라인을 제공하여 훌륭한 절충안을 제시합니다.
Link to this sectionUltralytics 생태계의 이점#
모델의 아키텍처는 방정식의 절반일 뿐이며, 그 주변 생태계가 실제 환경에서의 생존 가능성을 결정합니다. 이것이 바로 Ultralytics 모델이 진정으로 빛을 발하는 지점입니다.
사용 편의성: Ultralytics는 통합적이고 매우 직관적인 Python API를 제공합니다. 광범위한 공식 문서를 바탕으로 최소한의 보일러플레이트로 모델을 학습, 검증, 배포할 수 있습니다. 잘 관리된 생태계: 지속적인 개발을 통해 업데이트, 버그 수정, 그리고 Weights & Biases와 같은 최신 추적 도구와의 원활한 통합을 보장합니다. 학습 효율성: 최적화된 데이터 로더와 스마트 캐싱을 활용하여 YOLOv5는 학습 시간을 획기적으로 단축합니다. 또한 즉시 사용 가능한 사전 학습된 가중치는 다양한 도메인에 걸쳐 전이 학습을 가속화합니다.
Link to this section코드 예제: 간소화된 학습#
Ultralytics 패키지를 사용하면 어떤 아키텍처를 선택하든 학습 시작 과정이 사실상 동일합니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")Link to this section이상적인 사용 사례#
Link to this sectionYOLOv7을 선택해야 하는 경우#
- 학술적 벤치마킹: 잘 문서화된 2022년 기준 데이터와 새로운 기술을 비교해야 하는 연구자에게 완벽합니다.
- 고성능 GPU 클라우드 처리: 내보내기의 단순성보다 조밀한 장면에서 절대적으로 가장 높은 mAP를 달성하는 것이 더 중요한 강력한 서버 하드웨어에 배포할 때 유용합니다.
Link to this sectionYOLOv5를 선택해야 하는 경우#
- 프로덕션 배포: 높은 안정성, 직관적인 모델 배포 옵션 및 광범위한 교차 플랫폼 호환성을 필요로 하는 상용 애플리케이션에 이상적입니다.
- 에지 디바이스: 더 작은 변형 모델(YOLOv5n 및 YOLOv5s)은 휴대폰 및 임베디드 시스템에서 매우 잘 작동합니다.
- 다중 작업 요구 사항: 프로젝트가 단순 탐지에서 통합 프레임워크를 사용하는 포즈 추정이나 세분화로 발전해야 하는 경우에 적합합니다.
더 최근의 반복 모델을 찾고 계십니까? 앵커 프리 탐지 및 다중 작업 학습 기능의 추가 발전을 위해 Ultralytics YOLOv8 또는 Ultralytics YOLO11을 살펴보는 것을 고려하십시오.
Link to this section차세대: Ultralytics YOLO26#
YOLOv5와 YOLOv7은 비전 AI 역사에서 중요한 위치를 차지하지만, 환경은 끊임없이 진화하고 있습니다. 2026년 1월에 출시된 Ultralytics YOLO26은 모든 지표에서 이전 세대를 능가하며 객체 탐지 기술의 절대적인 최첨단을 보여줍니다.
YOLO26은 몇 가지 패러다임을 전환하는 기능을 도입했습니다:
- 엔드투엔드 NMS-Free 설계: 초기 반복 모델에서 개척된 개념을 기반으로 하는 YOLO26은 네이티브 엔드투엔드 모델입니다. 이로써 NMS(Non-Maximum Suppression) 후처리가 완전히 제거되어 지연 시간 병목 현상을 줄이고 배포 로직을 획기적으로 단순화합니다.
- MuSGD 옵티마이저: Moonshot AI의 Kimi K2에서 영감을 받은 이 혁신적인 옵티마이저는 표준 SGD의 안정성과 Muon의 가속화된 모멘텀을 결합하여 고급 LLM 학습 혁신을 컴퓨터 비전에 직접 적용합니다.
- 향상된 CPU 속도: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써 YOLO26은 CPU 추론 속도를 최대 43%까지 향상시켜 에지 및 저전력 IoT 디바이스 배포를 위한 독보적인 챔피언이 되었습니다.
- ProgLoss + STAL: 이러한 고급 손실 함수는 항공 이미지 및 정밀 로봇 공학에 필수적인 소형 객체 인식에서 엄청난 개선을 가져옵니다.
- 작업별 개선 사항: 마스크 생성을 위한 시맨틱 분할 손실, 포즈 추적을 위한 RLE(Residual Log-Likelihood Estimation), 그리고 까다로운 회전형 경계 상자(OBB) 경계 문제를 해결하기 위한 특수 각도 손실을 특징으로 합니다.
Link to this section결론#
YOLOv5와 YOLOv7은 모두 실시간 객체 탐지를 위한 강력한 솔루션을 제공합니다. YOLOv7은 고성능 컴퓨팅 하드웨어에서 원시 정확도를 위한 강력한 선택으로 남아 있으며, YOLOv5는 속도, 효율성 및 세계적 수준의 생태계의 탁월한 균형을 제공하는 궁극의 개발자 친화적 도구로 돋보입니다.
그러나 파이프라인을 미래 지향적으로 만들고 속도, 단순성, 최첨단 정확도의 궁극적인 조합을 달성하려는 개발자에게는 Ultralytics YOLO26으로 마이그레이션할 것을 강력히 권장합니다. 이는 Ultralytics 플랫폼의 전설적인 사용 편의성을 유지하면서 획기적인 아키텍처 혁신을 제공합니다.