YOLOv7 YOLOv5: 실시간 탐지기의 기술적 비교
현대적인 컴퓨터 비전 파이프라인을 구축할 때, 정확도, 추론 속도, 자원 활용도 사이의 균형을 맞추기 위해서는 올바른 객체 탐지 아키텍처를 선택하는 것이 매우 중요합니다. 본 포괄적인 비교 분석은 컴퓨터 비전 분야에서 매우 영향력 있는 두 모델인 YOLOv7 Ultralytics YOLOv5 검토합니다.
아키텍처적 차이점, 성능 지표 및 이상적인 배포 시나리오를 분석함으로써, 개발자와 연구자들이 특정 요구사항에 가장 적합한 모델을 선택할 수 있도록 돕는 것을 목표로 합니다.
모델 배경과 기원
이러한 모델의 기원을 이해하는 것은 그들의 설계 철학과 대상 사용 사례에 대한 맥락을 제공한다.
5
글렌 조커와 팀이 출시한 Ultralytics 팀이 2020년 6월 26일에 YOLOv5 네이티브 PyTorch 구현을 제공함으로써 성능 저하 없이 사용 편의성을 최우선으로 하여 해당 분야에 혁신을 가져왔습니다. 놀라울 정도로 간소화된 생태계와 안정적인 훈련 역학 덕분에 빠르게 업계 표준이 되었습니다. YOLOv5 저장소에서 소스 코드를 살펴보거나 Ultralytics 통해 모델에 직접 접근할 수 있습니다.
7
2022년 7월 6일, 대만 중앙연구원 정보과학연구소의 왕천야오(Chien-Yao Wang), 알렉세이 보치코프스키(Alexey Bochkovskiy), 리아오홍위안(Hong-Yuan Mark Liao)이 소개함. YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)와 훈련 가능한 "bag-of-freebies" 같은 아키텍처 혁신에 YOLOv7 정확도 측면에서 최신 기술을 주도했습니다. 자세한 내용은 공식 Arxiv 논문과YOLOv7 저장소에서 확인할 수 있습니다. 원활한 통합을 위해 Ultralytics YOLOv7 참고하세요.
끊김 없는 실험
이 두 모델 모두Python 완전히 통합되어 있어, 코드에서 모델 문자열만 변경하면 간단히 모델을 전환할 수 있습니다!
아키텍처 혁신
Ultralytics YOLOv5
YOLOv5 수정된 CSPDarknet53 백본과 경로 집계 네트워크(PANet) 넥을 결합하여 YOLOv5 . 이 설계는 신속한 특징 추출과 메모리 효율성을 위해 고도로 최적화되었습니다. 기존 아키텍처나 무거운 트랜스포머 모델과 달리, YOLOv5 훈련 중 CUDA YOLOv5 현저히 적어 표준 소비자용 GPU에서 더 큰 배치 크기를 허용합니다. 또한 Ultralytics 기본적으로 표준 바운딩 박스를 넘어 이미지 분할 및 이미지 분류를 포함한 다양한 작업을 본질적으로 지원합니다.
YOLOv7
YOLOv7 여러 구조적 재매개변수화와 E-ELAN 아키텍처를 YOLOv7 네트워크가 원래 기울기 경로를 파괴하지 않으면서 더 다양한 특징을 학습할 수 있게 했습니다. 또한 훈련 중 중간 감독을 위한 보조 헤드를 구현합니다. 이러한 발전은 높은 평균 정밀도(mAP)를 제공하지만, 종종 복잡한 tensor 도입하여 ONNX 이나 TensorRT 으로의 내보내기를 Ultralytics 간소화된 내장 내보내기 방식에 비해 다소 어렵게 만들 수 있습니다.
성능 분석
이러한 모델들을 비교할 때 개발자는mAPval, 추론 속도, 계산 복잡도(FLOPs) 간의 균형을 고려해야 합니다. 아래 표는 COCO 평가된 두 아키텍처의 성능을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
주요 내용
- 정확도 상한선: YOLOv7x는 인상적인 53.1mAPval로 최고 수준의 종합 정확도를 달성하여, 탐지 성능 극대화가 주요 목표인 시나리오에서 매우 경쟁력 있는 성능을 보여줍니다.
- 속도와 효율성: Ultralytics 효율성의 경이로움으로, 2.6M 매개변수라는 극소량의 메모리 사용량으로 번개처럼 빠른 추론 지연 시간 (T4 TensorRT 기준 1.12ms)을 제공합니다. 이는 극도로 제한된 에지 배포 환경에 있어 타의 추종을 불허하는 선택지입니다.
- 성능 균형: YOLOv5 뛰어난 성능 곡선을 보여주는 모델들을 제공합니다. YOLOv5l은 탁월한 중간 지점을 제시하며, 정확도 측면에서 YOLOv7l에 약간 뒤지지만 매우 성숙한 배포 파이프라인을 제공합니다.
Ultralytics 에코시스템의 이점
모델의 구조는 방정식의 절반에 불과합니다. 주변 생태계가 실제 적용 가능성을 결정합니다. 바로 여기서 Ultralytics 진가를 발휘합니다.
사용 편의성: Ultralytics 통합되고 매우 직관적인 Python Ultralytics . 방대한 공식 문서의 지원을 받아 최소한의 보일러플레이트로 모델을 훈련, 검증 및 배포할 수 있습니다. 잘 관리되는 생태계: 활발한 개발로 지속적인 업데이트, 버그 수정 및 다음과 같은 최신 추적 도구와의 원활한 통합이 보장됩니다. Weights & Biases과 같은 최신 추적 도구와의 원활한 통합을 보장합니다. 훈련 효율성: 최적화된 데이터 로더와 스마트 캐싱을 활용하여 YOLOv5 훈련 시간을 YOLOv5 단축합니다. 또한 즉시 사용 가능한 사전 훈련된 가중치는 다양한 도메인 간 전이 학습을 가속화합니다.
코드 예시: 간소화된 훈련
Ultralytics 사용하면 선택한 아키텍처와 관계없이 훈련 실행을 시작하는 과정이 사실상 동일합니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")
이상적인 사용 사례
7 선택해야 할 때
- 학술적 벤치마킹: 2022년 기준선과 비교하여 새로운 기법을 검증해야 하는 연구자에게 이상적입니다.
- 고성능 GPU 처리: 고밀도 mAP 절대적인 최고 mAP 달성률이 내보내기 편의성보다 우선시되는 강력한 서버 하드웨어에 배포할 때.
5 선택해야 할 때
- 생산 배포: 높은 안정성, 간편한 모델 배포 옵션, 광범위한 크로스 플랫폼 호환성이 필요한 상업용 애플리케이션에 이상적입니다.
- 에지 디바이스: 소형 변형 모델(YOLOv5n 및 YOLOv5s)은 모바일 기기와 임베디드 시스템에서 매우 우수한 성능을 발휘합니다.
- 다중 작업 요구사항: 프로젝트가 단순 탐지에서 자세 추정 또는 분할로 발전해야 하며, 이를 통합된 프레임워크를 통해 수행해야 하는 경우.
다른 아키텍처 탐구하기
더 최근 버전을 찾고 계신가요? 다음을 살펴보세요 Ultralytics YOLOv8 또는 Ultralytics YOLO11 를 통해 앵커 프리 탐지 및 다중 작업 학습 기능의 추가적인 발전을 이루었습니다.
차세대: Ultralytics
비전 AI 역사에서 YOLOv5 YOLOv7 중요한 위치를 YOLOv7 있지만, 기술 환경은 끊임없이 진화하고 있습니다. 2026년 1월 출시된 Ultralytics 모든 지표에서 이전 세대를 뛰어넘는 객체 탐지 기술의 최첨단을 대표합니다.
YOLO26은 패러다임을 전환하는 여러 기능을 도입합니다:
- 엔드투엔드 NMS 설계: 이전 버전에서 개척된 개념을 기반으로, YOLO26은 본질적으로 엔드투엔드 구조를 갖습니다. 이는 비최대 억제(NMS) 후처리 단계를 완전히 제거하여 지연 시간 병목 현상을 해소하고 배포 로직을 획기적으로 단순화합니다.
- MuSGD 최적화기: Moonshot AI의 Kimi K2에서 영감을 받은 이 혁신적인 최적화기는 SGD 안정성과 뮤온의 가속 SGD , 고급 LLM 훈련 혁신을 컴퓨터 비전 분야에 직접 도입합니다.
- 향상된 CPU : 분포 초점 손실(DFL)을 전략적으로 제거함으로써 YOLO26은 최대 43% 더 빠른 CPU 달성하여, 에지 및 저전력 IoT 기기 배포 분야에서 확실한 챔피언으로 자리매김했습니다.
- ProgLoss + STAL: 이러한 고급 손실 함수는 항공 이미징 및 정밀 로봇 공학에 중요한 소형 물체 인식 성능을 획기적으로 향상시킵니다.
- 작업별 개선 사항: 마스크 생성을 위한 의미적 분할 손실, 자세 추적을 위한 잔차 로그 가능도 추정(RLE), 까다로운 방향성 경계 상자(OBB) 경계 문제를 해결하기 위한 특수 각도 손실을 특징으로 합니다.
결론
YOLOv5 YOLOv7 모두 실시간 객체 탐지를 위한 강력한 솔루션을 YOLOv7 . YOLOv7 고성능 컴퓨팅 하드웨어에서 순수 정확도 측면에서 YOLOv7 강력한 선택지인 반면, YOLOv5 속도, 효율성, 그리고 세계적 수준의 생태계가 탁월하게 조화된 개발자 친화적인 도구로서 YOLOv5 .
그러나 개발자들이 파이프라인의 미래 대비를 도모하고 속도, 단순성, 최첨단 정확도의 궁극적 조합을 달성하고자 한다면, Ultralytics 마이그레이션을 적극 권장합니다. 이는 Ultralytics 전설적인 사용 편의성을 계승하면서도 획기적인 아키텍처 혁신을 제공합니다.