YOLOv7 YOLOv5: 실시간 탐지기의 기술적 비교

현대적인 컴퓨터 비전 파이프라인을 구축할 때, 정확도, 추론 속도, 자원 활용도 사이의 균형을 맞추기 위해서는 올바른 객체 탐지 아키텍처를 선택하는 것이 매우 중요합니다. 본 포괄적인 비교 분석은 컴퓨터 비전 분야에서 매우 영향력 있는 두 모델인 YOLOv7 Ultralytics YOLOv5 검토합니다.

아키텍처 차이, 성능 지표 및 이상적인 배포 시나리오를 분석하여 개발자와 연구자가 특정 요구 사항에 가장 적합한 모델을 선택하도록 돕는 것을 목표로 합니다.

모델 배경과 기원

이러한 모델의 기원을 이해하는 것은 그들의 설계 철학과 대상 사용 사례에 대한 맥락을 제공한다.

5

글렌 조커와 팀이 출시한 Ultralytics 팀이 2020년 6월 26일에 YOLOv5 네이티브 PyTorch 구현을 제공함으로써 성능 저하 없이 사용 편의성을 최우선으로 하여 해당 분야에 혁신을 가져왔습니다. 놀라울 정도로 간소화된 생태계와 안정적인 훈련 역학 덕분에 빠르게 업계 표준이 되었습니다. YOLOv5 저장소에서 소스 코드를 살펴보거나 Ultralytics 통해 모델에 직접 접근할 수 있습니다.

5에 대해 자세히 알아보기

7

2022년 7월 6일, 대만 중앙연구원 정보과학연구소의 왕천야오(Chien-Yao Wang), 알렉세이 보치코프스키(Alexey Bochkovskiy), 리아오홍위안(Hong-Yuan Mark Liao)이 소개함. YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)와 훈련 가능한 "bag-of-freebies" 같은 아키텍처 혁신에 YOLOv7 정확도 측면에서 최신 기술을 주도했습니다. 자세한 내용은 공식 Arxiv 논문과YOLOv7 저장소에서 확인할 수 있습니다. 원활한 통합을 위해 Ultralytics YOLOv7 참고하세요.

7에 대해 자세히 알아보기

끊김 없는 실험

이 두 모델 모두 Ultralytics python 패키지에 완벽하게 통합되어 있어, 코드에서 모델 문자열만 변경하면 모델 간에 전환할 수 있습니다!

아키텍처 혁신

Ultralytics YOLOv5

YOLOv5 수정된 CSPDarknet53 백본과 경로 집계 네트워크(PANet) 넥을 결합하여 YOLOv5 . 이 설계는 신속한 특징 추출과 메모리 효율성을 위해 고도로 최적화되었습니다. 기존 아키텍처나 무거운 트랜스포머 모델과 달리, YOLOv5 훈련 중 CUDA YOLOv5 현저히 적어 표준 소비자용 GPU에서 더 큰 배치 크기를 허용합니다. 또한 Ultralytics 기본적으로 표준 바운딩 박스를 넘어 이미지 분할 및 이미지 분류를 포함한 다양한 작업을 본질적으로 지원합니다.

YOLOv7

YOLOv7 여러 구조적 재매개변수화와 E-ELAN 아키텍처를 YOLOv7 네트워크가 원래 기울기 경로를 파괴하지 않으면서 더 다양한 특징을 학습할 수 있게 했습니다. 또한 훈련 중 중간 감독을 위한 보조 헤드를 구현합니다. 이러한 발전은 높은 평균 정밀도(mAP)를 제공하지만, 종종 복잡한 tensor 도입하여 ONNX 이나 TensorRT 으로의 내보내기를 Ultralytics 간소화된 내장 내보내기 방식에 비해 다소 어렵게 만들 수 있습니다.

성능 분석

이러한 모델들을 비교할 때 개발자는^mAPval, 추론 속도, 계산 복잡도(FLOPs) 간의 균형을 고려해야 합니다. 아래 표는 COCO 평가된 두 아키텍처의 성능을 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

주요 내용

정확도 상한: YOLOv7x는 인상적인 53.1 mAP^val로 가장 높은 전체 정확도를 달성하여, detect 성능 극대화가 주요 목표인 시나리오에서 매우 경쟁력이 있습니다.
속도 및 효율성: Ultralytics YOLOv5n은 효율성의 경이로움으로, 단 2.6M 매개변수의 작은 메모리 공간으로 번개처럼 빠른 추론 지연 시간 (T4 TensorRT에서 1.12ms)을 제공합니다. 이는 매우 제약적인 엣지 배포를 위한 비할 데 없는 선택입니다.
성능 균형: YOLOv5 시리즈는 탁월한 모델 스펙트럼을 제공합니다. YOLOv5l은 YOLOv7l에 비해 정확도에서 약간 뒤처지지만, 매우 성숙한 배포 파이프라인을 제공하여 훌륭한 중간 지점을 제시합니다.

Ultralytics 에코시스템의 이점

모델의 아키텍처는 절반에 불과하며, 이를 둘러싼 생태계가 실제 적용 가능성을 결정합니다. 바로 이 지점에서 Ultralytics 모델이 진정으로 빛을 발합니다.

사용 편의성: Ultralytics는 통합되고 매우 직관적인 Python API를 제공합니다. 광범위한 공식 문서의 지원을 받아 최소한의 상용구로 모델을 훈련, 검증 및 배포할 수 있습니다. 잘 관리되는 생태계: 활발한 개발은 지속적인 업데이트, 버그 수정 및 Weights & Biases와 같은 최신 추적 도구와의 원활한 통합을 보장합니다. 훈련 효율성: 최적화된 데이터 로더와 스마트 캐싱을 활용하여 YOLOv5는 훈련 시간을 획기적으로 단축합니다. 또한, 즉시 사용 가능한 사전 훈련된 가중치는 다양한 도메인에서 전이 학습을 가속화합니다.

코드 예시: 간소화된 학습

Ultralytics 사용하면 선택한 아키텍처와 관계없이 훈련 실행을 시작하는 과정이 사실상 동일합니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

이상적인 사용 사례

7 선택해야 할 때

학술적 벤치마킹: 잘 문서화된 2022년 기준선과 새로운 기술을 비교해야 하는 연구자에게 적합합니다.
고성능 GPU 클라우드 처리: 고밀도 장면에서 절대적으로 가장 높은 mAP를 달성하는 것이 내보내기 단순성보다 중요할 때 강력한 서버 하드웨어에 배포하는 경우.

5 선택해야 할 때

상용 배포: 높은 안정성, 간단한 모델 배포 옵션 및 광범위한 교차 플랫폼 호환성을 요구하는 상업용 애플리케이션에 이상적입니다.
엣지 장치: 더 작은 변형 모델(YOLOv5n 및 YOLOv5s)은 휴대폰 및 임베디드 시스템에서 탁월하게 작동합니다.
다중 작업 요구사항: 프로젝트가 단순한 detect에서 통합 프레임워크를 사용하여 포즈 추정 또는 segmentation으로 발전해야 하는 경우.

다른 아키텍처 탐구하기

더 최근 버전을 찾고 계신가요? 다음을 살펴보세요 Ultralytics YOLOv8 또는 Ultralytics YOLO11 를 통해 앵커 프리 탐지 및 다중 작업 학습 기능의 추가적인 발전을 이루었습니다.

차세대: Ultralytics

비전 AI 역사에서 YOLOv5 YOLOv7 중요한 위치를 YOLOv7 있지만, 기술 환경은 끊임없이 진화하고 있습니다. 2026년 1월 출시된 Ultralytics 모든 지표에서 이전 세대를 뛰어넘는 객체 탐지 기술의 최첨단을 대표합니다.

YOLO26에 대해 더 알아보기

YOLO26은 패러다임을 전환하는 여러 기능을 도입합니다:

종단 간 NMS-Free 설계: 이전 버전에서 개척된 개념을 기반으로, YOLO26은 기본적으로 종단 간 방식입니다. 이는 Non-Maximum Suppression (NMS) 후처리를 완전히 제거하여 지연 시간 병목 현상을 대폭 줄이고 배포 로직을 획기적으로 간소화합니다.
MuSGD Optimizer: Moonshot AI의 Kimi K2에서 영감을 받은 이 혁신적인 옵티마이저는 표준 SGD의 안정성과 Muon의 가속화된 모멘텀을 결합하여 고급 LLM 훈련 혁신을 컴퓨터 비전에 직접 도입합니다.
CPU 속도 향상: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써 YOLO26는 최대 43% 더 빠른 CPU 추론을 달성하여 엣지 및 저전력 IoT 장치 배포를 위한 독보적인 챔피언이 됩니다.
ProgLoss + STAL: 이러한 고급 손실 함수들은 작은 객체 인식에서 엄청난 개선을 가져오며, 이는 항공 이미지 및 정밀 로봇 공학에 중요합니다.
작업별 개선 사항: 마스크 생성을 위한 Semantic segmentation loss, 자세 track을 위한 Residual Log-Likelihood Estimation (RLE), 그리고 까다로운 Oriented Bounding Box (OBB) 경계 문제를 해결하기 위한 특화된 각도 손실을 제공합니다.

결론

YOLOv5와 YOLOv7 모두 실시간 객체 detect를 위한 강력한 솔루션을 제공합니다. YOLOv7은 고성능 하드웨어에서 순수 정확도를 위한 강력한 선택으로 남아 있으며, YOLOv5는 속도, 효율성 및 세계적 수준의 생태계의 탁월한 균형을 제공하는 궁극적인 개발자 친화적 도구로 돋보입니다.

그러나 개발자들이 파이프라인의 미래 대비를 도모하고 속도, 단순성, 최첨단 정확도의 궁극적 조합을 달성하고자 한다면, Ultralytics 마이그레이션을 적극 권장합니다. 이는 Ultralytics 전설적인 사용 편의성을 계승하면서도 획기적인 아키텍처 혁신을 제공합니다.