콘텐츠로 건너뛰기

YOLOv7 YOLOv5: 자세한 기술 비교

올바른 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 프로젝트의 속도, 정확성 및 배포 가능성에 영향을 미치는 중요한 결정입니다. 이 페이지에서는 다음 간의 포괄적인 기술 비교를 제공합니다. YOLOv7Ultralytics YOLOv5YOLO 영향력 있는 두 가지 모델을 비교합니다. 아키텍처 혁신, 성능 벤치마크, 이상적인 사용 사례에 대해 자세히 살펴보고 애플리케이션에 가장 적합한 제품을 선택하는 데 도움을 드립니다.

YOLOv7 2022년에 상당한 학문적 발전을 이루었습니다, Ultralytics YOLOv5 는 탁월한 사용 편의성, 견고함, 배포 유연성으로 인해 여전히 업계에서 지배적인 위치를 차지하고 있습니다. 최고의 최신 성능을 원하는 분들을 위해 이러한 모델이 어떻게 최첨단으로 나아가는지 살펴봅니다. Ultralytics YOLO11.

성능 지표 비교

다음 표는 두 아키텍처 간의 성능 절충점을 강조합니다. YOLOv7 더 높은 평균 정밀도(mAP)를 추구하지만, YOLOv5 추론 속도와 특정 모델 크기에 대한 매개변수 수에서 뚜렷한 이점을 제공합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv7: 정확성의 한계를 뛰어넘다

2022년 7월에 출시된 YOLOv7 실시간 객체 감지기의 새로운 기준을 세우기 위해 설계되었습니다. 추론 비용을 크게 늘리지 않고 정확도를 향상시키기 위해 아키텍처 최적화에 중점을 두었습니다.

저자들: 저자: 왕치엔야오, 알렉세이 보흐코브스키, 홍위안 마크 리아오
조직:대만 학술원 정보과학연구소
날짜: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics

아키텍처 및 주요 혁신

YOLOv7 기능 학습을 개선하기 위한 몇 가지 복잡한 아키텍처 변경 사항을 도입했습니다:

  • E-ELAN(확장된 효율적인 계층 집계 네트워크): 최단 및 최장 경사 경로를 제어하여 네트워크의 학습 능력을 향상시키는 고급 백본 구조입니다. 이를 통해 모델이 더 다양한 기능을 학습할 수 있습니다.
  • 연결 기반 모델을 위한 모델 스케일링: 표준 스케일링과 달리 YOLOv7 연결 기반 아키텍처에 대해 깊이와 너비를 동시에 스케일링하여 최적의 리소스 활용을 보장합니다.
  • 훈련 가능한 백 오브 프리비: 여기에는 계획된 재파라미터화된 컨볼루션(RepConv)과 보조 헤드 트레이닝이 포함됩니다. 보조 헤드는 거칠고 세밀한 계층적 레이블을 생성하여 훈련 중에 학습 프로세스를 안내하지만 추론 중에 속도를 유지하기 위해 제거됩니다.

'공짜 가방'이란 무엇인가요?

"Bag of Freebies"는 추론 비용을 늘리지 않고도 객체 detect 모델의 정확도를 향상시키는 훈련 방법 및 데이터 증강 기술 모음을 의미합니다. YOLOv7에서는 Coarse-to-Fine Lead Guided Label Assignment와 같은 정교한 전략이 포함됩니다.

YOLOv7 이상적인 사용 사례

높은 정확도에 중점을 두기 때문에 YOLOv7 특히 다음과 같은 용도에 적합합니다:

  • 학술 연구: mAP 모든 부분이 중요한 SOTA 모델에 대한 벤치마킹.
  • 하이엔드 GPU 배포: 더 큰 모델 크기와 메모리 요구 사항을 처리할 수 있는 강력한 하드웨어(예: NVIDIA A100)를 사용할 수 있는 애플리케이션입니다.
  • 정적 분석: 고해상도 위성 이미지 분석이나 의료 스캔과 같이 실시간 지연 시간이 정밀도보다 덜 중요한 시나리오입니다.

YOLOv7 대해 자세히 알아보기

Ultralytics YOLOv5: 업계 표준

Ultralytics YOLOv5 가장 실용적이고 사용자 친화적인 물체 감지 모델 중 하나로 널리 알려져 있습니다. 2020년 출시 이후 속도, 정확성, 엔지니어링 우수성이 균형을 이룬 덕분에 수많은 상용 애플리케이션의 근간이 되었습니다.

저자 작성자: Glenn Jocher
조직:Ultralytics
날짜: 2020-06-26
깃허브yolov5
문서yolov5

아키텍처 및 에코시스템 이점

YOLOv5 다양한 배포 대상에 최적화된 CSP-Darknet53 백본과 PANet 넥 및 YOLOv3 헤드를 활용합니다. 하지만 진정한 강점은 Ultralytics 에코시스템에 있습니다:

  • 사용 편의성: '설치 후 실행' 철학으로 잘 알려진 YOLOv5 사용하면 개발자가 몇 분 안에 사용자 지정 데이터 세트에 대한 교육을 시작할 수 있습니다. API는 직관적이며 문서도 방대합니다.
  • 트레이닝 효율성: YOLOv5 일반적으로 더 복잡한 최신 아키텍처에 비해 훈련 시 CUDA 메모리가 덜 필요하므로 중급 GPU를 사용하는 개발자가 사용할 수 있습니다.
  • 배포 유연성: 원클릭 내보내기를 지원하여 ONNX, TensorRT, CoreML, TFLite 등으로의 클릭 내보내기를 지원하여 클라우드 서버부터 모바일 폰까지 모든 곳에 쉽게 배포할 수 있습니다.
  • 잘 관리된 에코시스템: 잦은 업데이트, 버그 수정 및 대규모 커뮤니티를 통해 Ultralytics 프로덕션 환경에서도 안정적이고 안전한 모델을 유지합니다.

YOLOv5 이상적인 사용 사례

YOLOv5 안정성과 속도가 요구되는 실제 시나리오에서 탁월한 성능을 발휘합니다:

  • 엣지 AI: 다음과 같은 기기에서 실행 NVIDIA Jetson 또는 가벼운 나노로 인해 라즈베리 파이(yolov5n) 및 Small (yolov5s) 버전을 사용합니다.
  • 모바일 애플리케이션: 온디바이스 추론을 위해 CoreML 및 TFLite 통해 iOS 및 Android 앱에 통합.
  • 신속한 프로토타이핑: 간소화된 워크플로우를 통해 컨셉에서 MVP로 빠르게 전환해야 하는 스타트업과 개발자는 이점을 누릴 수 있습니다.
  • 산업 자동화: 지연 시간과 안정성이 가장 중요한 제조 라인에서 신뢰할 수 있는 감지 기능을 제공합니다.

YOLOv5에 대해 자세히 알아보세요

자세한 비교 분석

YOLOv7 YOLOv5 중 하나를 결정할 때는 단순히 mAP 점수 외에도 여러 가지 기술적 요소가 고려됩니다.

1. 속도 대 정확도 상충 관계

YOLOv7 COCO 데이터 세트에서 더 높은 피크 정확도를 달성합니다. 예를 들어, YOLOv7x는 53.1%의 mAP 도달하는 반면, YOLOv5x는 50.7%에 그칩니다. 그러나 이는 복잡성이라는 대가를 치릅니다. YOLOv5 더 부드러운 모델 그라데이션을 제공하며, YOLOv5n (나노) 모델은 놀라울 정도로 빠르고(73.6ms CPU 속도) 가벼워(260만 파라미터) YOLOv7 동일한 세분성으로 명시적으로 목표로 하지 않는 초저자원 환경을 위한 틈새 시장을 창출합니다.

2. 구조 및 복잡도

YOLOv7 E-ELAN을 사용한 연결 기반 아키텍처를 채택하여 훈련 중에 필요한 메모리 대역폭을 증가시킵니다. 따라서 YOLOv5 훈련 속도가 느리고 메모리를 더 많이 사용할 수 있습니다. 반면, Ultralytics YOLOv5 훈련 효율에 고도로 최적화된 간소화된 아키텍처를 사용하여 더 빠른 컨버전스와 낮은 메모리 사용량을 지원하므로 컴퓨팅 예산이 제한된 엔지니어에게 큰 이점이 있습니다.

3. 사용성 및 개발자 경험

바로 이 부분에서 Ultralytics YOLOv5 진가가 빛을 발합니다. Ultralytics 프레임워크는 데이터 증강, 하이퍼파라미터 진화 및 실험 추적을 위한 강력한 도구와 함께 통합된 환경을 제공합니다.

import torch

# Example: Loading YOLOv5s from PyTorch Hub for inference
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Print results
results.print()

YOLOv7 Ultralytics 있지만, 프로덕션에 바로 사용할 수 있는 세련된 CI/CD 파이프라인, 광범위한 통합 가이드 및 커뮤니티 지원은 부족합니다.

4. 다재다능함

두 모델 모두 기본적으로 객체 감지 아키텍처이지만, YOLOv5 둘러싼 Ultralytics 에코시스템은 인스턴스 분할과 이미지 분류를 원활하게 지원하도록 발전해 왔습니다. YOLOv7 이러한 작업을 지원하지만 종종 다른 브랜치 또는 코드 포크가 필요한 반면, Ultralytics 보다 통합된 접근 방식을 제공합니다.

간편한 배포

Ultralytics 모델은 기본적으로 다양한 내보내기 형식을 지원합니다. 학습된 모델을 다음과 같이 쉽게 변환할 수 있습니다. TFLiteAndroid 쉽게 변환할 수 있습니다, CoreML 또는 iOSTensorRT 를 사용하여 간단한 CLI 명령 또는 Python 스크립트를 사용하여 최적화된 GPU 추론을 수행할 수 있습니다.

결론: 어떤 모델을 선택해야 할까요?

프로젝트의 우선순위에 따라 YOLOv7 YOLOv5 중 어떤 것을 선택할지 결정하세요:

  • 주요 제약 조건이 최대 정확도이고 추론 속도와 메모리 사용량이 부차적인 문제인 연구 환경이나 고급 하드웨어에서 작업하는 경우 YOLOv7 선택하세요.
  • 안정적이고 프로덕션에 바로 사용할 수 있는 솔루션이 필요하다면 Ultralytics YOLOv5 선택하세요. 사용 편의성, 효율적인 교육, 엣지 디바이스에서의 짧은 지연 시간, 대규모 지원 에코시스템으로 컴퓨터 비전 여정을 시작하는 대부분의 상용 애플리케이션 및 개발자에게 탁월한 선택입니다.

미래를 바라보며: YOLO11

YOLOv5 YOLOv7 훌륭한 모델이지만, 컴퓨터 비전 분야는 빠르게 변화하고 있습니다. YOLOv7 정확성과 YOLOv5속도/사용성 등 두 가지 장점을 모두 원하는 개발자에게는 다음을 살펴볼 것을 강력히 권장합니다. Ultralytics YOLO11.

YOLO11 훈련 파이프라인을 간소화하고 감지, 분할, 포즈 추정, 방향성 경계 상자(OBB) 등 모든 작업에서 성능을 향상시키는 앵커 프리 아키텍처를 특징으로 하는 최신 버전으로, 한 단계 더 진화했습니다.

다른 모델 살펴보기

YOLO 제품군의 다른 모델과 비교하고 싶다면 관련 페이지를 확인하세요:


댓글