콘텐츠로 건너뛰기

모델 비교: 물체 감지를 위한 YOLOv7 YOLOv8 비교

빠르게 진화하는 컴퓨터 비전 환경에서 "You Only Look Once"YOLO 모델 제품군은 실시간 물체 감지의 표준을 지속적으로 설정해 왔습니다. 이 계보에서 중요한 두 가지 이정표는 YOLOv7 Ultralytics YOLOv8. 두 모델 모두 출시 당시 정확도와 속도의 한계를 뛰어넘었지만, 서로 다른 설계 철학과 에코시스템 성숙도를 나타냅니다.

이 가이드는 개발자와 연구자가 학술 연구부터 프로덕션급 배포에 이르기까지 특정 요구 사항에 적합한 도구를 선택할 수 있도록 상세한 기술 비교를 제공합니다.

성능 지표 비교

다음 표는 주요 YOLOv7 YOLOv8 모델 간의 성능 메트릭을 직접 비교한 것입니다. YOLOv8 추론 속도와 매개변수 수에서 상당한 이점을 보여주며, 특히 엣지 AI 애플리케이션에 중요한 소규모 모델 변형에서 유리한 것으로 나타났습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOv7: '공짜 가방'의 진화

2022년 7월에 출시된 YOLOv7 YOLOv4와 YOLOR의 저자들이 주축이 되어 개발했습니다. "훈련 가능한 공짜 가방"이라는 개념으로 추론 비용을 늘리지 않고 훈련 프로세스를 최적화하기 위한 몇 가지 아키텍처 혁신을 도입했습니다.

  • 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
  • Organization: Institute of Information Science, Academia Sinica, Taiwan
  • 날짜: 2022-07-06
  • 링크:아카이브논문 | 깃허브 리포지토리

주요 아키텍처 기능

YOLOv7 확장된 효율적인 레이어 집계 네트워크(E-ELAN)를 도입했습니다. 이 아키텍처는 네트워크가 더 다양한 특징을 학습할 수 있도록 최단 및 최장 경사 경로를 제어합니다. 또한 아키텍처의 깊이와 폭을 동시에 수정하는 모델 스케일링 기술을 활용하여 다양한 크기에서 최적의 성능을 보장합니다.

출시 당시 인상적인 벤치마크를 기록했지만, YOLOv7 주로 객체 감지에 초점을 맞추고 있으며 최신 프레임워크에 비해 다른 작업에 대한 통합 지원은 미흡합니다.

YOLOv7 대해 자세히 알아보기

Ultralytics YOLOv8: 통합 프레임워크 및 최신 아키텍처

2023년 초 Ultralytics 출시한 YOLOv8 YOLO 아키텍처를 대대적으로 개편한 것입니다. 단순한 모델이 아니라 탐지, 인스턴스 세분화, 포즈 추정, 분류를 원활하게 수행할 수 있는 통합 프레임워크로 설계되었습니다.

아키텍처 혁신

YOLOv8 이전 버전( YOLOv7 포함)에서 사용했던 앵커 기반 감지 방식에서 벗어나 앵커가 없는 감지 메커니즘으로 전환했습니다. 이러한 변화로 인해 앵커 박스를 계산할 필요가 없어져 훈련 과정이 간소화되어 물체 모양과 크기의 변화에 대해 모델이 더욱 강력해졌습니다.

백본은 C3 모듈을 대체하는 C2f 모듈(두 개의 컨볼루션이 있는 교차 단계 부분 병목 현상)을 사용하도록 업그레이드되었습니다. YOLOv5. 이 변경으로 그라데이션 흐름이 개선되고 모델이 더 풍부한 피처 정보를 캡처하면서 경량화를 유지할 수 있게 되었습니다.

YOLOv8에 대해 자세히 알아보세요

자세한 기술 비교

앵커 기반 대 앵커 프리

가장 뚜렷한 차이점 중 하나는 감지 헤드입니다. YOLOv7 모델이 객체에 일치시키려고 시도하는 사전 정의된 모양인 앵커 박스에 의존합니다. 효과적이기는 하지만 사용자 지정 데이터 세트에 대한 하이퍼파라미터 조정이 필요합니다.

반면, YOLOv8 앵커가 없는 접근 방식을 사용하여 물체의 중심을 직접 예측합니다. 따라서 박스 예측 횟수가 줄어들어 비최대 억제NMS 속도가 빨라지고 수동 앵커 구성 없이도 다양한 데이터에 대한 모델 학습이 쉬워집니다.

교육 효율성 및 메모리 사용량

Ultralytics 모델은 엔지니어링 효율성으로 잘 알려져 있습니다. YOLOv8 훈련의 마지막 단계에서 모자이크 증강을 비활성화하는 스마트 데이터 증강 전략을 활용합니다. 이 기술은 훈련 손실을 안정화하고 정밀도를 향상시킵니다.

메모리 효율성

트랜스포머와 같은 복잡한 아키텍처에 비해 Ultralytics YOLOv8 중요한 장점(예 RT-DETR)에 비해 CUDA 메모리 요구량이 낮다는 점입니다. 이를 통해 사용자는 소비자용 GPU에서 더 큰 배치 크기를 훈련할 수 있으며, 최신 모델 훈련에 대한 액세스를 대중화할 수 있습니다.

에코시스템 및 사용 편의성

YOLOv7 강력한 리서치 저장소인 반면, Ultralytics YOLOv8 세련된 제품 경험을 제공합니다. Ultralytics 에코시스템이 제공합니다:

  1. 간소화된 API: 모든 작업을 위한 일관된 Python 인터페이스.
  2. 배포: 내보내기 모드를 통해 클릭 한 번으로 ONNX, TensorRT, CoreML, TFLite 같은 형식으로 내보낼 수 있습니다.
  3. 커뮤니티 지원: 활발한 Discord 커뮤니티와 잦은 업데이트를 통해 최신 PyTorch 버전과의 호환성을 보장합니다.

코드 비교

추론을 실행하는 데 필요한 코드를 비교하면 사용성 격차가 분명하게 드러납니다. Ultralytics 로우코드 접근 방식을 우선시하여 개발자가 최소한의 오버헤드로 비전 AI를 애플리케이션에 통합할 수 있도록 지원합니다.

Python YOLOv8 실행하기

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
for result in results:
    result.show()

CLI 구현

또한 명령줄에서 직접 YOLOv8 실행할 수 있어 파이프라인 통합과 빠른 테스트를 간소화하는 기능도 있습니다.

# Detect objects in an image using the nano model
yolo predict model=yolov8n.pt source='https://ultralytics.com/images/zidane.jpg' imgsz=640

이상적인 사용 사례

YOLOv7 사용 시기

2022/2023 표준을 벤치마킹하거나 다크넷 스타일 아키텍처를 중심으로 구축된 레거시 시스템을 유지하려는 연구자에게 YOLOv7 여전히 실용적인 선택입니다. 이 '공짜 가방' 접근 방식은 신경망 최적화 전략을 연구하는 사람들에게 흥미로운 인사이트를 제공합니다.

YOLOv8 사용 시기

YOLOv8 다음을 포함한 대부분의 신규 프로젝트에 권장되는 선택입니다:

  • 실시간 애플리케이션: YOLOv8n (나노) 모델은 놀라운 속도( CPU 약 80ms)를 제공하므로 모바일 앱과 임베디드 시스템에 적합합니다.
  • 멀티태스크 파이프라인: 감지와 함께 포즈 추정 또는 세분화가 필요한 프로젝트는 단일 API를 사용할 수 있습니다.
  • 상용 배포: 강력한 내보내기 호환성을 통해 PyTorch 학습된 모델을 TensorRT 또는 OpenVINO 사용하는 프로덕션 환경에 효율적으로 배포할 수 있습니다.

결론

YOLOv7 학습 가능한 파라미터를 최적화하여 컴퓨터 비전 분야에 큰 기여를 했습니다, Ultralytics YOLOv8 은 실용적인 AI 개발을 위한 최신 표준을 제시합니다.

속도와 정확성의 탁월한 균형이 돋보이는 YOLOv8 앵커가 필요 없는 설계와 광범위한 Ultralytics 지원 에코시스템과 결합되어 초보자에게는 더 쉽게 접근하고 전문가에게는 더 강력한 기능을 제공합니다. 확장 가능하고 유지 관리가 용이한 고성능 비전 애플리케이션을 구축하려는 개발자에게는 YOLOv8그 후속 제품인 다음과 같은 제품이 적합합니다. YOLO11-과 같은 후속 버전은 가장 매력적인 길을 제시합니다.

추가 자료

물체 감지의 최신 기술을 살펴보고 싶다면 다음과 같은 관련 모델을 검토해 보세요:

  • YOLO11: 더욱 향상된 효율성을 위해 아키텍처를 개선한 Ultralytics 최신 버전입니다.
  • YOLOv6: 산업용 애플리케이션에 초점을 맞춘 또 다른 앵커 프리 모델입니다.
  • YOLOv9: 딥 네트워크 학습을 위한 프로그래머블 그라디언트 정보(PGI)에 중점을 둡니다.

댓글