YOLOv7 YOLOv8: 실시간 탐지기의 기술적 비교

컴퓨터 비전의 급속한 발전은 개발자와 연구자에게 다양한 강력한 도구를 제공했습니다. 객체 탐지 파이프라인에 적합한 아키텍처를 결정할 때는 기존 모델을 비교하는 것이 필수적입니다. 본 기술 가이드에서는 두 가지 매우 영향력 있는 모델인 YOLOv7 YOLOv8 아키텍처, 성능 지표 및 이상적인 사용 사례에 대해 심층적으로 살펴봅니다.

아키텍처 소개

두 모델 모두 성능 면에서 상당한 발전을 나타내지만, 딥러닝 신경망 최적화 문제에 접근하는 방식은 서로 다른 구조적 철학에서 비롯됩니다.

YOLOv7: 프리비즈 백의 선구자

2022년 중반에 소개된 YOLOv7 고급 하드웨어에서 실시간 탐지의 한계를 넘어서기 위해 아키텍처적 그라디언트 경로 최적화와 "훈련 가능한 프리비즈 백(trainable bag-of-freebies)" 개념에 중점을 YOLOv7

저자: 왕천야오, 알렉세이 보치코프스키, 리아오홍위안 마크
기관: 대만 중앙연구원 정보과학연구원
날짜: 2022-07-06
아카이브: 2207.02696
GitHub: WongKinYiu/yolov7
문서: Ultralytics YOLOv7 문서

아키텍처 주요 특징: YOLOv7은 주로 앵커 기반 detect 헤드를 활용하며(앵커 프리 브랜치를 실험하기도 했지만) 확장 효율 계층 집계 네트워크(E-ELAN)를 도입합니다. 이 설계는 원래의 그라디언트 경로를 손상시키지 않으면서 네트워크의 학습 능력을 향상시킵니다. 서버급 GPU에서 탁월한 성능을 발휘하여 고성능 비디오 분석에 매우 적합합니다.

장점 및 단점: YOLOv7은 전용 하드웨어에서 우수한 지연 시간을 달성하지만, 그 생태계는 매우 파편화되어 있습니다. 학습에는 복잡한 명령줄 인수, 수동 저장소 복제, PyTorch에서의 엄격한 종속성 관리가 필요합니다. 또한, 학습 중 메모리 요구 사항은 소비자 하드웨어에서 엄청날 수 있습니다.

7에 대해 자세히 알아보기

Ultralytics YOLOv8: 다용도 표준

2023년 초 출시된 YOLOv8 최첨단 정확도뿐만 아니라 통합되고 즉시 생산 환경에 적용 가능한 프레임워크를 제공하는 데 중점을 두어 개발자 경험을 YOLOv8 재정의했습니다.

저자: 글렌 조커, 아유시 차우라시아, 징 치우
조직: Ultralytics
날짜: 2023-01-10
GitHub: ultralytics
플랫폼: Ultralytics YOLOv8

아키텍처 주요 특징: YOLOv8은 기본적으로 앵커 프리 detect 헤드를 도입하여 MS COCO 데이터셋 또는 사용자 지정 데이터 분포에 따라 앵커 박스를 수동으로 구성할 필요를 없애줍니다. C2f 모듈을 통합하여 그라디언트 흐름을 개선하고, 객체성, 분류 및 회귀 작업을 분리하는 디커플링된 헤드 구조를 사용합니다. 이는 수렴 속도를 크게 높이고 정확도를 향상시킵니다.

장점 및 단점: YOLOv8은 탁월한 메모리 요구 사항 효율성을 자랑합니다. YOLOv7 및 더 무거운 트랜스포머 모델에 비해 학습 중 훨씬 적은 CUDA 메모리를 필요로 하여 개발자가 더 큰 배치 크기를 사용할 수 있도록 합니다. 주요 강점은 다용성에 있으며, 인스턴스 segment, 이미지 분류, 자세 추정 및 방향성 바운딩 박스 (obb)를 네이티브로 지원합니다. 유일한 작은 단점은 YOLOv7 tensor를 위해 독점적으로 구축된 극도로 전문화된 레거시 파이프라인이 짧은 리팩토링 기간을 필요로 할 수 있다는 것입니다.

8에 대해 자세히 알아보기

에코시스템 이점

Ultralytics YOLOv8 잘 관리된 생태계의 혜택을YOLOv8 . 직관적인 Python , 활발한 개발, 그리고 강력한 커뮤니티 지원을 통해 모델을 로컬 테스트에서 글로벌 배포로 전환하는 데 걸리는 시간은 독립형 저장소에 비해 훨씬 짧습니다.

상세한 성능 비교

다음 표는 주요 모델 크기에 따른 성능 지표를 분석합니다. YOLOv8 세계적 수준의 정확도를 유지하면서 에지 디바이스에서의 신속한 추론을 위해 극도로 최적화함으로써 YOLOv8 탁월한 성능 균형을 주목하십시오.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

참고: YOLOv8x 이 mAP 가장 높은 mAP YOLOv8x 반면, YOLOv8n 매개변수 효율성과 추론 속도에서 YOLOv8n 에지 AI 장치에 컴퓨터 비전을 배포하는 데 있어 확실한 챔피언으로 자리매김합니다.

사용 편의성 및 교육 효율성 향상

사용 편의성 측면에서 Ultralytics YOLOv8 독보적인 위치를YOLOv8 . YOLOv7 같은 구형 아키텍처는 데이터셋과 경로를 구성하기 위해 특정 저장소를 복제하고 복잡한 명령줄 스크립트를 실행해야 YOLOv7 .

반대로, YOLOv8의 ultralytics 패키지는 매우 간소화된 개발자 경험을 제공합니다. 교육 효율성 자동 데이터 다운로드, 즉시 사용 가능한 사전 훈련된 가중치, 그리고 원활한 통합을 통해 극대화됩니다. 수출 역량 다음과 같은 형식으로 ONNX 및 TensorRT.

Ultralytics Python 사용하면 다음과 같이 손쉽게 로드, 훈련 및 추론을 실행할 수 있습니다:

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

실험 추적

YOLOv8 다음과 같은 인기 있는 MLOps 도구와 기본적으로 YOLOv8 . Weights & Biases 와 ClearML과 원활하게 연동되어 하이퍼파라미터 튜닝 및 훈련 메트릭을 실시간으로 모니터링할 수 있습니다.

이상적인 사용 사례

이러한 아키텍처 중 선택은 종종 배포 환경의 특정 제약 조건에 달려 있습니다.

7 선택해야 할 때

레거시 벤치마킹: 2022년의 아키텍처 표준과 비교하기 위한 고정된 기준선이 필요한 연구자에게 적합합니다.
기존의 대규모 인프라: YOLOv7의 특정 tensor 구성이 레거시 C++ 파이프라인에 깊이 내장되어 있는 NVIDIA V100 또는 A100 GPU에 대규모 투자가 이루어진 환경.

8 선택해야 할 때

크로스 플랫폼 프로덕션: 클라우드 GPU, 모바일 장치 및 브라우저에 걸쳐 원활하게 배포해야 하는 팀에 이상적입니다.
다중 작업 요구사항: 프로젝트가 바운딩 박스를 넘어 풍부한 인스턴스 segmentation 마스크 또는 포즈 키포인트를 활용해야 하는 경우.
자원 제약형 에지: YOLOv8 (yolov8n)는 로봇 공학, 드론 및 IoT 센서에 놀라운 정확도-속도 비율을 제공합니다.

미래를 향하여: YOLO26으로의 세대적 도약

YOLOv8 매우 견고한 선택지이지만, 컴퓨터 비전 분야는 빠르게 진화하고 있습니다. 완전히 새로운 고성능 프로젝트를 시작하는 개발자들을 위해 Ultralytics AI 모델의 차세대 진화 버전을 선보였습니다. 깊이 정제된 YOLO11 과 새로 출시된 YOLO26을 모두 살펴보시길 강력히 권장합니다.

2026년 1월 출시된 YOLO26은 에지 디바이스에서 가능한 한계를 뛰어넘습니다:

엔드투엔드 NMS-Free 설계: YOLO26은 기본적으로 엔드투엔드 방식이며, Non-Maximum Suppression (NMS) 후처리 과정을 완전히 제거합니다. 이는 기존의 밀집 예측 모델에서 발생하는 지연 시간 병목 현상 없이 훨씬 빠르고 간단한 배포 파이프라인을 보장합니다.
DFL 제거: Distribution Focal Loss를 제거함으로써 YOLO26은 훨씬 더 간단한 모델 배포 옵션과 뛰어난 엣지 호환성을 달성합니다.
최대 43% 더 빠른 CPU 추론: 라즈베리 파이 및 임베디드 시스템과 같은 제약된 환경에 고도로 최적화되어 CPU 처리량에서 모든 이전 세대를 능가합니다.
MuSGD Optimizer: 대규모 언어 모델(LLM) 훈련 패러다임에서 영감을 받아, YOLO26은 SGD와 Muon의 하이브리드를 통합합니다. 이는 전례 없는 훈련 안정성과 번개처럼 빠른 수렴을 제공합니다.
ProgLoss + STAL: 이러한 고급 손실 함수들은 작은 객체 인식에서 상당한 개선을 가져오며, 이는 항공 이미지, 자동화된 농업 및 로봇 공학에 매우 중요합니다.

YOLOv8 활용한 대규모 영상 분석 클러스터 YOLOv8 최첨단 YOLO26으로 소형 엣지 디바이스에 추론을 적용하든, Ultralytics AI 라이프사이클 전반을 원활하게 관리할 수 있는 도구를 제공합니다.