YOLOv8 YOLOv7: 아키텍처 진화와 성능 분석
급속히 발전하는 컴퓨터 비전 분야에서 "You Only Look Once"(YOLO) 계열 모델은 실시간 객체 탐지의 기준을 꾸준히 제시해 왔습니다. 본 비교 분석은 Ultralytics YOLOv8 와 연구 중심의 YOLOv7의 기술적 차이를 살펴봅니다. 두 모델 모두 AI 역사에서 중요한 이정표이지만, 서로 다른 개발 및 배포 단계의 요구사항을 충족시킵니다.
개발자에게 가장 원활한 경험을 제공하기 위해 Ultralytics 통합된 인터페이스를 제공합니다. 그러나 특정 컴퓨터 비전 작업에 적합한 도구를 선택하려면 YOLOv7 연결 기반 접근 방식에서 YOLOv8 앵커 프리 설계로의 아키텍처 전환을 이해하는 것이 중요합니다.
성능 지표 비교
다음 표는 성능 상의 장단점을 보여줍니다. YOLOv8 일반적으로 속도와 정확도의 우수한 균형을 제공하며, 특히 훈련 및 배포를 위한 Ultralytics 플랫폼의 효율성을 고려할 때 더욱 그렇습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Ultralytics YOLOv8: 최신 표준
YOLOv8 앵커 박스 없이도 탐지가 가능한 탐지 헤드와 분리된 아키텍처를 채택함으로써 YOLO 중대한 전환점을 YOLOv8 . 이러한 설계 선택은 수동적인 앵커 박스 계산의 필요성을 제거함으로써 훈련 과정을 단순화하고, 다양한 데이터셋 전반에 걸쳐 모델의 견고성을 높였습니다.
YOLOv8 :
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직:Ultralytics
- 날짜:10
- GitHub:Ultralytics 리포지토리
아키텍처 및 혁신
YOLOv8 이전 버전에서 사용된 C3 모듈을 대체하는 C2f 모듈 (두 개의 컨볼루션으로 구성된 크로스 스테이지 부분 병목)을 YOLOv8 . C2f 모듈은 기울기 흐름을 개선하고 모델이 경량 특성을 유지하면서 더 복잡한 특징 표현을 학습할 수 있도록 합니다.
YOLOv8 핵심 강점은 내재된 다용도성입니다. 서로 다른 작업마다 별도의 브랜치가 필요했던 기존 저장소와 달리, YOLOv8 단일 프레임워크 내에서 객체 탐지, 인스턴스 분할, 자세 추정, 분류, 방향성 경계 상자(OBB) 를 YOLOv8 .
YOLOv7: 연구의 이정표
2022년 중반에 출시된 YOLOv7 "훈련 가능한 프리비즈 백(Trainable bag-of-freebies)"을 통한 아키텍처 최적화에 중점을 YOLOv7 . 이는 당시 앵커 기반 탐지기로 가능한 한계를 뛰어넘었습니다.
YOLOv7 :
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜:06
- 아카이브:YOLOv7: 훈련 가능한 bag-of-freebies가 새로운 최첨단 기술을 확립하다
- GitHub:WongKinYiu/yolov7
건축적 접근법
YOLOv7 E-ELAN (확장 효율적 레이어 집계 네트워크) 아키텍처를 YOLOv7 . 이 설계는 가장 짧고 긴 기울기 경로를 제어하여 네트워크가 더 효과적으로 학습할 수 있도록 하는 데 중점을 둡니다. 매우 정확하지만, 이 아키텍처는 복잡하며 앵커 박스에 의존합니다. 이는 맞춤형 데이터에서 최적의 성능을 위해 특정 조정이 필요할 수 있습니다.
기술 비교 및 사용 사례
1. 사용 편의성과 생태계
가장 중요한 차별화 요소는 생태계입니다. 8 을 통해 배포됩니다. ultralytics 파이프 패키지(pip package)는 "초보자부터 전문가까지"의 경험을 제공합니다. 개발자는 사전 훈련된 모델 몇 분 안에 훈련을 시작하세요.
반면 YOLOv7 주로 연구용 YOLOv7 . 강력하지만 Ultralytics 표준화된 API, TensorBoard 같은 도구와의 원활한 통합, 그리고 방대한 문서화가 부족합니다.
2. 훈련 효율성 및 메모리
Ultralytics 훈련 효율성으로 유명합니다. YOLOv8 CUDA 사용을 YOLOv8 , 트랜스포머 기반 모델이나 구형 YOLOv7 비해 더 큰 배치 크기를 허용하는 경우가 많습니다. 이러한 효율성은 클라우드 컴퓨팅 비용 절감과 더 빠른 반복 시간으로 이어집니다.
통합 수출
배포 시 가장 큰 어려움 중 하나는 모델 변환입니다. YOLOv8 한 줄 명령어로 ONNX, TensorRT, CoreML, TFLite 내보내는 한 줄의 명령어로 이 과정을 간소화하여 모델이 모든 에지 디바이스에서 실행되도록 보장합니다.
3. 이상적인 사용 사례
- 유지보수가 용이하고, 추적 및 분할과 같은 다양한 컴퓨터 비전 작업을 지원하며, 라즈베리 파이와 같은 에지 디바이스에 쉽게 배포할 수 있는 생산 환경에 바로 적용 가능한 솔루션을 원한다면 YOLOv8 선택하십시오.
- 기존 앵커 기반 아키텍처를 구체적으로 비교하는 학술 연구를 수행하거나 2022년 벤치마크 결과를 재현해야 하는 경우 YOLOv7 선택하십시오.
미래: YOLO26
YOLOv8 YOLOv7 훌륭한 모델 YOLOv7 , 이 분야는 빠르게 발전하고 YOLOv7 . Ultralytics 모든 신규 프로젝트에 권장되는 모델인 YOLOv26을 출시했습니다.
YOLO26은 비최대 억제(NMS) 후처리 과정이 필요 없는 종단간 ( End-to-End) NMS 설계를 도입합니다. 이를 통해 배포 파이프라인이 크게 간소화되고 지연 시간이 감소합니다. 또한 YOLO26은 분포 초점 손실(DFL)을 제거하고, LLM 훈련에서 영감을 받은 SGD )의 하이브리드인 MuSGD 최적화기를활용하여 안정적인 훈련과 더 빠른 수렴을 달성합니다.
ProgLoss 및 STAL (소프트 타겟 앵커 손실)을 통해 YOLO26은 CPU 속도를 최대 43%까지 향상시켜, 에지 컴퓨팅 및 실시간 분석을 위한 최적의 선택지입니다.
코드 예시
Ultralytics 워크플로를 통합합니다. 최소한의 코드로 최첨단 YOLOv8 훈련하거나 기존 구성을 불러올 수 있습니다.
from ultralytics import YOLO
# Load the recommended model (YOLO26 or YOLOv8)
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
# The unified API handles data augmentation and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
다른 아키텍처에 관심이 있는 연구자들을 위해 Ultralytics YOLOv5, YOLOv9, 그리고 YOLO11를 지원하여 모든 시나리오에 최적의 도구를 제공합니다.