YOLOv8 YOLOv9: 실시간 객체 탐지기의 포괄적 기술 비교
실시간 객체 탐지의 진화는 더 나은 정확도, 더 낮은 지연 시간, 향상된 하드웨어 활용도를 위한 끊임없는 추구가 특징입니다. 이 여정에서 두 가지 주요 이정표는 Ultralytics YOLOv8 와 YOLOv9입니다. 두 모델 모두 컴퓨터 비전 분야의 최첨단 성능을 보여주지만, 서로 다른 배포 요구사항, 아키텍처 철학, 개발자 생태계를 대상으로 합니다.
이 포괄적인 가이드는 기술적 차이점, 아키텍처 혁신, 그리고 실용적인 배포 고려 사항을 상세히 설명하여 다음 인공지능 프로젝트에 적합한 모델을 선택하는 데 도움을 드립니다.
모델 계보와 핵심 철학
지표 분석에 착수하기 전에 각 모델의 기원과 주요 설계 목표를 이해하는 것이 중요하다.
Ultralytics YOLOv8: 다목적 생태계 표준
Ultralytics 팀에서 출시 Ultralytics팀이 YOLOv8 단순한 독립형 객체 탐지기가 아닌 통합된 다중 작업 프레임워크로 YOLOv8 . 이 프레임워크는 원활한 개발자 경험, 낮은 메모리 요구 사항, 그리고 광범위한 하드웨어 호환성을 최우선으로 합니다.
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직:Ultralytics
- 날짜:10
- GitHub:ultralyticsultralytics
- 문서:YOLOv8
YOLOv9: 프로그래밍 가능한 그래디언트 정보
중화민국 학술원 연구진이 독자적으로 개발한 YOLOv9 아키텍처 이론에 중점을 YOLOv9 , 특히 심층 신경망에서 발생하는 정보 병목 현상을 해결하는 데 주력한다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜:21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
기업 배포
대규모 상용 배포를 계획 중이라면, 간소화된 클라우드 트레이닝, 데이터셋 관리 및 원클릭 API 엔드포인트를 위해 Ultralytics 검토해 보십시오.
심층적인 아키텍처 분석
딥 러닝의 아키텍처 선택은 모델이 얼마나 효율적으로 학습하는지와 NVIDIA 이나 Intel CPU.
YOLOv8 : C2f 및 분리된 헤드
YOLOv8 기존 C3 모듈을 대체하는 C2f 모듈 (두 개의 컨볼루션으로 구성된 크로스 스테이지 부분 병목)을 YOLOv8 . 이 변경으로 기울기 흐름이 개선되어 네트워크가 GPU 과도하게 소모하지 않으면서도 더 풍부한 특징 표현을 학습할 수 있게 되었습니다.
또한 YOLOv8 분리된 헤드를 갖춘 앵커 프리 설계를 YOLOv8 . 객체성, 분류, 회귀를 별도의 경로로 처리함으로써 모델은 훈련 중 더 빠르게 수렴하고 다양한 사용자 정의 데이터셋에 대해 더 우수한 일반화 성능을 보입니다.
YOLOv9 : PGI와 GELAN
YOLOv9 프로그래머블 그라디언트 정보(PGI) 와 일반화된 효율적 레이어 집계 네트워크(GELAN)를 YOLOv9 . PGI는 중요한 데이터가 네트워크 레이어를 통과하는 과정에서 손실되지 않도록 보장하여 가중치 업데이트를 위한 신뢰할 수 있는 그라디언트를 제공합니다. GELAN은 매개변수 효율성을 극대화하여 모델이 높은 정확도를 달성하면서도 FLOPs를 관리 가능한 수준으로 유지하도록 합니다.
수학적으로 인상적이긴 하지만, YOLOv9 훈련 과정에서 특정 보조 가역 분기에 의존하는 방식은 표준 파이프라인에 비해 훈련 코드의 커스터마이징을 더 복잡하게 만들 수 있다.
성능 지표 및 벤치마크
아래 표는 다양한 크기의 모델들을 직접 비교한 것입니다. 성능은 객체 탐지의 표준 벤치마크인 MS COCO 측정되었습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
참고: 각 열의 최상위 값은 굵은 글씨로 강조 표시됩니다.
장단점 분석
YOLOv9 특히 더 큰 모델에서 약간 더 높은 정점 정확도(mAP)를 YOLOv9 . e 변형체. 그러나 이는 대가를 수반한다. Ultralytics YOLOv8 상당한 우위를YOLOv8 . 추론 속도특히 다음과 같은 형식으로 컴파일될 때 TensorRT 또는 ONNX제한된 에지 하드웨어(예: Raspberry Pi 또는 구형 모바일 칩), YOLOv8 n 및 s 변형 모델들은 훨씬 더 실용적인 성능 균형을 제공한다.
훈련 효율성과 생태계 통합
모델 선택은 정확도 표를 살펴보는 것 이상을 요구합니다; 개발자 경험이 가장 중요합니다.
Ultralytics : 사용 편의성
YOLOv9 훈련에는 YOLOv9 복잡한 GitHub 저장소 복제, PyTorch 세심한 관리, 보조 손실 가중치의 수동 구성이 필요합니다.
반면, Ultralytics YOLOv8 놀라울 정도로 간소화된 Python 기반으로YOLOv8 . 사용 편의성을 위해 설계된 이 API는 데이터 증강, 로깅( Weights & Biases , Comet 등), 하드웨어 분산 처리를 기본적으로 지원합니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)
# Export for edge deployment
model.export(format="engine", half=True) # TensorRT export
이 단일 API는 프로토타입에서 생산까지 걸리는 시간을 획기적으로 단축합니다. 또한 YOLOv8 훈련 중 더 적은 CUDA 필요로 하여 개발자가 소비자용 하드웨어에서 더 큰 배치 크기를 사용할 수 있게 합니다.
작업의 다양성
YOLOv9 우수한 바운딩 박스 YOLOv9 , 실제 비전 AI는 종종 더 많은 기능을 요구합니다. YOLOv8 인스턴스 세그멘테이션, 자세 추정, 이미지 분류, 방향성 바운딩 박스(OBB)를 기본적으로 지원하는 다재다능한 강력한 YOLOv8 . 단일 프레임워크로 여러 작업을 처리함으로써 소프트웨어 부피와 유지보수 부담을 크게 줄일 수 있습니다.
앞으로 바라보며
새로운 프로젝트를 시작하는 경우, 다음 사항도 평가해 볼 수 있습니다. Ultralytics YOLO11 또는 최첨단 YOLO26을 평가해 볼 수도 있습니다. 이 모델들은 기본적으로 엔드투엔드 NMS( NMS) 설계를 특징으로 합니다.
실제 사용 사례
이러한 모델들은 생산 현장에서 어떻게 작동하나요?
자율 비행 드론 및 로봇 공학
빠른 장애물 회피가 필요한 로봇 공학의 경우, 8 선호되는 선택입니다. 초저지연의 YOLOv8n 자율 시스템이 실시간으로 환경에 반응하여 충돌을 방지하도록 보장합니다. 기본 내장된 내보내기 기능을 통해 OpenVINO CoreML 통해 상용 드론에 흔히 사용되는 저전력 칩에 쉽게 배포할 CoreML .
고해상도 결함 검출
미세한 이상 현상 감지가 중요하고 오프라인 처리가 허용되는 특수 제조 환경에서는 YOLOv9 은 매우 효과적일 수 있습니다. PGI 아키텍처는 미세한 균열이나 PCB 납땜 오류를 식별하는 데 필요한 정밀한 시각적 세부 정보를 네트워크가 유지하도록 돕습니다.
스마트 리테일 및 보안 분석
매장 통로에서 고객을 추적하거나 자동 결제 시스템을 관리하기 위해, YOLOv8 이 최적의 균형을 제공합니다. BoT-SORT와 같은 표준 알고리즘을 사용하여 탐지 및 다중 객체 추적을 동시에 실행할 수 있는 능력 덕분에, 다중 카메라 소매점 배포 환경에 적합한 강력한 솔루션입니다.
사용 사례 및 권장 사항
YOLOv8 YOLOv9 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLOv9 .
8 선택해야 할 때
YOLOv8 다음과 같은 경우에 강력한 YOLOv8 :
- 다목적 멀티태스크 배포: Ultralytics 내에서 검출, 분할, 분류 및 자세 추정 기능을 위한 검증된 모델이 필요한 프로젝트.
- 구축된 생산 시스템: YOLOv8 기반으로 이미 구축된 기존 생산 환경으로, 안정적이고 철저히 검증된 배포 파이프라인을 갖추고 있습니다.
- 광범위한 커뮤니티 및 생태계 지원: YOLOv8 방대한 튜토리얼, 타사 통합 기능, 활발한 커뮤니티 리소스의 혜택을 받는 애플리케이션.
9 선택해야 할 때
YOLOv9 다음에 권장YOLOv9 :
- 정보 병목 연구: 프로그래머블 그라디언트 정보(PGI) 및 일반화된 효율적 레이어 집계 네트워크(GELAN) 아키텍처를 연구하는 학술 프로젝트.
- 경사 흐름 최적화 연구: 훈련 과정에서 심층 신경망 레이어에서 발생하는 정보 손실을 이해하고 완화하는 데 초점을 맞춘 연구.
- 고정밀도 탐지 벤치마킹: YOLOv9 강력한 COCO 성능이 아키텍처 비교를 위한 기준점으로 필요한 시나리오들.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
- 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.
다음 진화: YOLO26
YOLOv8 YOLOv9 , AI 분야는 빠르게 변화합니다. 최고의 성능을 요구하는 팀을 위해 새롭게 출시된 YOLO26은 이전 세대의 성공을 기반으로 합니다.
YOLO26은 엔드투엔드 NMS 프리 설계를 도입하여 복잡한 후처리 병목 현상을 완전히 제거함으로써 배포를 단순화하고 지연 시간을 더 예측 가능하게 합니다. 새로운 MuSGD 최적화기와 향상된 ProgLoss + STAL 손실 함수를 기반으로 하며, DFL 제거 (간편한 수출 및 에지/저전력 장치 호환성 향상을 위한 분포 초점 손실 제거)를 통해 소형 객체 인식 성능을 향상시키면서 CPU 속도를 최대 43%까지 가속화합니다. 에지 컴퓨팅의 한계를 넘어서려는 개발자들에게 YOLO26 평가를 적극 권장합니다.
요약하자면, YOLOv9 흥미로운 아키텍처 연구와 탁월한 최고 정확도를 YOLOv9 , Ultralytics YOLOv8 대다수의 컴퓨터 비전 엔지니어들이 신뢰할 수 있는 소프트웨어를 신속하게 출시하기 위한 가장 실용적이고, 잘 지원되며, 다용도로 활용 가능한 선택지로 남아 있습니다.