YOLOv9 YOLOv5: 현대 객체 탐지 기술에 대한 심층 분석
컴퓨터 비전 분야는 엄청난 성장을 이루었으며, 객체 탐지 기술은 수많은 산업 및 연구 응용 분야의 핵심 역할을 수행해 왔습니다. 적절한 아키텍처를 선택하려면 평균 정밀도(mAP), 추론 속도, 메모리 오버헤드에 대한 신중한 평가가 종종 필요합니다. 본 비교에서는 두 가지 매우 영향력 있는 모델을 살펴봅니다: YOLOv9는 기울기 정보 보존 측면에서 아키텍처적 혁신으로 주목받고 있으며, Ultralytics YOLOv5를 살펴봅니다. 후자는 놀라운 사용 편의성과 비교할 수 없는 배포 유연성으로 알려진 검증된 산업 표준입니다.
아키텍처 혁신 및 기술적 기원
이 두 모델의 근본적인 작동 원리를 이해하는 것은 각각의 성능 프로파일을 파악하는 데 중요한 맥락을 제공한다.
YOLOv9: 프로그래밍 가능한 그래디언트 정보
대만 Academia Sinica 정보 과학 연구소의 Chien-Yao Wang과 Hong-Yuan Mark Liao 연구원들이 개발한 YOLOv9는 2024년 2월 21일에 출시되었습니다. 이 모델은 심층 신경망에서 흔히 발생하는 정보 병목 현상을 해결하기 위해 프로그래밍 가능한 기울기 정보(PGI)와 일반화된 효율적인 계층 집계 네트워크(GELAN)라는 두 가지 획기적인 개념을 도입합니다.
PGI를 활용함으로써 YOLOv9은 피드포워드 프로세스 전반에 걸쳐 중요한 정보가 유지되도록 보장하여 매우 정확한 기울기 업데이트로 이어집니다. 한편, GELAN 아키텍처는 파라미터 효율성을 극대화하여 모델이 놀랍도록 낮은 계산 오버헤드로 최첨단 정확도를 달성할 수 있도록 합니다. 공식 YOLOv9 Arxiv 논문에서 기술 세부 정보를 탐색하거나 YOLOv9 GitHub 저장소를 확인할 수 있습니다.
Ultralytics YOLOv5: 생산 환경의 표준
Glenn Jocher가 개발하고 Ultralytics가 2020년 6월 26일에 출시한 YOLOv5는 컴퓨터 비전의 접근성을 혁신했습니다. PyTorch 프레임워크를 기반으로 기본적으로 구축된 최초의 객체 detect 모델 중 하나로서, 기존 Darknet C-프레임워크의 복잡성을 우회했습니다. YOLOv5는 고도로 최적화된 CSPNet 백본과 PANet 넥을 활용하여 속도와 정확도 사이의 완벽한 균형을 우선시합니다.
그러나 가장 큰 성과는 Ultralytics 통합입니다. YOLOv5 빠른 훈련 효율성과 저메모리 환경을 위해 극도로 YOLOv5 , 엣지 배포 환경에서 놀라울 정도로 안정적입니다.
메모리 효율성
에지 디바이스용 모델을 평가할 때, Ultralytics YOLO 일반적으로 무거운 트랜스포머 기반 아키텍처에 비해 훈련 및 추론 과정에서 훨씬 적은 GPU 요구한다는 점을 기억하십시오.
성능 분석: 속도 vs. 정확도
컴퓨터 비전 파이프라인을 설계할 때 개발자는 정확도와 지연 시간 간의 상충 관계를 고려해야 합니다. 다음 표는 표준 COCO 성능 차이를 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
장단점 분석
YOLOv9 원시 정밀도에서 절대적인 우위를 YOLOv9 . YOLOv9e는 GELAN 레이어를 활용해 미세한 디테일을 보존함으로써 mAP 55. mAP 끌어올렸습니다. 이는 의료 영상이나 소형 물체에 대한 엄격한 정확도가 요구되는 시나리오에 탁월한 선택지입니다.
반대로, YOLOv5는 뛰어난 배포 속도와 하드웨어 유연성에서 두각을 나타냅니다. YOLOv5n(Nano)은 TensorRT를 통해 T4 GPU에서 단 1.12ms 만에 추론을 실행하는 것으로 유명할 정도로 가볍습니다. 제한된 IoT 장치, 휴대폰 또는 Raspberry Pi에 배포하는 경우, YOLOv5의 메모리 사용량은 매우 신뢰할 수 있게 만듭니다.
Ultralytics 에코시스템의 이점
모델을 선택할 때 주요 고려 사항은 주변 소프트웨어 생태계입니다. YOLOv9가 최고 수준의 연구 벤치마크를 제공하는 반면, 최신 Ultralytics Python API를 통해 두 모델을 모두 활용하면 개발자에게 통합되고 간소화된 경험을 제공하여 격차를 해소합니다.
사용 편의성 및 내보내기
Ultralytics 복잡한 엔지니어링 난제를 Ultralytics . 자동 데이터 증강 및 하이퍼파라미터 튜닝과 같은 기능은 기본적으로 제공됩니다. 모델을 프로덕션 환경으로 이동하는 것도 마찬가지로 간단하며, 모델을 ONNX, OpenVINO, 또는 TFLite 형식입니다.
작업의 다양성
두 모델 모두 객체 탐지에 탁월하지만, 최신 Ultralytics 다양한 컴퓨터 비전 과제를 해결하도록 설계되었습니다. 확장된 프레임워크는 이미지 분류, 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB)에 대한 기본 지원을 제공하여 개발자가 코드베이스를 전환하지 않고도 여러 비전 문제를 해결할 수 있게 합니다.
사용 사례 및 권장 사항
YOLOv9와 YOLOv5 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
9 선택해야 할 때
YOLOv9 다음과 같은 경우에 강력한 YOLOv9 :
- 정보 병목 연구: PGI(Programmable Gradient Information) 및 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 연구하는 학술 프로젝트.
- 그라디언트 흐름 최적화 연구: 훈련 중 깊은 네트워크 레이어에서 발생하는 정보 손실을 이해하고 완화하는 데 초점을 맞춘 연구.
- 고정확도 감지 벤치마킹: 아키텍처 비교를 위한 참조점으로 YOLOv9의 강력한 COCO 벤치마크 성능이 필요한 시나리오.
5 선택해야 할 때
YOLOv5 다음에 권장YOLOv5 :
- 검증된 프로덕션 시스템: YOLOv5의 오랜 안정성 기록, 광범위한 문서 및 대규모 커뮤니티 지원이 중요하게 평가되는 기존 배포 환경.
- 리소스 제약이 있는 훈련: YOLOv5의 효율적인 훈련 파이프라인과 낮은 메모리 요구 사항이 유리한 제한된 GPU 리소스 환경.
- 광범위한 내보내기 형식 지원: ONNX, TensorRT, CoreML 및 TFLite를 포함한 다양한 형식으로 배포해야 하는 프로젝트.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
- 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.
구현 예시
Ultralytics 장점은 가중치 문자열만 변경하면 YOLOv5 YOLOv9 간편하게 전환할 수 있다는 점입니다.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")
# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")
# Export to ONNX for seamless deployment
model.export(format="onnx")
새로운 아키텍처 탐구
YOLOv5 YOLOv9 뚜렷한 장점을 지닌 우수한 YOLOv9 , 해당 분야는 계속해서 발전하고 YOLOv9 . 새로운 프로젝트를 탐색하는 사용자들은 Ultralytics 최신 버전을 평가해 볼 수도 있습니다.
- YOLO11: YOLOv8 계보의 강력하고 정교한 진화로, 모든 비전 작업에서 탁월한 속도-정확도 균형을 제공합니다.
- YOLO26: 2026년에 출시된 YOLO26은 최신 파이프라인을 위한 궁극적인 권장 사항입니다. 이는 종단 간 NMS-Free 설계를 도입하여 후처리 병목 현상을 완전히 제거합니다. DFL 제거(단순화된 export 및 향상된 엣지/저전력 장치 호환성을 위해 Distribution Focal Loss 제거)를 통해 최대 43% 더 빠른 CPU 추론을 달성합니다. 새로운 MuSGD Optimizer를 통해 학습 안정성이 강화되었으며, ProgLoss + STAL은 IoT, 로봇 공학 및 항공 이미지에 중요한 소형 객체 인식에서 눈에 띄는 개선을 통해 향상된 손실 함수를 제공하여 엣지 및 클라우드 배포 모두를 위한 가장 강력한 아키텍처가 됩니다.
대규모 데이터셋과 복잡한 배포 파이프라인을 관리하는 팀에게 Ultralytics 활용하면 이러한 첨단 모델을 손쉽게 훈련, track 및 배포할 수 있는 노코드 솔루션을 제공합니다.