YOLOv9 YOLOv6.0: 포괄적인 기술 비교
실시간 객체 탐지의 진화는 신경망 아키텍처의 지속적인 혁신에 의해 주도되어 왔으며, 이는 추론 속도, 정확도, 계산 효율성 사이의 섬세한 균형을 최적화하는 데 기여했습니다. 개발자와 연구자들이 복잡한 컴퓨터 비전 프레임워크 환경을 탐색함에 따라, 주요 아키텍처를 비교하는 것은 작업에 적합한 도구를 선택하는 데 필수적입니다.
이 기술 가이드는 두 가지 고성능 모델 간의 심층 비교를 제공합니다: YOLOv9, 딥 러닝 정보 보존 능력으로 유명한 모델과 산업용 애플리케이션에 특화된 모델인 YOLOv6.0을 심층적으로 비교합니다.
YOLOv9 : 특징 보존 극대화
2024년 초에 소개된 YOLOv9 심층 신경망에서 가장 지속적인 과제 중 하나인 전방 전달 과정에서의 정보 손실 문제를 YOLOv9 . 기울기가 신뢰할 수 있도록 하고 특징 맵이 중요한 데이터를 유지하도록 함으로써 이론적 정확도의 한계를 뛰어넘습니다.
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2024년 2월 21일
- 링크:Arxiv 논문, GitHub 저장소
아키텍처와 방법론
YOLOv9 일반화된 효율적 레이어 집계 네트워크(GELAN)와 함께 프로그래머블 그라디언트 정보(PGI) 개념을 YOLOv9 . PGI는 보조 감독을 제공함으로써 정보 병목 현상을 해결하여, 추론 오버헤드를 추가하지 않으면서도 주 네트워크가 견고하고 신뢰할 수 있는 특징을 학습하도록 보장합니다. 한편 GELAN은 매개변수 활용도를 최적화하여 모델이 계산 비용을 관리 가능한 수준으로 유지하면서도 최첨단 평균 정밀도(mAP)를 달성할 수 있게 합니다. 이는 특징 충실도가 중요한 의료 영상 분석이나 극소형 물체 탐지에 탁월한 선택지입니다.
YOLOv6.0 개요: 산업 규모를 위해 설계됨
미투안(美团)이 개발한 YOLOv6. YOLOv6(v3.0으로도 불림)은 중장비 산업용 애플리케이션을 위해 처음부터 설계되었습니다. 2023년 초 출시된 이 모델은 배포 효율성에 중점을 두어, 엣지 하드웨어에서 탁월한 성능을 발휘하는 양자화 친화적 모델 제품군을 제공합니다.
- 작성자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
- Organization: Meituan
- 날짜: 2023년 1월 13일
- 링크:Arxiv 논문, GitHub 저장소
아키텍처와 방법론
YOLOv6.0은 RepOptimizer와 앵커 보조 훈련(AAT) 전략을 통해 차별화됩니다. 이 모델은 RepVGG에서 영감을 받은 하드웨어 인식 신경망 설계를 활용하여 레이어를 융합함으로써 추론 시 GPU에서 매우 빠르게 실행될 수 있습니다. 3.0 업데이트는 양방향 연결(BiC) 모듈을 도입하여 로컬라이제이션 정확도를 개선함으로써 아키텍처를 더욱 정교화했습니다. TensorRT와 같은 배포 형식에 고도로 최적화되어 있기 때문에 TensorRT 및 OpenVINO와 같은 배포 형식에 최적화되어 있어, YOLOv6.0은 물류, 제조 자동화 및 고처리량 서버 환경에서 자주 채택됩니다.
성능 비교
표준 COCO 이러한 모델들을 평가할 때, 정확도와 순수 추론 속도 사이의 뚜렷한 상충 관계를 관찰할 수 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
기술적 분석
T4 하드웨어에서 순수 속도(1.17ms) 부문에서는 YOLOv6. YOLOv6 최고 기록을 세웠지만, YOLOv9t는 매개변수(200만 vs 470만)를 절반 이하로 줄이고 FLOPs도 현저히 낮추면서도 약간 더 높은 mAP 38.3%)를 달성했습니다. 복잡하고 높은 정확도가 요구되는 경우, 대규모 YOLOv9e는 정확도를 55.6% mAP 끌어올려 딥 네트워크에서 PGI 아키텍처의 강력한 성능을 입증합니다.
YOLO26으로 프로젝트의 미래 대비를 완성하세요
새로운 컴퓨터 비전 프로젝트를 시작하신다면, 저희는 강력히 권장합니다 YOLO26를 활용하시길 강력히 권장합니다. 2026년 출시된 이 모델은 후처리 지연 시간을 완전히 제거하는 내장형 엔드투엔드 NMS) 설계를 특징으로 하여, 최대 43% 더 빠른 CPU 가능하게 합니다.
Ultralytics 에코시스템의 이점
어떤 모델의 아키텍처 철학이 마음에 들든, Ultralytics Python 통해 이를 네이티브로 구현하면 우수한 개발자 경험을 제공합니다.
사용 편의성 및 교육 효율성 향상
복잡한 딥러닝 모델 훈련에는 전통적으로 방대한 양의 반복적인 코드가 필요합니다. Ultralytics 이러한 복잡성을 추상화합니다. 결함 검출을 YOLOv9 미세 조정하든, 모바일 애플리케이션을 YOLOv6 내보내든, 워크플로는 놀라울 정도로 일관성을 유지합니다.
또한 Ultralytics 일반적으로 부피가 큰 트랜스포머 기반 모델에 비해 훈련 중 CUDA 요구 사항이 낮습니다. 이를 통해 개발자는 소비자용 GPU에서 더 큰 배치 크기를 사용할 수 있어 훈련 효율성이 크게 향상됩니다.
from ultralytics import YOLO
# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")
# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Export to ONNX or TensorRT seamlessly
model.export(format="engine", half=True)
다양한 비전 작업에 걸친 탁월한 다용도성
YOLOv6. YOLOv6 빠른 바운딩 박스 생성을 위해 극도로 최적화되어 있지만, 현대 컴퓨터 비전 프로젝트는 종종 다중 작업 접근법이 필요합니다. Ultralytics 극도의 다용도로 유명합니다. Ultralytics YOLOv8 과 최신 YOLO26을 통해 단일 프레임워크로 객체 탐지, 인스턴스 분할, 이미지 분류, 자세 추정, 방향성 바운딩 박스(OBB)를 원활하게 처리할 수 있습니다.
YOLO26 소개: 새로운 표준
성능과 배포 용이성을 모두 극대화하려는 조직에게 YOLO26은 속도와 정확성의 궁극적인 융합을 구현합니다.
YOLO11의 성공을 바탕으로 YOLO11의 성공을 바탕으로, YOLO26은 다음과 같은 패러다임 전환적 특징들을 도입합니다:
- MuSGD 최적화기: Moonshot AI의 Kimi K2와 같은 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받은 이 하이브리드 최적화기는 놀라울 정도로 안정적인 훈련과 빠른 수렴을 보장합니다.
- DFL 제거: 분포 초점 손실(Distribution Focal Loss)을 제거함으로써 YOLO26은 출력 그래프를 단순화하여 저전력 엣지 컴퓨팅 칩과의 호환성을 크게 향상시킵니다.
- ProgLoss + STAL: 이러한 고급 손실 함수는 드론 운영 및 IoT 애플리케이션에 중요한 소형 물체 인식에서 현저한 개선 효과를 보여줍니다.
- 작업별 개선 사항: YOLO26은 분할을 위한 네이티브 다중 스케일 프로토타이핑, 골격 추적을 위한 잔차 로그 가능도 추정(RLE), OBB 감지에서의 경계 사례 해결을 위한 특수 각도 손실 알고리즘을 포함합니다.
이상적인 배포 시나리오
적합한 아키텍처를 선택하는 것은 궁극적으로 생산 제약 조건에 달려 있습니다.
산업 제조 분야에서 확립된 파이프라인을 보유하고, 양자화에 크게 의존하며, 절대적으로 최저 수준의 서브밀리초 하드웨어 지연 시간이 필요한 경우 전용 추론 가속기를 활용한다면 YOLOv6.0을 선택하십시오.
선택 YOLOv9 복잡한 의료 진단이나 장거리 감시와 같은 작업에서 미세한 픽셀 수준의 특징을 놓치는 것이 용납되지 않는 경우 YOLOv9를 선택하십시오.
그러나 최첨단 정확도와 간소화된 NMS 배포를 동시에 제공하는 완벽하게 균형 잡힌 접근법을 원한다면, Ultralytics 현대 컴퓨터 비전 엔지니어링을 위한 확실한 추천 솔루션으로 자리매김하고 있습니다. 활발한 개발 주기, 포괄적인 문서화, 그리고 활발한 커뮤니티 지원 덕분에 연구자와 개발자 모두에게 없어서는 안 될 필수 도구로 자리잡았습니다.