YOLOv6-3.0 vs YOLOv7: 상세 기술 비교
컴퓨터 비전 프로젝트에서 최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 리소스 사용량 간의 균형이 필요한 매우 중요한 결정입니다. 이 페이지에서는 객체 감지 기능으로 알려진 두 가지 주요 모델인 YOLOv6-3.0과 YOLOv7 간의 자세한 기술적 비교를 제공합니다. 모델 선택 프로세스를 안내하기 위해 아키텍처, 성능 벤치마크 및 적합한 애플리케이션을 자세히 살펴보겠습니다.
YOLOv6-3.0: 산업 속도에 최적화됨
Meituan에서 개발한 YOLOv6-3.0은 속도와 효율성에 중점을 두고 고성능 객체 감지를 요구하는 산업 응용 분야를 위해 설계되었습니다. 3.0 버전은 이전 버전을 크게 향상시켜 개선된 정확도와 더 빠른 추론 시간을 제공하므로 실시간 시스템에 강력한 경쟁자가 됩니다.
작성자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
소속: Meituan
날짜: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
문서: https://docs.ultralytics.com/models/yolov6/
아키텍처 및 주요 기능
YOLOv6-3.0은 효율적인 재파라미터화 백본을 활용하는 하드웨어 인지 신경망 설계를 도입했습니다. 이 설계 선택은 산업 배포에 중요한 요소인 추론 속도를 가속화하는 능력의 핵심입니다. 또한 이 아키텍처는 정확도와 계산 효율성 간의 최적의 균형을 이루도록 세심하게 설계된 하이브리드 블록 구조를 통합합니다. 하드웨어 친화성에 대한 이러한 집중은 모델이 서버에서 엣지 장치에 이르기까지 다양한 배포 플랫폼에서 잘 작동하도록 보장합니다.
강점
- 높은 추론 속도: 빠른 추론에 최적화되어 엄격한 대기 시간 요구 사항이 있는 애플리케이션에 매우 적합합니다.
- 산업 중심: 실제 산업 시나리오를 염두에 두고 설계되었으며 제조 분야의 AI와 같은 환경에서 견고성과 효율성을 보장합니다.
- 하드웨어 인식 설계: CPU 및 GPU를 포함한 다양한 하드웨어 플랫폼에서 효율적인 성능을 내도록 아키텍처가 조정되었습니다.
약점
- 정확도 절충: 효율성은 매우 높지만, 최대 정밀도를 우선시하는 YOLOv7과 같은 모델에 비해 복잡한 데이터 세트에서 정확도가 약간 낮을 수 있습니다.
- 제한적인 활용성: 원래 프레임워크는 주로 객체 탐지에 중점을 두고 있으며, 보다 통합된 모델과 달리 다른 작업에 대해서는 별도의 구현이 필요합니다.
사용 사례
YOLOv6-3.0은 속도와 효율성이 가장 중요한 애플리케이션에서 뛰어납니다.
- 산업 자동화: 품질 관리, 공정 모니터링 및 빠른 감지가 필요한 기타 산업 응용 분야에 이상적입니다.
- 실시간 시스템: 실시간 감시, 로보틱스 및 엄격한 지연 시간 제약 조건이 있는 애플리케이션에 적합합니다.
- Edge Computing: 효율적인 설계로 인해 리소스가 제한된 장치에 배포하는 데 탁월한 선택입니다. NVIDIA Jetson과 같은 장치에 배포하는 방법에 대한 가이드를 확인하십시오.
YOLOv7: 정확도의 한계점을 넘어서다
대만 Academia Sinica 정보 과학 연구소의 연구원들이 개발한 YOLOv7은(는) 효율성을 유지하면서 높은 정확도를 달성하는 데 중점을 두어 실시간 객체 감지에서 중요한 도약을 나타냅니다.
작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/
아키텍처 및 주요 기능
YOLOv7은 추론 비용을 크게 늘리지 않고 성능을 향상시키는 것을 목표로 하는 몇 가지 아키텍처 혁신 및 훈련 전략을 도입했습니다. 주요 기능은 다음과 같습니다.
- E-ELAN (Extended-Efficient Layer Aggregation Networks): 이 새로운 네트워크 설계는 모델의 특징 학습 능력을 효과적으로 향상시켜 파라미터와 계산 효율성을 모두 개선합니다. 자세한 내용은 원래 논문에서 확인할 수 있습니다.
- Compound Model Scaling: 모델의 깊이와 너비에 대한 Compound Scaling 방법을 구현하여 다양한 모델 크기에서 성능을 최적화합니다.
- "Bag-of-Freebies" 개선 사항: YOLOv7은 정제된 데이터 증강 및 레이블 할당 전략과 같은 고급 학습 기술을 통합하여 추가적인 추론 비용 없이 정확도를 향상시킵니다. 데이터 증강 가이드에서 유사한 기술을 살펴보십시오.
- Auxiliary Head Training: 특징 학습을 강화하기 위해 학습 단계에서 보조 헤드를 활용합니다. 높은 속도를 유지하기 위해 추론 시에는 이러한 헤드를 제거합니다.
강점
- 높은 정확도: COCO 데이터 세트와 같은 표준 벤치마크에서 최첨단 정확도를 달성합니다.
- 효율적인 성능: 높은 정확도와 경쟁력 있는 추론 속도의 균형을 유지하여 많은 실시간 애플리케이션에 적합합니다.
- 다양성: 공식 저장소는 자세 추정(pose estimation) 및 인스턴스 분할(instance segmentation)을 포함하여 탐지 외 작업에 대한 커뮤니티 중심 지원을 보여줍니다.
약점
- 복잡성: 고급 아키텍처 기능 및 학습 기술로 인해 모델을 이해하고 미세 조정하기가 더 복잡해질 수 있습니다.
- 리소스 집약적 학습: 더 큰 YOLOv7 모델(예: YOLOv7-E6E)은 학습을 위해 상당한 컴퓨팅 리소스가 필요합니다.
사용 사례
YOLOv7은 높은 정확도가 주요 목표인 애플리케이션에 탁월한 선택입니다.
- 고급 감시: 향상된 보안을 위해 혼잡한 장면에서 미묘하거나 작은 객체를 감지합니다.
- 자율 시스템: 자율 주행 자동차 또는 드론의 안전한 탐색을 위한 정확한 객체 탐지를 제공합니다.
- 과학 연구: 정확한 결과를 위해 높은 정밀도가 중요한 복잡한 시각적 데이터 분석에 사용됩니다.
성능 비교: YOLOv6-3.0 vs. YOLOv7
아래 표는 COCO 데이터 세트에서 YOLOv6-3.0 및 YOLOv7의 유사한 변형에 대한 성능 지표를 요약한 것입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
참고: 속도 벤치마크는 하드웨어, 소프트웨어(TensorRT, ONNX, OpenVINO), 배치 크기 및 특정 구성에 따라 다를 수 있습니다. mAP 값은 일반적으로 COCO val 데이터 세트에 대해 보고됩니다.
표에 따르면 YOLOv7x가 가장 높은 mAP를 달성하여 뛰어난 정확도를 나타냅니다. 그러나 YOLOv6-3.0 모델, 특히 YOLOv6-3.0n과 같은 소형 변형은 특히 TensorRT 최적화를 통해 GPU에서 훨씬 빠른 추론 속도를 제공합니다. 또한 파라미터와 FLOPs가 더 적어 매우 효율적입니다. 선택은 최대 정확도(YOLOv7) 또는 최적의 속도 및 효율성(YOLOv6-3.0) 중 우선 순위에 따라 달라집니다.
Ultralytics의 장점: YOLOv8 및 YOLO11을 선택해야 하는 이유
YOLOv6 및 YOLOv7은 강력한 모델이지만, 포괄적이고 사용자 친화적인 생태계 내에서 최첨단 솔루션을 찾는 개발자와 연구원은 최신 Ultralytics YOLO 모델을 고려해야 합니다. Ultralytics YOLOv8 및 최신 YOLO11과 같은 모델은 다음과 같은 몇 가지 주요 이점을 제공합니다.
- 사용 편의성: Ultralytics 모델은 간소화된 Python API, 광범위한 문서 및 학습, 검증 및 배포를 간소화하는 간단한 CLI 명령어를 특징으로 하며, 개발자 경험을 염두에 두고 설계되었습니다.
- 잘 관리되는 에코시스템: 활발한 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트, 엔드 투 엔드 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻으세요.
- 다재다능함: YOLOv8 및 YOLO11과 같은 모델은 진정한 멀티태스커로서 단일 통합 프레임워크 내에서 객체 탐지, 분할, 분류, 자세 추정 및 방향이 지정된 객체 탐지(OBB)를 지원합니다.
- 성능 균형: Ultralytics 모델은 속도와 정확성 사이에서 뛰어난 균형을 이루어 에지 장치에서 클라우드 서버에 이르기까지 광범위한 실제 시나리오에 적합합니다.
- 학습 효율성: 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치, 더 빠른 수렴 시간을 활용하여 귀중한 시간과 컴퓨팅 자원을 절약하십시오.
결론
YOLOv6-3.0과 YOLOv7은 모두 컴퓨터 비전에서 가능한 것의 경계를 넓힌 강력한 객체 감지 모델입니다. YOLOv6-3.0은 추론 속도와 효율성을 우선시하는 시나리오에서 뛰어나 산업 애플리케이션 및 에지 배포에 이상적입니다. 이와는 대조적으로 YOLOv7은 더 높은 최고 정확도를 제공하므로 정밀도가 주요 관심사인 작업에 강력한 선택이지만 잠재적으로 더 높은 계산 비용이 발생할 수 있습니다.
다른 최첨단 옵션 탐색에 관심 있는 사용자를 위해 Ultralytics는 성능, 다재다능함 및 사용 편의성의 뛰어난 균형을 제공하는 YOLOv8 및 YOLO11과 같은 모델을 제공합니다. YOLOX 및 RT-DETR과 같은 다른 모델과의 비교도 추가 탐색에 도움이 될 수 있습니다.