YOLOv5 YOLOv6.0: 생태계 성숙도와 산업 정밀도의 균형 맞추기
빠르게 진화하는 컴퓨터 비전 환경에서 올바른 객체 감지 아키텍처를 선택하는 것은 개발자와 연구자에게 매우 중요한 결정입니다. 이 비교에서는 다음과 같은 기술적 차이점을 자세히 살펴봅니다. Ultralytics YOLOv5와 접근성과 강력한 에코시스템으로 유명한 전설적인 모델이자 산업 애플리케이션을 위해 특별히 설계된 프레임워크인 Meituan YOLOv6.0의 기술적 차이점을 살펴봅니다. 두 모델 모두 객체 감지에 탁월하지만, 배포 요구 사항과 워크플로 선호도가 서로 다릅니다.
Ultralytics YOLOv5
저자 작성자: Glenn Jocher
조직: Ultralytics
날짜: 2020-06-26
GitHub: yolov5
문서: https:yolov5
2020년 출시 이후 YOLOv5 전 세계에서 가장 인기 있고 신뢰받는 AI 모델 중 하나로 자리 잡았습니다. 기반이 되는 PyTorch 프레임워크를 기반으로 구축된 이 모델은 사용성, 내보내기 가능성, "즉시 사용 가능한" 성능을 우선시하여 최첨단 비전 AI에 대한 접근성을 대중화했습니다.
아키텍처 및 에코시스템
YOLOv5 PANet 넥과 YOLOv3 스타일의 헤드가 결합된 CSPDarknet 백본을 사용합니다. 이 아키텍처는 앵커 기반이며, 앵커 박스를 활용하여 객체 위치를 예측합니다. 주요 차별화 요소는 성숙한 에코시스템에 통합되어 있다는 점입니다. 많은 연구용 코드베이스와 달리 YOLOv5 엔지니어를 위한 제품으로 설계되었으며, 다음과 같은 형식으로 원활하게 내보낼 수 있는 것이 특징입니다. ONNX, CoreML 및 TFLite 같은 포맷으로 원활하게 내보낼 수 있어 모바일 및 엣지 배포에 매우 유용합니다.
주요 강점
- 사용 편의성:YOLOv5 경험'은 단순함으로 정의할 수 있습니다. 사용자 지정 데이터 세트 학습부터 추론 실행까지 워크플로가 간소화되고 잘 문서화되어 있습니다.
- 잘 관리된 에코시스템: 사용자는 적극적인 유지 관리, 빈번한 업데이트, 방대한 커뮤니티의 혜택을 누릴 수 있습니다. 다음과 같은 MLOps 도구와 통합 Weights & Biases 및 Comet 와 같은 MLOps 도구와의 통합이 기본 제공됩니다.
- 다목적성: 리포지토리는 표준 탐지 외에도 인스턴스 분할 및 이미지 분류를 지원하여 단일 코드베이스에서 멀티태스크 솔루션을 제공합니다.
- 메모리 효율성: YOLOv5 트랜스포머 기반 모델에 비해 트레이닝 중 메모리 사용량이 상대적으로 적어 일반 소비자용 GPU에서도 사용할 수 있는 것으로 알려져 있습니다.
원활한 배포
YOLOv5 내보내기 기능에 중점을 두어 개발자가 클라우드 서버부터 라즈베리 파이 또는 NVIDIA Jetson과 같은 엣지 디바이스에 이르기까지 다양한 환경에 손쉽게 모델을 배포할 수 있습니다.
메이투안 YOLOv6.0
저자: 추이 리, 룰루 리, 이페이 겅, 홍량 장, 멩 청, 보 장, 자이단 케, 샤오밍 쉬, 샹샹 추
조직: Meituan
날짜: 2023-01-13
아카이브: https://arxiv.org/abs/2301.05586
깃허브: YOLOv6
문서: https:ultralytics
메이투안의 비전 AI 팀이 개발한 YOLOv6.0은 특히 하드웨어 인식 애플리케이션을 위해 속도와 정확성의 균형을 맞추는 데 중점을 둔 업계 경쟁자로 자리매김하고 있습니다. 이 기술은 다음을 사용하여 GPU의 처리량을 극대화하도록 설계되었습니다. TensorRT 최적화를 사용하여 GPU의 처리량을 극대화하도록 설계되었습니다.
건축 및 산업 포커스
YOLOv6 정확도 저하 없이 추론 속도를 향상시키기 위해 재파라미터화 기법(RepVGG 스타일)을 활용하는 EfficientRep 백본과 Rep-PAN 넥을 활용합니다. 훈련 중에는 다중 분기 구조를 사용하며, 추론 중에는 단일 분기 구조로 축소됩니다. 버전 3.0에서는 평균 평균 정확도(mAP)를 더욱 향상시키기 위해 자체 증류와 같은 전략을 도입했습니다.
강점과 약점
- GPU 최적화: 이 아키텍처는 표준 GPU 추론에 맞게 크게 조정되어 TensorRT 사용할 때 NVIDIA T4 카드에서 높은 FPS 벤치마크를 달성하는 경우가 많습니다.
- 정량화 친화적: 메이퇀은 특정 산업 배포 시나리오에 중요한 교육 후 정량화(PTQ) 및 정량화 인식 교육(QAT)에 대한 구체적인 지원을 제공합니다.
- 제한된 활용성: 탐지 기능은 뛰어나지만, YOLOv6 포괄적인 Ultralytics 제품군에서 제공하는 광범위한 기본 멀티태스크 지원(예: 포즈 추정 또는 OBB)이 부족합니다.
- 복잡성: 재매개변수화 단계와 특정 학습 파이프라인은 Ultralytics 모델의 플러그 앤 플레이 특성에 비해 복잡성을 유발할 수 있습니다.
정면 성능 비교
아래 비교는 성능의 절충점을 강조합니다. YOLOv6.0은 강력한 하드웨어에서 최고의 정확도를 목표로 하며, 종종 매개변수 효율성을 희생합니다. 반면, Ultralytics YOLOv5 놀라운 균형을 유지하며 CPU 환경과 엣지 디바이스에서 실시간 추론에 탁월한 경량 모델을 제공합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
분석
모바일 애플리케이션을 위한 매우 효율적인 솔루션으로 각광받는 YOLOv5n은 가장 작은 YOLOv6 변형(4.7M)에 비해 훨씬 적은 수의 파라미터(2.6M)를 필요로 합니다. YOLOv6.0은 더 큰 크기에서 더 높은 피크 mAP 달성하지만, 모델 크기(FLOP 및 파라미터)가 증가한다는 대가를 치릅니다. CPU 배포( 로봇 공학 또는 저전력 모니터링에서 일반적)를 목표로 하는 개발자의 경우, YOLOv5 CPU 속도가 명시적으로 벤치마킹되고 최적화된 반면, YOLOv6 GPU 가속에 중점을 두고 있습니다.
교육 방법론 및 경험
교육 환경은 두 에코시스템 간에 크게 다릅니다. Ultralytics 로우코드, 고유연성 접근 방식을 우선시합니다.
Ultralytics 워크플로
YOLOv5 PyTorch 허브를 통해 직접 통합할 수 있으므로 사용자는 최소한의 상용구 코드만으로 모델을 로드하고 실행할 수 있습니다. 트레이닝 스크립트는 데이터 증강부터 로깅까지 모든 것을 자동으로 처리합니다.
import torch
# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference
img = "https://ultralytics.com/images/zidane.jpg"
results = model(img)
results.print()
산업 워크플로
YOLOv6 일반적으로 리포지토리 복제, 재파라미터화 백본에 대한 특정 구성 파일 설정, 외부 MLOps 도구와 즉시 통합되지 않는 스크립트 실행 등 수동 설정이 더 많이 필요합니다. 강력하지만 보고된 벤치마크를 달성하려면 특정 아키텍처 제약 조건(예: 자체 증류 매개변수)에 대한 심층적인 이해가 필요합니다.
이상적인 사용 사례
이러한 모델 중에서 선택하는 것은 하드웨어, 정확도 및 개발 속도와 관련된 특정 제약 조건에 따라 달라집니다.
- Ultralytics YOLOv5: 신속한 프로토타이핑, 에지 배포 및 커뮤니티 지원을 위한 최고의 선택입니다. 라즈베리 파이, 휴대폰 또는 CPU 서버에 배포해야 하는 경우, YOLOv5 가벼운 특성과 내보내기 지원은 타의 추종을 불허합니다. 또한 탐지 기능과 함께 세분화 및 분류를 지원하는 다목적 코드베이스가 필요한 연구자에게도 이상적입니다.
- 메이투안 YOLOv6.0: 하이엔드 GPU를 사용할 수 있는 고정된 산업 환경에 가장 적합하며 mAP 극대화가 유일한 우선 순위입니다. NVIDIA T4/A10 서버에서 실행되는 공장 품질 보증 시스템을 구축하고 있고 재파라미터화된 모델을 미세 조정할 수 있는 엔지니어링 리소스가 있는 경우 YOLOv6 유력한 후보입니다.
결론
성능 균형, 사용 편의성, 번성하는 에코시스템으로 유명한 컴퓨터 비전 커뮤니티의 초석인 Ultralytics YOLOv5 여전히 그 명성을 이어가고 있습니다. 엣지부터 클라우드에 이르기까지 다양한 하드웨어에서 안정적인 결과를 제공할 수 있어 다용도성과 출시 기간을 중요시하는 대부분의 개발자에게 탁월한 선택입니다.
YOLOv6.0은 산업용 GPU 추론을 위한 인상적인 아키텍처 혁신을 도입했지만, Ultralytics 모델의 포괄적인 에코시스템과 멀티 플랫폼 적응성은 부족합니다. 최고의 성능과 효율성을 원하는 사용자에게는 다음을 살펴볼 것을 권장합니다. Ultralytics YOLO11는 사용자 친화적인 Ultralytics API를 유지하면서 정확도와 속도 면에서 YOLOv5 YOLOv6 모두 능가합니다.
Ultralytics 작업의 경우 개발자는 다음과 같은 다른 모델도 고려할 수 있습니다. YOLOv8, YOLOv9, YOLOv10또는 트랜스포머 기반 RT-DETR.
Ultralytics 모델 설명서에서 비전 AI의 모든 잠재력을 살펴보세요.