콘텐츠로 건너뛰기

YOLOv7 vs YOLOv6-3.0: 객체 감지를 위한 상세 모델 비교

컴퓨터 비전 프로젝트에서 최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 리소스 사용량 간의 균형이 필요한 매우 중요한 결정입니다. 이 페이지에서는 객체 감지 기능으로 알려진 두 가지 주요 모델인 YOLOv7YOLOv6-3.0 간의 자세한 기술적 비교를 제공합니다. 모델 선택 프로세스를 안내하기 위해 아키텍처, 성능 벤치마크 및 적합한 애플리케이션을 자세히 살펴보겠습니다.

YOLOv7: 정확도 및 고급 기술

대만 Academia Sinica 정보 과학 연구소의 연구원들이 개발한 YOLOv7은(는) 효율성을 유지하면서 높은 정확도를 달성하는 데 중점을 두어 실시간 객체 감지에서 중요한 진전을 나타냅니다.

작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/

아키텍처 및 주요 기능

YOLOv7은 추론 비용을 크게 늘리지 않고 성능을 향상시키는 것을 목표로 하는 몇 가지 아키텍처 혁신 및 훈련 전략을 도입했습니다. 주요 기능은 다음과 같습니다.

  • E-ELAN (Extended-Efficient Layer Aggregation Networks): 모델의 backbone에 있는 이 핵심 구성 요소는 네트워크의 특징 학습 능력을 효과적으로 향상시켜 파라미터 및 계산 효율성을 개선합니다. 자세한 내용은 원래 논문에서 확인할 수 있습니다.
  • 모델 스케일링: 모델 깊이와 너비에 대한 복합 스케일링 방법을 구현하여 연결 기반 모델 원칙에 따라 다양한 모델 크기에서 성능을 최적화합니다.
  • Auxiliary Head Training: 특징 학습을 강화하기 위해 학습 단계에서 보조 헤드를 활용하며, 속도 유지를 위해 추론 시에는 이러한 헤드를 제거합니다. 이 개념은 다른 신경망에서 사용되는 딥 슈퍼비전 기술과 관련이 있습니다.
  • "Bag-of-Freebies" 개선 사항: 추가적인 추론 비용 없이 정확도를 향상시키는 데이터 증강 및 레이블 할당 개선과 같은 고급 학습 기술을 통합합니다.

강점

  • 높은 정확도: COCO 데이터 세트와 같은 벤치마크에서 최첨단 정확도를 달성합니다.
  • 효율성: 높은 정확도와 경쟁력 있는 추론 속도의 균형을 유지하여 실시간 추론에 적합합니다.
  • 다재다능함: 공식 저장소는 자세 추정인스턴스 분할을 포함하여 객체 감지 외의 작업에 대한 지원을 보여줍니다.

약점

  • 복잡성: 고급 아키텍처 기능 및 학습 기술로 인해 YOLOv5와 같은 단순한 아키텍처에 비해 모델을 이해하고 미세 조정하기가 더 복잡해질 수 있습니다.
  • 리소스 집약적 훈련: 더 큰 YOLOv7 변형(예: YOLOv7-E6E)은 훈련에 상당한 컴퓨팅 리소스가 필요합니다.

YOLOv7에 대해 자세히 알아보세요

YOLOv6-3.0: 산업 효율성 및 속도

Meituan에서 개발한 YOLOv6-3.0은 속도와 효율성에 중점을 두고 고성능 객체 감지를 요구하는 산업 응용 분야를 위해 설계되었습니다. 3.0 버전은 이전 버전을 크게 향상시켜 개선된 정확도와 더 빠른 추론 시간을 제공합니다.

작성자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
소속: Meituan
날짜: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
문서: https://docs.ultralytics.com/models/yolov6/

아키텍처 및 주요 기능

YOLOv6-3.0은 배포를 염두에 두고 설계되었으며 추론 속도를 우선시하는 몇 가지 주요 아키텍처 선택을 특징으로 합니다.

  • 하드웨어 인식 설계: RepVGG 스타일의 재파라미터화 가능한 블록을 사용하여 다양한 하드웨어 플랫폼, 특히 GPU에서 효율적인 성능을 내도록 아키텍처가 조정되었습니다.
  • EfficientRep 백본 및 Rep-PAN Neck: 이러한 구조는 계산 병목 현상과 메모리 접근 비용을 줄이도록 설계되었으며, 이는 더 빠른 추론으로 직접 연결됩니다.
  • Decoupled Head: 분류 및 위치 추정 헤드를 분리하여 수렴 및 최종 모델 정확도를 향상시키는 것으로 나타났으며, YOLOX와 같은 모델에서도 볼 수 있는 기술입니다.

강점

  • 높은 추론 속도: 빠른 추론에 최적화되어 대기 시간이 중요한 요소인 실시간 애플리케이션에 매우 적합합니다.
  • 산업 중심: 산업 배포 시나리오를 염두에 두고 설계되어 제조와 같은 실제 환경에서 견고성과 효율성을 보장합니다.
  • 효율적인 설계: YOLOv6-3.0의 더 작은 변형은 파라미터와 FLOP 수가 매우 적어 리소스가 제한된 환경에 이상적입니다.

약점

  • 정확도 절충: 효율성은 매우 높지만, 속도보다 최대 정밀도를 우선시하는 YOLOv7과 같은 모델에 비해 복잡한 데이터 세트에서 정확도가 약간 낮을 수 있습니다.
  • 생태계 및 다재다능함: YOLOv6를 둘러싼 생태계는 Ultralytics 모델보다 덜 포괄적이며 주로 객체 감지에 중점을 둡니다.

사용 사례

YOLOv6-3.0은 속도와 효율성이 가장 중요한 애플리케이션에서 뛰어납니다.

  • 산업 자동화: 제조업에서 품질 관리 및 공정 모니터링을 수행합니다.
  • 실시간 시스템: 로보틱스 및 감시와 같이 엄격한 지연 시간 요구 사항이 있는 애플리케이션에 사용됩니다.
  • Edge Computing: 효율적인 설계로 인해 리소스가 제한된 장치에 배포합니다. NVIDIA Jetson과 같은 장치에 배포하는 방법에 대한 가이드를 확인하십시오.

YOLOv6-3.0에 대해 자세히 알아보세요

성능 비교: YOLOv7 vs YOLOv6-3.0

아래 표는 COCO 데이터 세트에서 YOLOv7 및 YOLOv6-3.0의 유사한 변형에 대한 성능 지표를 요약한 것입니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

참고: 속도 벤치마크는 하드웨어, 소프트웨어(TensorRT, ONNX, OpenVINO), 배치 크기 및 특정 구성에 따라 다를 수 있습니다. mAP 값은 일반적으로 COCO val 데이터 세트에 대해 보고됩니다.

표에 따르면 YOLOv7x가 가장 높은 mAP를 달성하여 뛰어난 정확도를 나타냅니다. 그러나 YOLOv6-3.0 모델, 특히 YOLOv6-3.0n과 같은 소형 변형은 특히 TensorRT 최적화를 통해 GPU에서 훨씬 빠른 추론 속도를 제공하며, 더 적은 파라미터와 FLOPs를 가지므로 매우 효율적입니다. 선택은 최대 정확도(YOLOv7) 또는 최적의 속도/효율성(YOLOv6-3.0) 중 우선 순위에 따라 달라집니다.

Ultralytics YOLO 모델을 선택해야 하는 이유

포괄적이고 사용하기 쉬운 생태계 내에서 최첨단 모델을 찾는 사용자에게 Ultralytics는 YOLOv8 및 최신 Ultralytics YOLO11을 제공합니다. 이러한 모델은 YOLOv7 및 YOLOv6 모두에 비해 상당한 이점을 제공합니다.

  • 사용 편의성: Ultralytics 모델은 간소화된 Python API, 광범위한 documentation 및 간단한 CLI commands와 함께 제공되어 학습, 검증 및 배포를 간소화합니다.
  • 잘 관리되는 에코시스템: 활발한 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트 및 원활한 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 통해 이점을 누리십시오.
  • 성능 균형: Ultralytics 모델은 속도와 정확성 사이에서 뛰어난 균형을 이루어 에지 장치에서 클라우드 서버에 이르기까지 다양한 실제 시나리오에 적합합니다.
  • 다재다능함: YOLOv8 및 YOLO11과 같은 모델은 객체 탐지를 넘어 분할, 분류, 자세 추정방향이 지정된 객체 탐지(OBB)를 포함한 다양한 작업을 지원하여 통합 솔루션을 제공합니다.
  • 학습 효율성: 효율적인 학습 프로세스, COCO와 같은 데이터 세트에서 즉시 사용 가능한 사전 학습된 가중치, 더 빠른 수렴 시간을 통해 이점을 얻으십시오.

더 자세한 내용을 알아보려면 RT-DETR과 같은 다른 모델과의 비교도 유용할 수 있습니다.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글