YOLOv10 vs YOLOv7: 상세 기술 비교
컴퓨터 비전 프로젝트에서 올바른 객체 탐지 모델을 선택하는 것은 성능, 속도 및 리소스 사용량에 영향을 미치므로 매우 중요합니다. 이 페이지에서는 필요에 가장 적합한 모델을 선택하는 데 도움이 되도록 You Only Look Once (YOLO) 제품군의 두 가지 중요한 모델인 YOLOv10과 YOLOv7 간의 기술 비교를 제공합니다. 아키텍처, 성능 지표 및 이상적인 사용 사례를 자세히 살펴봅니다.
YOLOv10
2024년 5월 칭화대학교 연구진이 발표한 YOLOv10은 실시간 객체 감지 분야에서 상당한 발전을 나타냅니다. 주요 혁신은 추론 중에 Non-Maximum Suppression (NMS)의 필요성을 제거하여 end-to-end 객체 감지를 달성하는 것입니다. 이러한 획기적인 기술은 계산 오버헤드를 줄이고 추론 지연 시간을 낮추어 배포 효율성을 높입니다.
기술 세부 사항:
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 조직: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/yolov10/
아키텍처 및 주요 기능
YOLOv10은 속도-정확도 절충점을 최적화하기 위한 몇 가지 아키텍처 혁신을 도입했습니다.
- NMS-Free 학습: 레이블 할당에 대해 일관된 이중 할당을 활용하여 YOLOv10은 중복 예측을 방지하고 NMS 사후 처리 단계의 필요성을 없앱니다. 이를 통해 배포 파이프라인이 간소화되고 모델이 진정으로 엔드 투 엔드가 됩니다.
- 전체적인 효율성-정확도 중심 설계: 모델 아키텍처는 효율성과 성능 모두를 위해 전체적으로 최적화되었습니다. 여기에는 계산 중복성을 줄이면서 모델 기능을 향상시키기 위해 경량 분류 헤드를 도입하고 공간-채널 분리 다운샘플링을 사용하는 것이 포함됩니다.
- Anchor-Free Approach: 다른 최신 YOLO 모델과 마찬가지로 앵커 프리 검출기 설계를 채택하여 검출 헤드를 단순화하고 일반화 성능을 향상시킵니다.
- 원활한 Ultralytics 통합: YOLOv10은 Ultralytics 에코시스템에 완전히 통합되어 간단한 Python API와 강력한 CLI 명령어를 통해 간소화된 사용자 경험을 제공합니다. 따라서 학습, 유효성 검사 및 배포가 매우 간단합니다.
강점
- 최첨단 효율성: NMS-free 설계 및 아키텍처 최적화는 더 빠른 추론 속도와 훨씬 더 낮은 지연 시간으로 이어지며, 이는 실시간 애플리케이션에 매우 중요합니다.
- 경쟁력 있는 정확도: YOLOv10은 이전 모델에 비해 모델 크기와 계산 비용을 획기적으로 줄이면서도 강력한 정확도를 유지합니다.
- 간소화된 배포: NMS 제거는 진정한 엔드 투 엔드 감지 파이프라인을 생성하여 특히 엣지 장치에 배포하기 쉽게 만듭니다.
- 뛰어난 확장성: Nano (N)에서 Extra-large (X)까지 다양한 모델을 제공하여 리소스가 제한된 에지 하드웨어에서 강력한 클라우드 서버에 이르기까지 다양한 성능 요구 사항을 충족합니다.
약점
- 더 새로운 모델: 최신 릴리스이므로, 커뮤니티 지원 및 타사 통합 수는 YOLOv7 또는 Ultralytics YOLOv8과 같은 기존 모델에 비해 덜 광범위할 수 있습니다.
YOLOv7
2022년 7월에 출시된 YOLOv7은 속도와 정확성의 놀라운 균형으로 객체 감지의 새로운 표준을 빠르게 설정했습니다. Academia Sinica 정보 과학 연구소의 연구원들이 개발한 YOLOv7은 추론 비용을 늘리지 않고 성능을 향상시키기 위해 "훈련 가능한 Bag-of-Freebies"로 알려진 몇 가지 아키텍처 개선 사항과 훈련 전략을 도입했습니다.
기술 세부 사항:
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- 문서: https://docs.ultralytics.com/models/yolov7/
아키텍처 및 주요 기능
YOLOv7의 아키텍처는 출시 당시 실시간 객체 탐지의 경계를 넓힌 몇 가지 주요 개선 사항을 통합했습니다.
- Extended Efficient Layer Aggregation Networks (E-ELAN): 이 고급 네트워크 구조는 효율적인 기울기 흐름을 유지하면서 다양한 특징을 학습하는 모델의 능력을 향상시켜 더 나은 정확도와 더 빠른 수렴을 유도합니다.
- 연결 기반 모델을 위한 모델 스케일링: YOLOv7은 다양한 계산 예산에서 성능을 최적화하기 위해 모델 깊이와 너비를 지능적으로 조정하는 복합 스케일링 방법을 도입했습니다.
- 학습 가능한 Bag-of-Freebies: Coarse-to-Fine Guidance가 있는 보조 헤드를 사용하는 것과 같은 고급 학습 기술을 활용하여 추론 중에 오버헤드를 추가하지 않고 정확도를 향상시킵니다.
강점
- 높은 mAP: 뛰어난 객체 감지 정확도를 제공하므로 정밀도가 가장 중요한 애플리케이션에 적합합니다.
- 빠른 추론: 특히 GPU 하드웨어에서 많은 실시간 작업에 적합한 경쟁력 있는 추론 속도를 제공합니다.
- 잘 확립됨: 더 오랫동안 사용 가능했던 YOLOv7은 더 큰 커뮤니티 기반, 더 많은 튜토리얼 및 다양한 프로젝트에서의 광범위한 채택의 이점을 누릴 수 있습니다.
약점
- NMS 종속성: YOLOv10과 달리 YOLOv7은 NMS 사후 처리 단계에 의존하므로 전체 추론 지연 시간이 늘어나고 배포 파이프라인이 복잡해집니다.
- 낮은 효율성: YOLOv10과 비교했을 때, YOLOv7 모델은 일반적으로 비슷한 수준의 정확도에 대해 더 많은 파라미터와 더 높은 FLOPs를 가지므로 효율성이 떨어집니다.
성능 비교: YOLOv10 vs YOLOv7
성능을 비교할 때 YOLOv10은 효율성 면에서 분명한 이점을 보여줍니다. 가장 직접적인 비교는 YOLOv10-M과 YOLOv7-L 사이의 비교입니다. 아래 표에서 볼 수 있듯이 YOLOv10-M은 YOLOv7-L의 51.4%와 거의 동일한 51.3%의 mAPval을 달성합니다. 그러나 YOLOv10-M은 훨씬 더 효율적입니다. 더 빠르고(TensorRT에서 5.48ms 대 6.84ms), 파라미터 수가 절반 미만이며(15.4M 대 36.9M), 훨씬 적은 계산 리소스(59.1B FLOP 대 104.7B FLOP)가 필요합니다. 이는 훨씬 더 뛰어난 효율성으로 비슷한 정확도를 제공하는 YOLOv10의 우수한 아키텍처 설계를 강조합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
결론
YOLOv10과 YOLOv7은 모두 강력한 객체 감지 모델이지만, YOLOv10은 실시간 감지 효율성의 다음 단계를 나타냅니다. NMS-free 아키텍처는 정확도를 희생하지 않고 더 빠르고 가벼우며 배포하기 쉬운 진정한 엔드 투 엔드 솔루션을 제공합니다. 새로운 프로젝트, 특히 에지 AI를 대상으로 하거나 최소한의 대기 시간이 필요한 프로젝트의 경우 YOLOv10이 권장되는 선택입니다.
YOLOv7은 여전히 유능한 모델이지만, NMS에 대한 의존성과 덜 효율적인 아키텍처로 인해 광범위한 커뮤니티 리소스가 주요 고려 사항인 레거시 프로젝트 또는 시나리오에 더 적합합니다. 최고의 성능, 사용 편의성 및 포괄적인 생태계를 찾는 개발자에게는 YOLOv10과 같은 Ultralytics 모델이 더 나은 경험을 제공합니다. Ultralytics HUB와의 통합은 교육 및 배포를 더욱 간소화하여 고급 컴퓨터 비전을 그 어느 때보다 쉽게 접근할 수 있도록 합니다.
다른 모델 살펴보기
더 자세한 내용을 알아보려면 Ultralytics 문서에서 제공되는 다른 최첨단 모델을 살펴보십시오.
- Ultralytics YOLOv8: 감지, 분할 및 자세 추정을 포함한 여러 비전 작업에서 뛰어난 성능을 발휘하는 매우 다재다능한 모델입니다.
- YOLOv9: 심층 네트워크에서 정보 손실을 해결하기 위해 PGI(Programmable Gradient Information)와 같은 혁신 기술을 도입했습니다.
- YOLO11: 최첨단 성능, 다중 작업 지원 및 탁월한 사용 편의성을 제공하는 최신 공식 Ultralytics 모델입니다.