콘텐츠로 건너뛰기

YOLOv7 vs YOLOv10: 상세 기술 비교

적절한 객체 탐지 모델을 선택하려면 정확도, 속도 및 배포 요구 사항 간의 균형을 맞춰야 합니다. 이 페이지에서는 실시간 객체 탐지 환경에서 중요한 모델인 YOLOv7과 YOLOv10의 자세한 기술 비교를 제공합니다. 두 모델의 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보고 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움을 드립니다.

YOLOv7: 높은 정확도와 속도

2022년 7월에 소개된 YOLOv7은 속도와 정확성 간의 인상적인 균형으로 빠르게 인정을 받아 당시 새로운 최첨단 벤치마크를 설정했습니다. YOLOv7은 추론 비용을 늘리지 않고 정확도를 향상시키기 위해 "훈련 가능한 Bag-of-Freebies"를 사용하여 훈련 프로세스를 최적화하는 데 중점을 두었습니다.

기술 세부 사항:

아키텍처 및 주요 기능

YOLOv7은 성능 향상을 위해 몇 가지 아키텍처 개선 및 훈련 개선 사항을 도입했습니다.

  • Extended Efficient Layer Aggregation Networks (E-ELAN): 백본의 이 핵심 구성 요소는 기울기 경로를 제어하면서 다양한 특징을 학습하는 네트워크의 능력을 향상시켜 수렴 및 전체 정확도를 개선합니다.
  • 모델 스케일링: 연결 기반 모델을 위한 복합 스케일링 방법을 구현하여 다양한 계산 예산에 맞게 모델 깊이와 너비를 효과적으로 조정할 수 있습니다.
  • 학습 가능한 Bag-of-Freebies: YOLOv7은 추론 중에 오버헤드를 추가하지 않고 성능을 향상시키기 위해 레이블 할당 전략 및 일괄 정규화 조정과 같은 고급 기술을 활용했습니다.
  • 보조 헤드 Coarse-to-fine: 이 모델은 딥 슈퍼비전을 개선하고 모델의 학습 과정을 보다 효과적으로 안내하기 위해 학습 중에 보조 헤드를 사용합니다.

강점과 약점

강점

  • 높은 정확도 및 속도 균형: YOLOv7은 높은 mAP와 빠른 추론 속도의 강력한 조합을 제공하므로 많은 실시간 애플리케이션에 적합합니다.
  • 효율적인 훈련: 이 모델은 추론 중에 계산 요구 사항을 크게 늘리지 않고 성능을 향상시키는 고급 훈련 기술을 통합합니다.
  • 잘 확립됨: 성숙한 모델로서 최신 모델에 비해 더 큰 사용자 기반과 더 많은 커뮤니티 리소스의 이점을 누릴 수 있습니다.

약점

  • NMS 종속성: YOLOv7은 사후 처리를 위해 NMS(Non-Maximum Suppression)에 의존하므로 계산 오버헤드가 추가되고 추론 지연 시간이 늘어납니다.
  • 복잡성: 아키텍처와 학습 전략은 효과적이지만, 완전히 이해하고 사용자 정의 애플리케이션에 맞게 미세 조정하기에는 복잡할 수 있습니다.

사용 사례

YOLOv7은 속도와 정확도의 균형이 중요한 까다로운 애플리케이션에 적합합니다.

  • 고급 감시: 높은 정확도는 보안 시스템에서 객체 또는 위협을 식별하는 데 유용합니다.
  • 자율 시스템: 자율 주행차와 같은 애플리케이션에 대한 강력한 감지 기능을 제공합니다.
  • 산업 자동화: 이 모델은 제조 및 품질 관리에서 신뢰할 수 있는 결함 감지에 사용할 수 있습니다.

YOLOv7에 대해 자세히 알아보세요

YOLOv10: 엔드 투 엔드 실시간 감지

칭화대학교 연구진이 2024년 5월에 발표한 YOLOv10은 실시간 객체 감지 분야에서 상당한 발전을 나타냅니다. 주요 혁신은 Non-Maximum Suppression (NMS)의 필요성을 없애 엔드 투 엔드 솔루션을 만들어 지연 시간을 줄이고 배포 효율성을 향상시킨 것입니다.

기술 세부 사항:

아키텍처 및 주요 기능

YOLOv10은 속도-정확도 절충점을 최적화하기 위한 몇 가지 아키텍처 혁신을 도입했습니다.

  • NMS-Free 학습: 학습 중에 일관된 이중 할당을 활용하여 NMS 후처리 단계 없이 경쟁력 있는 성능을 구현합니다. 이는 배포 파이프라인을 단순화하고 추론 지연 시간을 줄입니다.
  • 전체적인 효율성-정확도 중심 설계: 모델은 계산 중복성을 줄이고 기능을 향상시키기 위해 분류 헤드 및 다운샘플링 레이어와 같은 다양한 구성 요소를 최적화합니다. 여기에는 순위 기반 블록 설계 및 부분적 자체 주의(PSA)와 같은 기술이 포함됩니다.
  • Anchor-Free Approach: 다른 최신 YOLO 모델과 마찬가지로 앵커 프리 검출기 설계를 채택하여 검출 헤드를 단순화하고 일반화 성능을 향상시킵니다.

강점과 약점

강점

  • 높은 효율성: NMS-free 설계 및 기타 아키텍처 최적화는 더 빠른 추론, 더 낮은 지연 시간 및 감소된 연산 비용으로 이어집니다.
  • 경쟁력 있는 정확도: 속도를 크게 향상시키고 모델 크기를 줄이면서도 강력한 정확도를 유지합니다.
  • End-to-End 배포: NMS를 제거하면 배포 파이프라인이 간소화되어 애플리케이션에 더 쉽게 통합할 수 있습니다.

약점

  • 상대적으로 신규 모델: 최신 모델이므로 커뮤니티 지원 및 실제 사례 수가 YOLOv7 또는 Ultralytics YOLOv8과 같은 기존 모델에 비해 덜 광범위할 수 있습니다.
  • 최적 성능을 위한 튜닝: 최상의 결과를 얻으려면 신중한 하이퍼파라미터 튜닝이 필요할 수 있으며, 모델 학습 팁과 같은 리소스의 도움을 받을 수 있습니다.

사용 사례

YOLOv10은 실시간 효율성에 중점을 두어 리소스가 제한된 환경에 이상적입니다.

  • Edge AI 애플리케이션: 낮은 지연 시간이 중요한 NVIDIA Jetson 또는 Raspberry Pi와 같은 장치에 배포하는 데 적합합니다.
  • 로보틱스: 내비게이션 및 상호 작용을 위한 더 빠른 인식을 가능하게 하며, 이는 로보틱스 분야에서 AI의 역할의 핵심적인 측면입니다.
  • 자율 드론: 가볍고 빠른 아키텍처는 드론 및 기타 무인 항공기에서 빠른 객체 감지에 적합합니다.

YOLOv10에 대해 자세히 알아보세요

정면 대결 성능 비교

YOLOv7과 YOLOv10을 비교할 때 가장 중요한 차이점은 설계 철학에 있습니다. YOLOv7은 높은 정확도와 속도 간의 균형을 추구하여 강력한 범용 감지기가 됩니다. 대조적으로 YOLOv10은 NMS를 제거하여 계산 효율성과 낮은 대기 시간을 우선시하므로 엣지 장치에서 실시간 애플리케이션에 적합한 선택입니다.

아래 표는 YOLOv10 모델이 유사한 mAP 수준에서 YOLOv7 모델보다 일관되게 더 낮은 대기 시간을 달성하고 더 적은 파라미터와 FLOP을 필요로 한다는 것을 보여줍니다. 예를 들어, YOLOv10b는 6.54ms의 대기 시간으로 52.7 mAP를 달성하여 유사한 mAP를 갖지만 대기 시간이 더 높은 YOLOv7l보다 성능이 뛰어납니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

결론 및 권장 사항

YOLOv7과 YOLOv10은 모두 강력한 모델이지만, 서로 다른 요구 사항을 충족합니다. YOLOv7은 높은 mAP 달성이 우선 순위인 애플리케이션에 적합한 강력하고 정확한 검출기입니다. YOLOv10은 혁신적인 NMS-free 아키텍처를 통해 특히 엔드 투 엔드 배포에서 최고의 효율성과 최저 지연 시간을 요구하는 애플리케이션에 적합합니다.

최신식의 다재다능하고 사용자 친화적인 프레임워크를 찾는 개발자에게 Ultralytics YOLOv8 및 최신 YOLO11과 같은 Ultralytics 생태계의 모델은 종종 더 매력적인 선택을 제시합니다. 이러한 모델은 다음을 제공합니다.

  • 사용 편의성: 간소화된 Python API, 광범위한 문서 및 간단한 CLI 명령어를 제공합니다.
  • 잘 관리되는 에코시스템: 활발한 개발, 강력한 오픈 소스 커뮤니티, 그리고 원활한 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 제공합니다.
  • 작업 다양성: 분할, 분류, 포즈 추정방향 객체 탐지(OBB)를 포함하여 객체 탐지 외에 여러 작업을 지원합니다.

다른 모델 살펴보기

다른 모델에 관심이 있다면 다음 추가 비교 자료를 확인해 보세요.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글