YOLOv7 vs YOLO11: 상세 기술 비교
최적의 객체 감지 모델을 선택하려면 다양한 아키텍처의 특정 기능과 장단점에 대한 깊은 이해가 필요합니다. 이 페이지에서는 YOLO 계보의 두 가지 강력한 모델인 YOLOv7과 Ultralytics YOLO11 간의 포괄적인 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 것을 선택하는 데 도움이 되도록 아키텍처 차이점, 성능 벤치마크 및 이상적인 사용 사례를 자세히 살펴보겠습니다.
YOLOv7: 효율적이고 정확한 객체 탐지
YOLOv7은 실시간 객체 탐지 분야의 중요한 발전으로 소개되었으며, 추론 비용 증가 없이 훈련 효율성과 정확성을 최적화하는 데 중점을 두었습니다. 출시 당시 실시간 검출기의 새로운 최첨단 기술을 확립했습니다.
작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/
아키텍처 및 주요 기능
YOLOv7은 몇 가지 주요 혁신을 도입하여 이전 YOLO 아키텍처를 기반으로 구축되었습니다. 특징 추출 및 학습을 개선하기 위해 백본에 E-ELAN(Extended Efficient Layer Aggregation Networks)과 같은 기술을 사용합니다. 주요 기여는 추론 중에 계산 오버헤드를 추가하지 않고 최종 모델 정확도를 높이기 위해 훈련 중에 적용되는 최적화 전략(예: 보조 감지 헤드 및 coarse-to-fine 지침)과 관련된 "trainable bag-of-freebies" 개념입니다. 주로 객체 감지에 중점을 두지만 공식 리포지토리는 포즈 추정 및 인스턴스 분할과 같은 작업에 대한 커뮤니티 확장을 보여줍니다.
성능 및 사용 사례
YOLOv7은 출시 시 최첨단 성능을 입증하여 속도와 정확성 간의 강력한 균형을 제공했습니다. 예를 들어 YOLOv7x 모델은 640 이미지 크기에서 MS COCO 데이터 세트에 대해 53.1% mAPtest를 달성합니다. 효율성 덕분에 고급 보안 시스템 및 빠르고 정확한 감지가 필요한 자율 시스템과 같은 실시간 응용 프로그램에 적합합니다.
강점
- 높은 정확도 및 속도 균형: GPU에서 실시간 작업을 위해 mAP와 추론 속도의 강력한 조합을 제공합니다.
- 효율적인 훈련: 추론 비용을 늘리지 않고 정확도를 향상시키기 위해 고급 훈련 기술("bag-of-freebies")을 활용합니다.
- 검증된 성능: MS COCO와 같은 표준 벤치마크에서 입증된 결과를 제공합니다.
약점
- 복잡성: 아키텍처와 학습 기법은 완전히 파악하고 최적화하기에 복잡할 수 있습니다.
- 리소스 집약적: 더 큰 YOLOv7 모델은 훈련에 상당한 GPU 리소스가 필요합니다.
- 제한적인 작업 다양성: 주로 객체 감지에 중점을 두어 YOLO11과 같은 통합 모델과 달리 분할 또는 분류와 같은 다른 작업에는 별도의 구현이 필요합니다.
- 유지 관리 부족: 이 프레임워크는 Ultralytics 생태계만큼 활발하게 개발되거나 유지 관리되지 않아 업데이트가 적고 커뮤니티 지원이 약합니다.
Ultralytics YOLO11: 최첨단 효율성 및 다재다능함
Ultralytics YOLO11은 Ultralytics의 YOLO 시리즈의 최신 진화로, 사용자 친화적인 프레임워크 내에서 뛰어난 정확성, 향상된 효율성 및 더 넓은 작업 다재다능성을 위해 설계되었습니다. YOLOv8과 같은 이전 모델의 성공을 기반으로 최첨단 경험을 제공합니다.
작성자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/
아키텍처 및 주요 기능
YOLO11의 아키텍처는 고급 특징 추출 기술과 간소화된 네트워크 설계를 통합하여 이전 모델에 비해 더 높은 정확도를 제공하며, 종종 파라미터 수가 감소합니다. 이러한 최적화는 더 빠른 추론 속도와 더 낮은 연산 요구 사항으로 이어지며, 이는 에지 장치에서 클라우드 인프라에 이르기까지 다양한 플랫폼에 배포하는 데 매우 중요합니다.
YOLO11의 주요 장점은 다재다능함입니다. 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(Oriented Bounding Box)를 포함한 여러 컴퓨터 비전 작업을 기본적으로 지원합니다. Ultralytics 생태계에 완벽하게 통합되어 간단한 Python 및 CLI 인터페이스, 광범위한 문서와 효율적인 훈련을 위해 즉시 사용 가능한 사전 훈련된 가중치를 통해 간소화된 사용자 경험을 제공합니다.
성능 및 사용 사례
YOLO11은 다양한 모델 크기에서 인상적인 평균 정밀도(mAP) 점수를 보여주며 속도와 정확도 간의 유리한 균형을 달성합니다. 예를 들어 YOLO11m은 YOLOv7l보다 매개변수가 훨씬 적은 640 이미지 크기에서 51.5의 mAPval을 달성합니다. YOLO11n과 같은 더 작은 변형은 매우 빠른 추론을 제공하는 반면 YOLO11x와 같은 더 큰 모델은 정확도를 최대화합니다. 특히 YOLO11 모델은 다른 아키텍처에 비해 훈련 및 추론 중에 더 낮은 메모리 사용량을 나타내는 경우가 많습니다.
YOLO11의 향상된 정밀도와 효율성은 정확한 실시간 처리가 필요한 애플리케이션에 이상적입니다.
- 로보틱스: 정확한 내비게이션 및 객체 상호 작용을 가능하게 하며, 로봇 공학에서 AI의 역할에서 살펴봅니다.
- 보안 시스템: 침입 감지를 위한 고급 보안 경보 시스템을 지원합니다.
- 소매 분석: 재고 관리 및 고객 행동 분석을 개선합니다.
- 산업 자동화: 제조 분야에서 품질 관리를 지원합니다.
강점
- 최첨단 성능: 최적화된 앵커 프리 아키텍처로 높은 mAP 점수를 제공합니다.
- 효율적인 추론: 특히 CPU에서 뛰어난 속도를 제공하며 실시간 요구 사항에 적합합니다.
- 다재다능한 작업 지원: 단일 프레임워크에서 감지, 분할, 분류, 포즈 및 OBB를 기본적으로 처리합니다.
- 사용 편의성: 간단한 API, 광범위한 문서 및 노코드 훈련 및 배포를 위한 통합된 Ultralytics HUB 지원을 제공합니다.
- 잘 관리되는 생태계: 활발한 개발, 강력한 커뮤니티, 잦은 업데이트 및 효율적인 훈련 프로세스를 제공합니다.
- 확장성: 더 낮은 메모리 요구 사항으로 엣지에서 클라우드까지 하드웨어 전반에서 효과적으로 작동합니다.
약점
- 더 새로운 모델로서 특정 타사 도구 통합은 기존의 더 확립된 모델에 비해 아직 발전하고 있을 수 있습니다.
- 더 큰 모델은 훈련에 상당한 컴퓨팅 리소스를 요구할 수 있지만, 성능 등급에 비해 매우 효율적입니다.
성능 비교: YOLOv7 vs. YOLO11
다음 표는 COCO 데이터 세트에서 YOLOv7과 YOLO11 모델 간의 자세한 성능 비교를 제공합니다. YOLO11 모델은 정확도, 속도 및 효율성의 뛰어난 균형을 보여줍니다. 예를 들어 YOLO11l은 파라미터와 FLOP 수가 절반 미만으로 YOLOv7x보다 높은 mAP를 달성하고 GPU에서 훨씬 빠릅니다. 마찬가지로 YOLO11m은 파라미터와 계산 비용이 약 절반으로 YOLOv7l의 정확도와 일치합니다. 가장 작은 모델인 YOLO11n은 CPU와 GPU 모두에서 최소한의 리소스 사용으로 놀라운 속도를 제공하므로 에지 애플리케이션에 이상적입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
결론: 어떤 모델을 선택해야 할까요?
YOLOv7은 당시 강력한 모델이었고 여전히 실시간 객체 탐지에 대한 강력한 성능을 제공하지만, Ultralytics YOLO11은 상당한 도약을 나타냅니다. YOLO11은 주요 성능 지표에서 YOLOv7을 능가할 뿐만 아니라 훨씬 더 다재다능하고 사용자 친화적이며 잘 지원되는 프레임워크를 제공합니다.
최신 올인원 솔루션을 찾는 개발자 및 연구자에게는 YOLO11이 명확한 선택입니다. 장점은 다음과 같습니다.
- 뛰어난 성능 균형: YOLO11은 정확도, 속도 및 계산 비용 간에 더 나은 균형을 제공합니다.
- 다중 작업 다재다능함: 감지, 분할, 분류, 자세 및 OBB에 대한 기본 지원으로 여러 모델이 필요 없고 개발 워크플로가 단순화됩니다.
- 사용 편의성: 간소화된 API, 포괄적인 문서 및 간단한 학습 절차를 통해 초보자와 전문가 모두가 쉽게 접근할 수 있습니다.
- 활발한 개발: Ultralytics 생태계의 일부인 YOLO11은 지속적인 업데이트, 강력한 오픈 소스 커뮤니티 및 원활한 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 통해 이점을 얻을 수 있습니다.
요약하자면, 배포 용이성과 미래 보장에 중점을 두고 광범위한 애플리케이션을 위해 최신 AI 발전을 활용하는 것이 우선 순위라면 Ultralytics YOLO11이 권장되는 모델입니다.
다른 모델 살펴보기
더 자세한 내용을 알아보려면 Ultralytics 문서에서 YOLOv7, YOLO11 및 기타 관련 모델과 관련된 다음 비교를 살펴보십시오.
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv10
- YOLOv7 vs YOLOv8
- YOLOv7 vs YOLOv5
- YOLOv9 및 YOLOv10과 같은 최신 모델을 살펴보세요.