콘텐츠로 건너뛰기

YOLOv7 vs YOLO11: 상세 기술 비교

최적의 객체 감지 모델을 선택하려면 다양한 아키텍처의 특정 기능과 장단점에 대한 깊은 이해가 필요합니다. 이 페이지에서는 YOLO 계보의 두 가지 강력한 모델인 YOLOv7과 Ultralytics YOLO11 간의 포괄적인 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 것을 선택하는 데 도움이 되도록 아키텍처 차이점, 성능 벤치마크 및 이상적인 사용 사례를 자세히 살펴보겠습니다.

YOLOv7: 효율적이고 정확한 객체 탐지

YOLOv7은 실시간 객체 탐지 분야의 중요한 발전으로 소개되었으며, 추론 비용 증가 없이 훈련 효율성과 정확성을 최적화하는 데 중점을 두었습니다. 출시 당시 실시간 검출기의 새로운 최첨단 기술을 확립했습니다.

작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/

아키텍처 및 주요 기능

YOLOv7은 몇 가지 주요 혁신을 도입하여 이전 YOLO 아키텍처를 기반으로 구축되었습니다. 특징 추출 및 학습을 개선하기 위해 백본에 E-ELAN(Extended Efficient Layer Aggregation Networks)과 같은 기술을 사용합니다. 주요 기여는 추론 중에 계산 오버헤드를 추가하지 않고 최종 모델 정확도를 높이기 위해 훈련 중에 적용되는 최적화 전략(예: 보조 감지 헤드 및 coarse-to-fine 지침)과 관련된 "trainable bag-of-freebies" 개념입니다. 주로 객체 감지에 중점을 두지만 공식 리포지토리는 포즈 추정인스턴스 분할과 같은 작업에 대한 커뮤니티 확장을 보여줍니다.

성능 및 사용 사례

YOLOv7은 출시 시 최첨단 성능을 입증하여 속도와 정확성 간의 강력한 균형을 제공했습니다. 예를 들어 YOLOv7x 모델은 640 이미지 크기에서 MS COCO 데이터 세트에 대해 53.1% mAPtest를 달성합니다. 효율성 덕분에 고급 보안 시스템 및 빠르고 정확한 감지가 필요한 자율 시스템과 같은 실시간 응용 프로그램에 적합합니다.

강점

  • 높은 정확도 및 속도 균형: GPU에서 실시간 작업을 위해 mAP와 추론 속도의 강력한 조합을 제공합니다.
  • 효율적인 훈련: 추론 비용을 늘리지 않고 정확도를 향상시키기 위해 고급 훈련 기술("bag-of-freebies")을 활용합니다.
  • 검증된 성능: MS COCO와 같은 표준 벤치마크에서 입증된 결과를 제공합니다.

약점

  • 복잡성: 아키텍처와 학습 기법은 완전히 파악하고 최적화하기에 복잡할 수 있습니다.
  • 리소스 집약적: 더 큰 YOLOv7 모델은 훈련에 상당한 GPU 리소스가 필요합니다.
  • 제한적인 작업 다양성: 주로 객체 감지에 중점을 두어 YOLO11과 같은 통합 모델과 달리 분할 또는 분류와 같은 다른 작업에는 별도의 구현이 필요합니다.
  • 유지 관리 부족: 이 프레임워크는 Ultralytics 생태계만큼 활발하게 개발되거나 유지 관리되지 않아 업데이트가 적고 커뮤니티 지원이 약합니다.

YOLOv7에 대해 자세히 알아보세요

Ultralytics YOLO11: 최첨단 효율성 및 다재다능함

Ultralytics YOLO11Ultralytics의 YOLO 시리즈의 최신 진화로, 사용자 친화적인 프레임워크 내에서 뛰어난 정확성, 향상된 효율성 및 더 넓은 작업 다재다능성을 위해 설계되었습니다. YOLOv8과 같은 이전 모델의 성공을 기반으로 최첨단 경험을 제공합니다.

작성자: Glenn Jocher 및 Jing Qiu
소속: Ultralytics
날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/

아키텍처 및 주요 기능

YOLO11의 아키텍처는 고급 특징 추출 기술과 간소화된 네트워크 설계를 통합하여 이전 모델에 비해 더 높은 정확도를 제공하며, 종종 파라미터 수가 감소합니다. 이러한 최적화는 더 빠른 추론 속도와 더 낮은 연산 요구 사항으로 이어지며, 이는 에지 장치에서 클라우드 인프라에 이르기까지 다양한 플랫폼에 배포하는 데 매우 중요합니다.

YOLO11의 주요 장점은 다재다능함입니다. 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(Oriented Bounding Box)를 포함한 여러 컴퓨터 비전 작업을 기본적으로 지원합니다. Ultralytics 생태계에 완벽하게 통합되어 간단한 PythonCLI 인터페이스, 광범위한 문서효율적인 훈련을 위해 즉시 사용 가능한 사전 훈련된 가중치를 통해 간소화된 사용자 경험을 제공합니다.

성능 및 사용 사례

YOLO11은 다양한 모델 크기에서 인상적인 평균 정밀도(mAP) 점수를 보여주며 속도와 정확도 간의 유리한 균형을 달성합니다. 예를 들어 YOLO11m은 YOLOv7l보다 매개변수가 훨씬 적은 640 이미지 크기에서 51.5의 mAPval을 달성합니다. YOLO11n과 같은 더 작은 변형은 매우 빠른 추론을 제공하는 반면 YOLO11x와 같은 더 큰 모델은 정확도를 최대화합니다. 특히 YOLO11 모델은 다른 아키텍처에 비해 훈련 및 추론 중에 더 낮은 메모리 사용량을 나타내는 경우가 많습니다.

YOLO11의 향상된 정밀도와 효율성은 정확한 실시간 처리가 필요한 애플리케이션에 이상적입니다.

  • 로보틱스: 정확한 내비게이션 및 객체 상호 작용을 가능하게 하며, 로봇 공학에서 AI의 역할에서 살펴봅니다.
  • 보안 시스템: 침입 감지를 위한 고급 보안 경보 시스템을 지원합니다.
  • 소매 분석: 재고 관리 및 고객 행동 분석을 개선합니다.
  • 산업 자동화: 제조 분야에서 품질 관리를 지원합니다.

강점

  • 최첨단 성능: 최적화된 앵커 프리 아키텍처로 높은 mAP 점수를 제공합니다.
  • 효율적인 추론: 특히 CPU에서 뛰어난 속도를 제공하며 실시간 요구 사항에 적합합니다.
  • 다재다능한 작업 지원: 단일 프레임워크에서 감지, 분할, 분류, 포즈 및 OBB를 기본적으로 처리합니다.
  • 사용 편의성: 간단한 API, 광범위한 문서 및 노코드 훈련 및 배포를 위한 통합된 Ultralytics HUB 지원을 제공합니다.
  • 잘 관리되는 생태계: 활발한 개발, 강력한 커뮤니티, 잦은 업데이트 및 효율적인 훈련 프로세스를 제공합니다.
  • 확장성: 더 낮은 메모리 요구 사항으로 엣지에서 클라우드까지 하드웨어 전반에서 효과적으로 작동합니다.

약점

  • 더 새로운 모델로서 특정 타사 도구 통합은 기존의 더 확립된 모델에 비해 아직 발전하고 있을 수 있습니다.
  • 더 큰 모델은 훈련에 상당한 컴퓨팅 리소스를 요구할 수 있지만, 성능 등급에 비해 매우 효율적입니다.

YOLO11에 대해 자세히 알아보세요

성능 비교: YOLOv7 vs. YOLO11

다음 표는 COCO 데이터 세트에서 YOLOv7과 YOLO11 모델 간의 자세한 성능 비교를 제공합니다. YOLO11 모델은 정확도, 속도 및 효율성의 뛰어난 균형을 보여줍니다. 예를 들어 YOLO11l은 파라미터와 FLOP 수가 절반 미만으로 YOLOv7x보다 높은 mAP를 달성하고 GPU에서 훨씬 빠릅니다. 마찬가지로 YOLO11m은 파라미터와 계산 비용이 약 절반으로 YOLOv7l의 정확도와 일치합니다. 가장 작은 모델인 YOLO11n은 CPU와 GPU 모두에서 최소한의 리소스 사용으로 놀라운 속도를 제공하므로 에지 애플리케이션에 이상적입니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

결론: 어떤 모델을 선택해야 할까요?

YOLOv7은 당시 강력한 모델이었고 여전히 실시간 객체 탐지에 대한 강력한 성능을 제공하지만, Ultralytics YOLO11은 상당한 도약을 나타냅니다. YOLO11은 주요 성능 지표에서 YOLOv7을 능가할 뿐만 아니라 훨씬 더 다재다능하고 사용자 친화적이며 잘 지원되는 프레임워크를 제공합니다.

최신 올인원 솔루션을 찾는 개발자 및 연구자에게는 YOLO11이 명확한 선택입니다. 장점은 다음과 같습니다.

  • 뛰어난 성능 균형: YOLO11은 정확도, 속도 및 계산 비용 간에 더 나은 균형을 제공합니다.
  • 다중 작업 다재다능함: 감지, 분할, 분류, 자세 및 OBB에 대한 기본 지원으로 여러 모델이 필요 없고 개발 워크플로가 단순화됩니다.
  • 사용 편의성: 간소화된 API, 포괄적인 문서 및 간단한 학습 절차를 통해 초보자와 전문가 모두가 쉽게 접근할 수 있습니다.
  • 활발한 개발: Ultralytics 생태계의 일부인 YOLO11은 지속적인 업데이트, 강력한 오픈 소스 커뮤니티 및 원활한 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 통해 이점을 얻을 수 있습니다.

요약하자면, 배포 용이성과 미래 보장에 중점을 두고 광범위한 애플리케이션을 위해 최신 AI 발전을 활용하는 것이 우선 순위라면 Ultralytics YOLO11이 권장되는 모델입니다.

다른 모델 살펴보기

더 자세한 내용을 알아보려면 Ultralytics 문서에서 YOLOv7, YOLO11 및 기타 관련 모델과 관련된 다음 비교를 살펴보십시오.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글