콘텐츠로 건너뛰기

YOLO11 YOLOv7: 자세한 기술 비교

올바른 객체 감지 모델을 선택하는 것은 컴퓨터 비전 애플리케이션의 속도, 정확성 및 확장성에 영향을 미치는 중요한 결정입니다. 이 가이드에서는 다음과 같은 두 가지 모델을 심층적으로 비교합니다. Ultralytics YOLO11YOLOv7YOLO 두 가지 중요한 이정표에 대해 설명합니다. YOLOv7 2022년에 큰 도약을 이루었다면, 최근 출시된 YOLO11 최신 AI 개발을 위한 최첨단 성능을 재정의하는 아키텍처 개선 사항을 도입했습니다.

Ultralytics YOLO11: 비전 AI의 새로운 표준

2024년 말 출시, Ultralytics YOLO11 은 이전 버전의 강력한 기반을 바탕으로 탁월한 효율성과 다용도성을 제공합니다. 이 제품은 단일 통합 프레임워크 내에서 다양한 컴퓨터 비전 작업을 처리하도록 설계되었습니다.

아키텍처 및 혁신

YOLO11 C3k2 블록과 C2PSA (공간 주의 교차 단계 부분) 메커니즘을 특징으로 하는 개선된 아키텍처를 도입했습니다. 이러한 개선 사항을 통해 이전 세대에 비해 파라미터 수를 줄이면서 더 세밀하게 특징을 추출할 수 있습니다. 이 아키텍처는 속도에 최적화되어 있어 더 큰 규모의 모델 변형도 표준 하드웨어에서 실시간 추론 기능을 유지할 수 있습니다.

YOLO11 가장 큰 특징은 인스턴스 분할, 포즈 추정, 방향성 경계 상자(OBB) 감지, 이미지 분류객체 감지 이상의 다양한 작업을 기본적으로 지원한다는 점입니다.

Ultralytics 에코시스템 통합

YOLO11 개발자가 데이터 관리, 모델 훈련 및 배포를 위한 도구에 원활하게 액세스할 수 있도록 Ultralytics 에코시스템에 완전히 통합되어 있습니다. 이러한 통합은 MLOps 파이프라인의 복잡성을 크게 줄여주어 팀이 프로토타입에서 프로덕션으로 더 빠르게 이동할 수 있게 해줍니다.

YOLO11에 대해 자세히 알아보세요

YOLOv7: 효율적인 교육의 벤치마크

2022년 중반에 출시된 YOLOv7 추론 비용을 늘리지 않고 높은 정확도를 달성하기 위해 학습 프로세스를 최적화하는 데 중점을 두었습니다. 이후 이 분야의 후속 연구에 영향을 준 몇 가지 새로운 개념을 도입했습니다.

아키텍처 및 혁신

YOLOv7 핵심은 원래 그라데이션 경로를 파괴하지 않고 모델의 학습 능력을 향상시키는 E-ELAN (확장 효율 레이어 집계 네트워크)입니다. 또한 저자들은 모델 재파라미터화 및 보조 감지 헤드와같은 최적화 전략의 모음인 '훈련 가능한 공짜 백'을 소개하여 훈련 중에는 정확도를 높이고 추론 중에는 간소화합니다.

YOLOv7 출시 당시 인상적인 벤치마크를 세웠지만, 주로 객체 감지 아키텍처입니다. 세분화나 포즈 추정과 같은 다른 작업에 적용하려면 종종 코드베이스의 특정 분기 또는 포크가 필요하며, 이는 최신 모델의 통합 접근 방식과 대조적입니다.

레거시 아키텍처

YOLOv7 앵커 기반 탐지 방법과 복잡한 보조 헤드에 의존합니다. 이러한 아키텍처 선택은 효과적이기는 하지만 최신 Ultralytics 모델에서 볼 수 있는 간소화된 앵커 없는 설계에 비해 엣지 배포를 위해 모델을 사용자 지정하고 최적화하기가 더 어려울 수 있습니다.

YOLOv7 대해 자세히 알아보기

성능 분석: 속도, 정확도 및 효율성

기술 지표를 비교해보면 YOLO11 아키텍처의 발전이 분명하게 드러납니다. 최신 모델은 훨씬 적은 수의 파라미터와 빠른 추론 속도로 비슷하거나 더 뛰어난 정확도를 달성합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

주요 내용

  1. 파라미터 효율성: YOLO11 모델 크기를 대폭 줄였습니다. 예를 들어, YOLO11l은 거의 65% 더 적은 매개변수 (25.3M 대 71.3M)를 사용하면서도 YOLOv7x의 정확도(53.4% 대 53.1% mAP)를 능가합니다. 이러한 감소는 스토리지와 메모리가 제한된 디바이스에 모델을 배포하는 데 매우 중요합니다.
  2. 추론 속도: YOLO11 아키텍처 최적화는 속도와 직결됩니다. T4 GPU TensorRT를 사용하는 T4 GPU에서 YOLO11l은 YOLOv7x보다 거의 2배 빠릅니다. CPU 애플리케이션의 경우, 가벼운 YOLO11n은 놀라운 속도(56.1ms)를 제공하여 YOLOv7 변형이 어려움을 겪는 에지 하드웨어에서 실시간 감지를 가능하게 합니다.
  3. 계산 요구 사항: YOLO11 모델의 경우 FLOPs (부동 소수점 연산) 수가 현저히 낮습니다. 연산 부하가 낮기 때문에 전력 소비와 발열이 적어 배터리로 구동되는 엣지 AI 디바이스에 매우 적합합니다.

에코시스템 및 개발자 경험

원시 메트릭 외에도 개발자 경험은 주요 차별화 요소입니다. Ultralytics YOLO 모델은 사용 편의성과 강력한 에코시스템으로 잘 알려져 있습니다.

간소화된 워크플로

YOLOv7 일반적으로 리포지토리를 복제하고 교육 및 테스트를 위해 복잡한 셸 스크립트와 상호 작용해야 합니다. 이와는 대조적으로 YOLO11 표준 Python 패키지(ultralytics). 이를 통해 개발자는 몇 줄의 코드만으로 고급 컴퓨터 비전 기능을 소프트웨어에 통합할 수 있습니다.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train the model with a single command
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

다목적성 및 교육 효율성

YOLO11 다양한 작업을 즉시 지원합니다. 프로젝트 요구 사항이 단순한 바운딩 박스에서 다음과 같이 바뀌는 경우 인스턴스 분할 또는 포즈 추정를 사용하면 개발자는 모델 웨이트 파일을 간단히 전환할 수 있습니다(예 yolo11n-seg.pt) 전체 코드베이스나 파이프라인을 변경하지 않고도 가능합니다. YOLOv7 일반적으로 이러한 작업에 대한 특정 포크를 찾아서 구성해야 합니다.

또한 YOLO11 훈련 효율성이 뛰어납니다. 이 모델은 최신 최적화 기술을 활용하고 고품질의 사전 훈련된 가중치를 제공하며, 종종 이전 아키텍처보다 더 빠르게 수렴합니다. 이러한 효율성은 메모리 요구 사항으로 확장되어, Ultralytics 모델은 훈련 중 CUDA 메모리 사용량을 최소화하도록 최적화되어 구형 또는 트랜스포머 기반 탐지기를 괴롭히는 일반적인 메모리 부족(OOM) 오류를 방지합니다.

문서 및 지원

Ultralytics 광범위한 문서와 활기찬 커뮤니티를 유지 관리합니다. 사용자는 잦은 업데이트, 버그 수정 및 엔터프라이즈 지원을 위한 명확한 경로를 통해 혜택을 누릴 수 있습니다. 반대로, YOLOv7 리포지토리는 역사적으로 중요하지만 유지 관리가 활발하지 않아 장기적인 프로덕션 배포에 위험을 초래할 수 있습니다.

실제 응용 분야

  • 리테일 분석: YOLO11 높은 정확도와 속도를 통해 표준 매장 하드웨어에서 실시간 고객 행동 추적 및 재고 모니터링을 수행할 수 있습니다.
  • 자율 로봇 공학: YOLO11n은 지연 시간이 짧아 밀리초 단위가 중요한 드론과 로봇의 내비게이션 및 장애물 회피에 이상적입니다.
  • 의료 이미지: 세분화를 기본적으로 지원하는 YOLO11 의료 스캔에서 이상 징후를 빠르게 식별하고 윤곽을 그리는 데 높은 정밀도로 적용할 수 있습니다.
  • 산업 검사: OBB(오리엔티드 바운딩 박스)를 처리할 수 있는 YOLO11 조립 라인에서 회전된 부품이나 텍스트를 감지하는 데 탁월하며, 이는 표준 YOLOv7 기본적으로 제공되지 않는 기능입니다.

결론

YOLOv7 여전히 유능한 모델이며 2022년 컴퓨터 비전의 빠른 발전을 보여주는 증거입니다, Ultralytics YOLO11 은 최신 AI 개발을 위한 최고의 선택입니다. 성능, 효율성, 유용성 면에서 탁월한 균형을 제공합니다.

개발자와 연구자들은 YOLO11 전환하면 추론 시간 단축, 하드웨어 비용 절감, 다양한 비전 작업을 위한 통합 워크플로우 등 즉각적인 이점을 누릴 수 있습니다. 활발한 Ultralytics 에코시스템의 지원을 받는 YOLO11 단순한 모델이 아니라 실제 세계에 최첨단 컴퓨터 비전을 배포하기 위한 포괄적인 솔루션입니다.

추가 탐색

더 많은 비교를 통해 특정 요구 사항에 가장 적합한 모델을 찾아보세요:


댓글