콘텐츠로 건너뛰기

YOLO YOLOv7: 자세한 기술 비교

객체 감지를 위한 최적의 아키텍처를 선택하는 것은 컴퓨터 비전 개발에서 중요한 결정입니다. 이러한 선택은 종종 배포 하드웨어 제약을 고려하면서 추론 지연 시간과 감지 정확도 간의 균형을 맞춰야 합니다. 이 기술 비교에서는 실시간 감지의 한계를 뛰어넘은 2022년에 출시된 영향력 있는 두 가지 모델인 YOLO YOLOv7 살펴봅니다. 아키텍처 혁신, 벤치마크 성능, 이상적인 애플리케이션 시나리오를 분석하여 모델 선택 프로세스를 탐색하는 데 도움을 드립니다.

YOLO: 엣지 효율성을 위한 신경 아키텍처 검색

YOLO 산업 애플리케이션의 성능을 극대화하는 데 중점을 두고 알리바바 그룹에서 개발했습니다. 신경망 아키텍처 검색(NAS)을 통합하여 백본 설계를 자동화하고 최적의 효율성을 보장한다는 점에서 차별화됩니다.

아키텍처 혁신

YOLO 높은 정밀도를 유지하면서 계산 오버헤드를 줄이기 위한 몇 가지 최첨단 기술을 도입했습니다:

  1. MAE-NAS 백본(GiraffeNet): 기존의 수동으로 설계된 백본과 달리, YOLO 방법 인식 효율성(MAE) NAS 접근 방식을 활용합니다. 그 결과, 다양한 하드웨어 제약 조건에서 부동 소수점 연산(FLOP)과 지연 시간 간에 탁월한 절충점을 제공하는 GiraffeNet이라는 백본 시리즈가 탄생했습니다.
  2. 효율적인 RepGFPN: 이 모델은 재파라미터화를 통해 최적화된 일반화된 특징 피라미드 네트워크(GFPN)를 특징으로 합니다. 이 "RepGFPN"은 효율적인 멀티스케일 특징 융합을 가능하게 하며, 표준 FPN과 관련된 과중한 계산 비용 없이 다양한 크기의 물체를 감지하는 데 필수적입니다.
  3. 제로헤드: 새로운 "제로헤드" 설계로 탐지 헤드를 대폭 간소화했습니다. 분류와 회귀 작업을 분리하고 복잡한 특정 레이어를 제거함으로써 추론 중에 헤드의 매개변수 수를 0으로 줄여 메모리를 절약하고 속도를 향상시킵니다.
  4. AlignedOTA: 훈련의 안정성과 정확도를 향상시키기 위해 YOLO 분류 신뢰도와 회귀 정확도 사이의 잘못된 정렬 문제를 해결하는 동적 라벨 할당 전략인 AlignedOTA를 사용합니다.

강점 및 사용 사례

YOLO 지연 시간이 중요한 환경에서 탁월한 성능을 발휘합니다. 더 작은 버전(Tiny/Small)은 엣지 AI 배포에 특히 효과적입니다.

  • 산업 자동화: 밀리초가 중요한 고속 조립 라인에 이상적입니다.
  • 모바일 애플리케이션: 매개변수 수가 적기 때문에 컴퓨팅 성능이 제한된 스마트폰에서 실행하기에 적합합니다.

DAMO-YOLO에 대해 자세히 알아보세요.

YOLOv7: 실시간 정확도 최적화

YOLO 직전에 출시된 YOLOv7 5 FPS~160 FPS 범위에서 최첨단 성능의 새로운 벤치마크를 세웠습니다. 추론 비용을 늘리지 않고 더 높은 정확도를 달성하기 위해 훈련 과정과 그라데이션 흐름을 최적화하는 데 중점을 두었습니다.

아키텍처 혁신

YOLOv7 추론 모델 구조에 영향을 주지 않으면서 학습 중 정확도를 향상시키는 '공짜 가방' 방법을 도입했습니다:

  1. E-ELAN(확장 효율적 계층 집계 네트워크): 이 아키텍처는 최단 및 최장 그라데이션 경로를 제어하여 네트워크가 보다 다양한 특징을 학습할 수 있도록 합니다. 원래의 그라데이션 경로 상태를 파괴하지 않고 '카디널리티'의 학습 능력을 향상시킵니다.
  2. 연결 기반 모델을 위한 모델 스케일링: YOLOv7 연결 기반 아키텍처에 대해 깊이와 너비를 동시에 확장하는 복합 확장 방법을 제안하여 파라미터를 최적으로 활용할 수 있도록 합니다.
  3. 훈련 가능한 백 오브 프리비: 계획된 재파라미터화 및 보조 헤드 감독(거칠게-세밀하게)과 같은 기법이 사용됩니다. 이러한 기법은 훈련 중에 모델의 견고성과 정확성을 향상시키지만 추론 중에 병합되거나 폐기되어 모델을 빠르게 유지합니다.

강점 및 사용 사례

YOLOv7 범용 객체 감지의 강자로, MS COCO 같은 표준 데이터 세트에서 뛰어난 평균 정밀도(mAP) 를 제공합니다.

  • 스마트 시티 감시: 높은 정확도로 복잡한 도시 환경에서 보행자와 차량을 안정적으로 감지할 수 있습니다.
  • 자율 시스템: 더 높은 해상도 입력이 유리한 장거리에서 안정적인 감지가 필요한 로봇 공학 및 드론에 적합합니다.

YOLOv7 대해 자세히 알아보기

성능 비교

다음 표는 YOLO YOLOv7 성능을 비교한 것입니다. YOLO 규모에 비해 지연 시간(속도)이 더 짧은 경우가 많지만, YOLOv7 일반적으로 특히 대규모 구성에서 정확도에 대한 높은 평판을 유지합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

데이터는 제약이 많은 환경의 경우 YOLO 매우 가벼운 솔루션을 제공한다는 것을 보여줍니다(작은 버전의 경우 8.5M 매개변수). 하지만 YOLOv7 은 계산 비용은 더 높지만 53.1%의 mAP 달성하는 X-배리언트로 정확도의 한계를 뛰어넘습니다.

아키텍처 트레이드 오프

YOLO NAS 기반 백본은 지연 시간을 위해 특별히 최적화되어 있지만, YOLOv7 수동 아키텍처 설계는 그라데이션 흐름 효율에 중점을 두고 있습니다. 이론적 FLOP이 실제 추론 속도와 항상 완벽하게 일치하는 것은 아니므로, 사용자는 자신의 특정 하드웨어에서 두 가지를 모두 벤치마킹해야 합니다.

Ultralytics 이점: 왜 업그레이드해야 할까요?

YOLO YOLOv7 모두 컴퓨터 비전 역사에서 중요한 업적을 남겼지만, 이 분야는 빠르게 진화하고 있습니다. 가장 강력하고 다재다능하며 사용하기 쉬운 솔루션을 찾는 개발자를 위한 솔루션입니다, Ultralytics YOLO11YOLOv8 을 추천합니다.

Ultralytics 모델은 단순한 연구 결과물이 아니라 포괄적인 생산 도구로 설계되었습니다. 사용성, 통합 및 유지 관리와 같은 AI 배포의 '라스트 마일' 문제를 해결합니다.

Ultralytics 애널리틱스 모델의 주요 이점

  • 사용 편의성: 통합 Python API와 CLI 사용하면 몇 줄의 코드만으로 최첨단 모델을 훈련할 수 있습니다. 복잡한 구성 파일을 수동으로 조정하거나 종속성 문제로 고민할 필요가 없습니다.
  • 잘 관리된 에코시스템: Ultralytics 빈번한 업데이트를 통해 버그를 신속하게 식별하고 수정하는 활발한 에코시스템을 제공합니다. 광범위한 문서와 활발한 커뮤니티 채널을 통해 쉽게 지원을 받을 수 있습니다.
  • 성능 균형: 다음과 같은 모델 YOLO11 와 같은 모델은 고급 앵커 프리 감지 헤드와 최적화된 백본을 사용하여 YOLOv7 및 YOLO 비해 뛰어난 속도 대비 정확도 비율을 달성합니다.
  • 다목적성: 탐지 기능에만 국한된 기존 모델과 달리, Ultralytics YOLO 인스턴스 세분화, 포즈 추정, OBB(지향 객체 감지), 분류를 즉시 지원합니다.
  • 훈련 효율성: 사전 학습된 가중치와 최적화된 데이터 로더가 더 빠른 컨버전스를 보장하여 GPU 시간과 에너지를 절약합니다.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Train on COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

YOLO11에 대해 자세히 알아보세요

결론

YOLO YOLOv7 각각 뚜렷한 장점을 가지고 있습니다. YOLO 에지 추론 속도가 주요 제약 조건인 프로젝트에 적합한 강력한 후보로, NAS를 활용하여 밀리초를 단축할 수 있습니다. YOLOv7 은 검증된 아키텍처 계보로 높은 정확도의 탐지를 원하는 연구자들에게 여전히 확고한 선택입니다.

그러나 오늘날 대부분의 상업용 및 연구용 애플리케이션에서는 Ultralytics YOLO 에코시스템은 탁월한 경험을 제공합니다. 최첨단 성능과 탁월한 사용 편의성 및 다용도성을 결합한 Ultralytics 모델을 통해 개발자는 코드 디버깅 대신 가치 구축에 집중할 수 있습니다. 클라우드 서버에 배포하든 NVIDIA Jetson과 같은 엣지 디바이스에 배포하든, Ultralytics 프로덕션을 위한 가장 간소화된 경로를 제공합니다.

기타 모델

객체 감지 아키텍처를 탐색하고 있다면 이러한 모델에도 관심이 있을 수 있습니다:

  • Ultralytics YOLOv8: 탐지, 세분화 및 포즈 작업을 지원하는 매우 다재다능한 모델입니다.
  • Ultralytics YOLO11: 최첨단 효율성을 제공하는 YOLO 시리즈의 최신 버전입니다.
  • RT-DETR: NMS 지연을 방지하는 실시간 변압기 기반 검출기입니다.
  • YOLOv9: 향상된 학습을 위한 프로그래밍 가능한 그라데이션 정보(PGI)를 제공합니다.
  • YOLOv10: 지연 시간을 줄이기 위해 NMS 엔드투엔드 교육에 중점을 둡니다.

댓글