콘텐츠로 건너뛰기

YOLOv7 OLOX: 자세한 기술 비교

빠르게 진화하는 컴퓨터 비전 환경에서 YOLO (You Only Look Once) 모델 제품군은 실시간 객체 감지의 표준을 지속적으로 설정해 왔습니다. 이 역사에서 중요한 두 가지 이정표는 다음과 같습니다. YOLOv7YOLOX입니다. 두 모델 모두 속도와 정확성의 균형을 목표로 하지만, 아키텍처 철학, 특히 앵커 기반과 앵커 프리 방법론에 있어서는 상당한 차이가 있습니다.

이 가이드는 연구자와 엔지니어가 특정 컴퓨터 비전 애플리케이션에 적합한 툴을 선택할 수 있도록 심층적인 기술 비교를 제공합니다. 아키텍처를 분석하고 성능을 벤치마킹하며 다음과 같은 최신 대안을 선택하는 이유를 살펴봅니다. Ultralytics YOLO11 과 같은 최신 대안이 우수한 개발자 경험을 제공하는 이유를 살펴봅니다.

성능 지표: 속도 및 정확성

객체 감지기를 평가할 때는 추론 지연 시간과 평균 정밀도mAP 간의 절충이 가장 중요합니다. 아래 표는 COCO 데이터 세트에서 YOLOv7 YOLOX 변형을 직접 비교한 것입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

결과 분석

이 데이터는 배포 제약 조건에 따라 각 모델 제품군에 대한 뚜렷한 이점을 강조합니다. YOLOv7 은 고성능 브래킷에서 탁월한 효율성을 보여줍니다. 예를 들어, YOLOv7l은 3690만 개의 파라미터로 51.4%의 mAP 달성하여 훨씬 적은 컴퓨팅 리소스를 사용하면서도 YOLOXx (51.1% mAP, 9910만 개의 파라미터)보다 뛰어난 성능을 발휘합니다. 따라서 GPU 효율성이 중요하지만 메모리에 제약이 있는 시나리오에서 YOLOv7 강력한 후보가 될 수 있습니다.

반대로 YOLOX는 경량 카테고리에서 빛을 발합니다. YOLO 모델(0.91M 파라미터)은 가장 작은 표준 YOLO 모델조차 너무 무거울 수 있는 초저전력 엣지 디바이스에 적합한 솔루션을 제공합니다. 확장 가능한 깊이-폭 배율을 통해 다양한 하드웨어 프로파일에 걸쳐 세밀하게 조정할 수 있습니다.

YOLOv7: 최적화된 선물 가방

2022년 7월에 출시된 YOLOv7 추론 비용 없이 교육 프로세스를 최적화하도록 설계된 몇 가지 아키텍처 혁신을 도입했습니다.

  • 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
  • Organization: Institute of Information Science, Academia Sinica, Taiwan
  • 날짜: 2022-07-06
  • Paper:아카이브 링크
  • GitHub:YOLOv7 리포지토리

YOLOv7 대해 자세히 알아보기

건축 하이라이트

YOLOv7 훈련 중에는 정확도를 향상시키지만 추론 중에는 제거되거나 병합되는 최적화 방법인 '훈련 가능한 공짜 가방'에 중점을 둡니다. 주요 기능은 다음과 같습니다:

  1. E-ELAN(확장된 효율적인 레이어 집계 네트워크): 최단 및 최장 경사 경로를 제어하여 다양한 특징을 학습하는 모델의 능력을 향상시키는 개선된 백본 구조입니다.
  2. 모델 스케일링: 단순히 깊이 또는 너비를 스케일링하는 대신 YOLOv7 연결 기반 모델에 복합 스케일링 방법을 사용하여 업스케일링하는 동안 최적의 구조를 유지합니다.
  3. 보조 헤드 거칠게-세밀하게: 보조 손실 헤드는 훈련 중에 감독을 지원하기 위해 사용되며, 추론을 위해 메인 헤드로 다시 매개변수화됩니다.

매개변수 재설정

YOLOv7 추론을 위해 개별 학습 모듈을 수학적으로 단일 컨볼루션 레이어로 병합하는 계획된 재파라미터화를 활용합니다. 이를 통해 학습 중에 얻은 특징 학습 기능의 성능 저하 없이 추론 대기 시간을 크게 단축할 수 있습니다.

욜록스: 닻이 없는 진화

2021년에 출시된 욜록스는 앵커 박스에서 벗어나 시맨틱 세분화 접근 방식과 유사한 앵커 프리 메커니즘으로 전환함으로써 YOLO 패러다임의 변화를 상징합니다.

욜록스 비교에 대해 자세히 알아보기

건축 하이라이트

YOLOX는 이전 버전인 YOLOv4 및 YOLOv5 일반적인 문제점이었던 수동 앵커 박스 튜닝의 필요성을 제거하여 탐지 파이프라인을 간소화했습니다.

  1. 앵커 프리 메커니즘: YOLOX는 물체의 중심을 직접 예측함으로써 앵커와 관련된 복잡한 하이퍼파라미터를 제거하여 다양한 데이터 세트에 대한 일반화를 개선합니다.
  2. 분리된 헤드: 분류와 로컬라이제이션이 하나의 헤드에 결합된 이전 YOLO 버전과 달리, YOLOX는 이를 분리합니다. 따라서 수렴 속도가 빨라지고 정확도가 향상됩니다.
  3. SimOTA: 가장 낮은 비용으로 양성 샘플을 기준 진실에 동적으로 할당하여 분류 및 회귀 손실의 균형을 효과적으로 맞추는 고급 라벨 할당 전략입니다.

Ultralytics 모델이 선호되는 이유

YOLOv7 YOLOX는 아키텍처는 다르지만, 사용성과 에코시스템 지원은 모두 최신 Ultralytics YOLO 모델에 비해 월등히 뛰어납니다. 강력하고 미래 지향적인 솔루션을 원하는 개발자는 YOLO11 로 전환하는 것은 뚜렷한 이점을 제공합니다.

1. 통합된 에코시스템 및 사용 편의성

YOLOv7 OLOX는 특정 GitHub 리포지토리를 복제하고, 복잡한 종속성 요구 사항을 관리하고, 서로 다른 형식의 데이터를 활용해야 하는 경우가 많습니다. 반면, Ultralytics 모든 작업을 통합하는 핍 설치 가능한 패키지를 제공합니다.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

2. 뛰어난 성능 균형

벤치마크에서 볼 수 있듯이, 최신 Ultralytics 모델은 속도와 정확성 사이에서 더 나은 균형을 이룹니다. YOLO11 은 최적화된 앵커 프리 아키텍처를 활용하며, YOLOX(앵커 프리 설계)와 YOLOv7 (그라데이션 경로 최적화)의 발전된 기능을 모두 학습합니다. 그 결과 CPU 추론 속도가 빨라질 뿐만 아니라 훈련 시 CUDA 메모리도 덜 필요하므로 더 다양한 하드웨어에서 사용할 수 있는 모델을 만들 수 있습니다.

3. 작업 전반에 걸친 다양한 활용성

YOLOv7 OLOX는 주로 객체 감지를 위해 설계되었습니다. Ultralytics 모델은 API를 변경하지 않고도 이 기능을 기본적으로 컴퓨터 비전 작업으로 확장합니다:

4. 원활한 배포 및 MLOps

구형 프레임워크에서는 연구 단계에서 생산 단계로 모델을 가져오는 것이 어렵습니다. Ultralytics 에코시스템에는 ONNX, TensorRT, CoreML, OpenVINO 위한 내보내기 모드가 내장되어 있어 모델 배포를 간소화합니다. 또한, 웹 기반 데이터 세트 관리, 원격 교육, 원클릭으로 엣지 디바이스에 배포할 수 있는 Ultralytics HUB와의 통합이 가능합니다.

YOLO11에 대해 자세히 알아보세요

결론

YOLOv7 OLOX는 모두 컴퓨터 비전 분야에 큰 공헌을 해왔습니다. YOLOv7 은 GPU 장치에서 최고의 성능을 발휘하도록 아키텍처를 최적화하여 "공짜 가방" 접근 방식의 효율성을 극대화했습니다. YOLOX는 앵커 없는 감지의 실행 가능성을 성공적으로 입증하여 파이프라인을 단순화하고 일반화를 개선했습니다.

하지만 최신 개발 워크플로우의 경우 Ultralytics YOLO11 이 탁월한 선택입니다. 이전 버전의 아키텍처적 강점과 타의 추종을 불허하는 Python API, 낮은 메모리 요구 사항, 포괄적인 비전 작업 지원을 결합한 제품입니다. 엣지 디바이스에 배포하든 클라우드 서버에 배포하든, 활발한 커뮤니티와 방대한 문서로 구성된 Ultralytics 에코시스템은 프로덕션으로 가는 원활한 경로를 보장합니다.

다른 모델 살펴보기

더 자세한 기술 비교에 관심이 있다면 다음 리소스를 살펴보세요:


댓글