콘텐츠로 건너뛰기

YOLOv7 YOLO: 포괄적인 기술 비교

실시간 객체 탐지 기술의 지형도는 속도와 정확도 사이의 최적 균형을 찾기 위해 연구자와 엔지니어들이 끊임없이 노력하며 진화하고 있습니다. 본 기술 비교에서는 2022년에 주목받은 두 가지 아키텍처인 YOLOv7YOLO 심층적으로 살펴보겠습니다. 두 모델 모두 컴퓨터 비전 커뮤니티에 새로운 개념을 도입하며 모델 훈련, 아키텍처 설계, 배포 과정에서 발생하는 다양한 과제를 해결했습니다.

모델 배경 및 기술적 세부 사항

이 두 모델의 아키텍처를 살펴보기 전에, 그 기원을 이해하는 것이 필수적이다. 양 모델 모두 선도적인 연구 그룹에 의해 개발되었으며, 실시간 객체 탐지의 한계를 확장하기 위한 선진적인 방법론을 도입하였다.

YOLOv7

YOLOv7 YOLO 후속 모델로 개발되었으며, 추론 비용을 증가시키지 않으면서 정확도를 크게 향상시키기 위해 훈련 가능한 "bag-of-freebies" 개념을 YOLOv7 .

7에 대해 자세히 알아보기

YOLO

알리바바 그룹 연구진이 개발한YOLO 신경망 구조 탐색(NAS)과 고급 지식 증류 기술에 중점을YOLO 다양한 하드웨어에 고효율 모델을 구축하는 데YOLO .

DAMO-YOLO에 대해 자세히 알아보세요.

아키텍처 혁신

YOLOv7: 기울기 경로 분석 및 재매개변수화

YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)에 중점을 YOLOv7 . 저자들은 네트워크의 기울기 경로를 분석하여 E-ELAN을 설계함으로써, 네트워크가 원래 기울기 경로를 저하시키지 않으면서 지속적으로 학습할 수 있도록 보장했습니다. 또한 YOLOv7 추론 과정에서 모델 재매개변수화를 YOLOv7 활용하여 레이어를 매끄럽게 융합함으로써 FLOPs를 줄이고 실행 시간을 가속화합니다. 이로 인해 현대 GPU에서 실시간 추론에 매우 적합합니다.

YOLO: 신경망 구조 탐색 및 RepGFPN

YOLO 지연 시간 제약 하에서 신경망 구조 탐색(NAS) 을 적극 활용함으로써YOLO . 모바일 기기나 특정 에지 가속기 등 특정 하드웨어에 맞춤화된 최적의 백본을 발견하기 위해 MAE-NAS라는 프레임워크를 사용합니다. 목 부분에는 효율적인 RepGFPN(Rep-parameterized Generalized Feature Pyramid Network)을 도입했으며, 예측 헤드에서의 계산 부담을 최소화하기 위해 ZeroHead 설계를 채택했습니다.

증류의 차이점

YOLOv7 강력한 내재적 아키텍처 최적화에 YOLOv7 반면,YOLO 복잡한 다단계 지식 증류 과정에 크게YOLO . 이는 대규모 교사 모델을 훈련시켜 지식을 소규모 학생 모델로 증류해야 하므로, 훈련 단계에서 계산 비용이 많이 들 수 있습니다.

성능 및 지표 비교

이러한 모델들을 비교할 때, mAP 평균 정밀도), 추론 속도, 모델 복잡도를 살펴보는 것이 중요합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

상기 표는 YOLOv7 고정밀 영역(YOLOv7x)으로 YOLOv7 우수함을 보여주며,YOLO 제약된 환경을 위한 고도로 최적화된 소형 모델을YOLO .

훈련 효율성과 메모리 요구 사항

두 아키텍처의 주요 차이점은 훈련 방법론에 있습니다.YOLO 지식 전수에 의존한다는 것은 새로운 모델을 처음부터 훈련하거나 맞춤형 컴퓨터 비전 데이터셋으로 미세 조정할 때 훨씬 더 많은 VRAM과 GPU 시간이 필요함을 의미합니다.

반면, YOLOv7 이후 버전과 같이 Ultralytics 통합된 모델들은 메모리 요구 사항에 대해 크게 최적화되어 있습니다. 이를 통해 개발자는 소비자용 하드웨어에서 더 큰 배치 크기를 사용해도 메모리 부족 오류가 발생하지 않아 실험 추적 및 반복 과정을 간소화할 수 있습니다.

Ultralytics 이점

YOLOv7 YOLO 모두 매력적인 기능을YOLO , Ultralytics 내에서 모델을 배포하면 비교할 수 없는 개발자 경험을 제공합니다.

  • 사용 편의성: Ultralytics Python 통합되고 간단한 API를 제공합니다. 모델 아키텍처 간 전환, 훈련 루프 시작, 추론 실행을 몇 줄의 코드로 빠르게 수행할 수 있습니다.
  • 잘 관리된 생태계: Ultralytics 빈번한 업데이트를 Ultralytics 최신 버전의 원활한 호환성을 보장합니다. PyTorch 릴리스 및 CUDA 네이티브 호환성을 보장합니다. 또한 모델을 ONNX, TensorRT, OpenVINO.
  • 다용도성: 객체 탐지 전용인YOLO 달리, Ultralytics 다양한 작업을 기본적으로 지원합니다. Ultralytics 모델은 표준 바운딩 박스 탐지, 자세 추정, 인스턴스 분할, 방향성 바운딩 박스(OBB)를 수행할 수 있습니다.

코드 예시: 빠르게 시작하기

Ultralytics 사용하여 로드, 훈련 및 추론을 실행하는 방법은 다음과 같이 간단합니다:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

모델 내보내기

Ultralytics 사용하면 훈련된 가중치를 TensorRT CoreML 같은 다양한 하드웨어 가속 형식으로 내보내는 작업이 내보내기 명령어의 단일 인수로 처리되어 복잡한 스크립트 구성에 소요되는 시간을 절약할 수 있습니다.

차세대: YOLO26

YOLOv7 강력한 기존 아키텍처이지만, 해당 분야는 급속히 발전해 왔습니다. 신규 배포를 위해서는 Ultralytics (2026년 1월 출시)이 권장 표준으로, 거의 모든 지표에서 이전 세대를 능가하는 성능을 보여줍니다.

  • 엔드투엔드 NMS 설계: 최초로 도입된 YOLOv10에서 최초로 도입된 YOLO26은 비최대 억제(NMS) 후처리 단계를 원천적으로 제거합니다. 이는 로봇공학 및 자율주행 기술에 필수적인 결정론적 초저지연 추론을 보장합니다.
  • MuSGD 최적화기: 고급 LLM 훈련 기법(Moonshot AI의 Kimi K2 등)에서 영감을 받은 이 하이브리드 최적화기는 SGD 결합하여 데이터셋 전반에 걸쳐 매우 안정적인 훈련과 더 빠른 수렴을 제공합니다.
  • 최대 43% 빠른 CPU : 분포 초점 손실(DFL)을 전략적으로 제거함으로써 YOLO26은 엣지 컴퓨팅 플랫폼 및 CPU에서 성능을 크게 향상시킵니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 소형 물체 탐지 성능을 크게 향상시켜 YOLO26이 항공 촬영 이미지와 정밀 감시에 탁월하게 적합하도록 합니다.

YOLO26에 대해 더 알아보기

이상적인 사용 사례

YOLO 선택해야 할 때

  • NAS 분야의 학술 연구: 귀 기관이 신경망 구조 탐색(NAS) 방법론 연구에 집중적으로 투자하고 있다면.
  • 특정 하드웨어에서의 초제한적 지연 시간: 맞춤형 AI 가속기 칩을 위한 최적화된 백본을 찾기 위해 철저한 NAS 검색을 실행할 자원이 있다면.

7 선택해야 할 때

  • 기존 GPU : 고급 NVIDIA YOLOv7 특정 E-ELAN 아키텍처에 맞춰 깊이 최적화된 레거시 생산 파이프라인을 유지 관리하는 팀을 위한 것입니다.

왜 현대적인 Ultralytics (YOLO11 YOLO26)로 마이그레이션해야 하는가

대다수의 기업 애플리케이션—소매 분석과 스마트 제조부터 의료 분야까지—에서 현대적인 Ultralytics 타의 추종을 불허합니다. Ultralytics 통합은 사용 편의성, 우수한 문서화, 강력한 커뮤니티 지원, 다중 작업 유연성을 제공하는 완벽한 머신러닝 파이프라인을 구현합니다. 라즈베리 파이에서 재고를 추적하든 클라우드에서 고성능 분석을 실행하든, YOLO26과 같은 모델은 컴퓨터 비전의 미래를 위한 이상적인 성능 균형을 제공합니다.


댓글