YOLOv7 YOLO: 포괄적인 기술 비교

실시간 객체 탐지 기술의 지형도는 속도와 정확도 사이의 최적 균형을 찾기 위해 연구자와 엔지니어들이 끊임없이 노력하며 진화하고 있습니다. 본 기술 비교에서는 2022년에 주목받은 두 가지 아키텍처인 YOLOv7 와 YOLO 심층적으로 살펴보겠습니다. 두 모델 모두 컴퓨터 비전 커뮤니티에 새로운 개념을 도입하며 모델 훈련, 아키텍처 설계, 배포 과정에서 발생하는 다양한 과제를 해결했습니다.

모델 배경 및 기술적 세부 사항

아키텍처를 자세히 살펴보기 전에 이 두 모델의 기원을 이해하는 것이 필수적입니다. 두 모델 모두 선도적인 연구 그룹에 의해 개발되었으며, 실시간 객체 detect의 한계를 뛰어넘기 위한 고급 방법론을 도입했습니다.

YOLOv7

YOLO 계열의 연속으로 개발된 YOLOv7은 추론 비용을 증가시키지 않으면서 정확도를 크게 향상시키기 위해 학습 가능한 "bag-of-freebies" 개념을 도입했습니다.

저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
조직:기관: 대만 학술원 정보 과학 연구소
날짜:06
Arxiv:2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
문서:7

7에 대해 자세히 알아보기

DAMO-YOLO 세부 정보

Alibaba Group 연구원들이 개발한 DAMO-YOLO는 다양한 하드웨어에 대한 고효율 모델을 구축하기 위해 신경망 아키텍처 검색(NAS)과 고급 지식 증류에 중점을 두었습니다.

작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
조직:조직: 알리바바 그룹
날짜:23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO

DAMO-YOLO에 대해 자세히 알아보세요.

아키텍처 혁신

YOLOv7: 기울기 경로 분석 및 재매개변수화

YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)에 중점을 YOLOv7 . 저자들은 네트워크의 기울기 경로를 분석하여 E-ELAN을 설계함으로써, 네트워크가 원래 기울기 경로를 저하시키지 않으면서 지속적으로 학습할 수 있도록 보장했습니다. 또한 YOLOv7 추론 과정에서 모델 재매개변수화를 YOLOv7 활용하여 레이어를 매끄럽게 융합함으로써 FLOPs를 줄이고 실행 시간을 가속화합니다. 이로 인해 현대 GPU에서 실시간 추론에 매우 적합합니다.

DAMO-YOLO: 신경망 아키텍처 탐색 및 RepGFPN

DAMO-YOLO는 지연 시간 제약 하의 신경망 아키텍처 검색 (NAS)을 적극적으로 활용하여 차별화됩니다. MAE-NAS라는 프레임워크를 활용하여 모바일 장치 또는 특정 엣지 가속기와 같은 특정 하드웨어에 최적화된 백본을 발견합니다. 넥(neck)으로는 효율적인 RepGFPN (Rep-parameterized Generalized Feature Pyramid Network)을 도입했으며, ZeroHead 설계를 사용하여 예측 헤드의 계산 부담을 최소화합니다.

증류 차이

YOLOv7 강력한 내재적 아키텍처 최적화에 YOLOv7 반면,YOLO 복잡한 다단계 지식 증류 과정에 크게YOLO . 이는 대규모 교사 모델을 훈련시켜 지식을 소규모 학생 모델로 증류해야 하므로, 훈련 단계에서 계산 비용이 많이 들 수 있습니다.

성능 및 지표 비교

이러한 모델들을 비교할 때, mAP 평균 정밀도), 추론 속도, 모델 복잡도를 살펴보는 것이 중요합니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

상기 표는 YOLOv7 고정밀 영역(YOLOv7x)으로 YOLOv7 우수함을 보여주며,YOLO 제약된 환경을 위한 고도로 최적화된 소형 모델을YOLO .

훈련 효율성과 메모리 요구 사항

두 아키텍처의 주요 차이점은 훈련 방법론에 있습니다. DAMO-YOLO가 증류에 의존한다는 것은 처음부터 새 모델을 훈련하거나 사용자 정의 컴퓨터 비전 데이터셋에서 미세 조정하는 데 종종 훨씬 더 많은 VRAM과 GPU 컴퓨팅 시간이 필요하다는 것을 의미합니다.

반면, YOLOv7 이후 버전과 같이 Ultralytics 통합된 모델들은 메모리 요구 사항에 대해 크게 최적화되어 있습니다. 이를 통해 개발자는 소비자용 하드웨어에서 더 큰 배치 크기를 사용해도 메모리 부족 오류가 발생하지 않아 실험 추적 및 반복 과정을 간소화할 수 있습니다.

Ultralytics 이점

YOLOv7 YOLO 모두 매력적인 기능을YOLO , Ultralytics 내에서 모델을 배포하면 비교할 수 없는 개발자 경험을 제공합니다.

사용 편의성: Ultralytics Python 패키지는 통합되고 간단한 API를 제공합니다. 몇 줄의 코드로 모델 아키텍처 간에 빠르게 전환하거나, 훈련 루프를 시작하거나, 추론을 실행할 수 있습니다.
잘 관리되는 생태계: Ultralytics는 빈번한 업데이트를 제공하여 최신 PyTorch 릴리스 및 CUDA 드라이버와의 네이티브 호환성을 보장합니다. 또한 ONNX, TensorRT, OpenVINO와 같은 형식으로 모델을 내보내는 것을 간소화합니다.
다재다능함: 엄격하게 객체 detect기인 DAMO-YOLO와 달리, Ultralytics 생태계는 다양한 작업을 기본적으로 지원합니다. Ultralytics 제품군의 모델은 표준 바운딩 박스 detect, 자세 추정, 인스턴스 세분화 및 Oriented Bounding Boxes (OBB)를 수행할 수 있습니다.

코드 예시: 빠르게 시작하기

Ultralytics 사용하여 로드, 훈련 및 추론을 실행하는 방법은 다음과 같이 간단합니다:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

모델 내보내기

Ultralytics 사용하면 훈련된 가중치를 TensorRT CoreML 같은 다양한 하드웨어 가속 형식으로 내보내는 작업이 내보내기 명령어의 단일 인수로 처리되어 복잡한 스크립트 구성에 소요되는 시간을 절약할 수 있습니다.

차세대: YOLO26

YOLOv7 강력한 기존 아키텍처이지만, 해당 분야는 급속히 발전해 왔습니다. 신규 배포를 위해서는 Ultralytics (2026년 1월 출시)이 권장 표준으로, 거의 모든 지표에서 이전 세대를 능가하는 성능을 보여줍니다.

종단 간 NMS-Free 설계: YOLOv10에서 처음 개척된 YOLO26은 NMS(Non-Maximum Suppression) 후처리를 기본적으로 제거합니다. 이는 로봇 공학 및 자율 주행 기술에 필수적인 결정론적이고 초저지연 추론을 보장합니다.
MuSGD 옵티마이저: Moonshot AI의 Kimi K2와 같은 고급 LLM 훈련 기술에서 영감을 받은 이 하이브리드 옵티마이저는 SGD와 Muon을 결합하여 데이터셋 전반에 걸쳐 매우 안정적인 훈련과 더 빠른 수렴을 제공합니다.
최대 43% 더 빠른 CPU 추론: Distribution Focal Loss (DFL)를 전략적으로 제거함으로써, YOLO26은 엣지 컴퓨팅 플랫폼 및 CPU에서 성능을 크게 향상시킵니다.
ProgLoss + STAL: 이러한 고급 손실 함수들은 작은 객체 detect에서 상당한 개선을 가져와, YOLO26을 항공 이미지 및 정밀 감시에 매우 적합하게 만듭니다.

YOLO26에 대해 더 알아보기

이상적인 사용 사례

YOLO 선택해야 할 때

NAS 분야 학술 연구: 귀하의 조직이 신경망 아키텍처 검색(NAS) 방법론 연구에 집중적으로 투자하고 있다면.
특정 하드웨어에서 초제한 지연 시간: 맞춤형 AI 가속기 칩을 위한 맞춤형 백본을 찾기 위해 철저한 NAS 검색을 실행할 자원이 있는 경우.

7 선택해야 할 때

기존 GPU 파이프라인: 고급 NVIDIA 하드웨어에서 YOLOv7의 특정 E-ELAN 아키텍처를 중심으로 깊이 최적화된 레거시 프로덕션 파이프라인을 유지하는 팀을 위한 것입니다.

왜 현대적인 Ultralytics (YOLO11 YOLO26)로 마이그레이션해야 하는가

대다수의 기업 애플리케이션—소매 분석과 스마트 제조부터 의료 분야까지—에서 현대적인 Ultralytics 타의 추종을 불허합니다. Ultralytics 통합은 사용 편의성, 우수한 문서화, 강력한 커뮤니티 지원, 다중 작업 유연성을 제공하는 완벽한 머신러닝 파이프라인을 구현합니다. 라즈베리 파이에서 재고를 추적하든 클라우드에서 고성능 분석을 실행하든, YOLO26과 같은 모델은 컴퓨터 비전의 미래를 위한 이상적인 성능 균형을 제공합니다.