YOLOv7 YOLO: 아키텍처 혁신과 속도의 균형

2022년에는 실시간 객체 탐지 분야에서 YOLOv7 와 YOLO 큰 변화를 겪었습니다. 두 모델 모두 정확도와 지연 시간의 한계를 넘어서려는 목표를 공유했지만, 근본적으로 다른 공학적 접근법을 통해 이 과제에 도전했습니다. YOLOv7 "bag-of-freebies" 접근법을 통해 훈련 과정 최적화에 YOLOv7 반면,YOLO 신경망 구조 탐색(NAS)을YOLO 효율적인 구조를 자동으로 발견하는 방식을 채택했습니다.

이 포괄적인 비교 분석은 두 모델의 아키텍처, 성능 지표 및 훈련 방법론을 탐구하여 특정 컴퓨터 비전 애플리케이션에 적합한 모델을 선택하는 데 도움을 드립니다. 기존 프로젝트에는 두 모델 모두 여전히 유효하지만, YOLO26과 같은 현대적 솔루션이 신규 개발에 권장되는 표준이 된 이유도 함께 논의하겠습니다.

YOLOv7: 훈련 가능한 무료 아이템 가방

2022년 7월 출시된 YOLOv7 YOLO 주요 YOLOv7 , 추론 비용을 증가시키지 않으면서 정확도를 향상시킨 아키텍처 개혁에 중점을 YOLOv7 .

저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
기관: 대만 중앙연구원 정보과학연구원
날짜:06
Arxiv:2207.02696
GitHub:https://github.com/WongKinYiu/yolov7

아키텍처 혁신

YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)를 YOLOv7 . 최단 및 최장 기울기 경로를 제어하는 표준 ELAN과 달리, E-ELAN은 확장, 셔플, 병합 카디널리티를 활용하여 원래 기울기 경로를 파괴하지 않으면서 네트워크의 학습 능력을 향상시킵니다. 이 설계는 모델이 더 다양한 특징을 학습할 수 있게 하여 다음과 같은 복잡한 데이터셋에서 성능을 개선합니다. COCO과 같은 복잡한 데이터셋에서 성능을 향상시킵니다.

YOLOv7 핵심 개념은 "훈련 가능한 프리비즈 백(trainable bag-of-freebies)" YOLOv7 . 이는 모델 재매개변수화 및 동적 레이블 할당과 같은 최적화 기법으로, 정확도 향상을 위해 훈련 비용을 증가시키지만 추론 시에는 어떠한 페널티도 발생시키지 않습니다. 이로 인해 YOLOv7 의료 영상 분석이나 안전이 중요한 산업 검사 등 높은 정밀도가 요구되는 시나리오에 YOLOv7 .

7에 대해 자세히 알아보기

YOLO: 신경망 구조 탐색을 통한 효율성

알리바바 그룹이 개발한YOLO 이후 DAMO-Academy의 비전 제품군에 통합됨)는 속도와 낮은 지연 시간을 최우선으로 하여, 특히 엄격한 밀리초 단위의 제약이 적용되는 산업용 애플리케이션을 대상으로 개발되었습니다.

작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
조직:조직: 알리바바 그룹
날짜:23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO

MAE-NAS 및 증류

YOLO 아키텍처는 MAE-NAS (효율성 자동화 신경망 아키텍처 검색 방법)라는 기법을 통해 도출되었습니다. 이 자동화 프로세스는 특정 지연 시간 예산 하에서 탐지 성능을 극대화하는 백본 구조를 찾아냈습니다. 또한 효율적인 특징 융합을 위한 RepGFPN (Rep-매개변수화 일반화 특징 피라미드 네트워크)과 경량 탐지 헤드인 ZeroHead를 도입했습니다.

YOLO 두드러진 특징은 증류(distillation)에 대한 강한YOLO . 모델은 일반적으로 더 큰 "교사(teacher)" 모델의 도움을 받아 훈련되며, 이 교사 모델은 "학생(student)" 모델이 더 나은 표현을 학습하도록 안내한다. 이는 인상적인 효율성을 제공하지만, 표준 객체 탐지 워크플로우에 비해 훈련 파이프라인을 상당히 복잡하게 만든다.

성능 비교

다음 표는 YOLOv7 YOLO 모델의 성능을 비교합니다. YOLOv7 더 높은 정확도(mAP)로 확장되는 반면,YOLO 속도에 최적화된 극도로 경량화된 모델을YOLO .

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

상충관계 분석

정확도:YOLOv7x는 53.1% mAP 로 선두를 달리며, 탐지 누락이 치명적인 작업에 적합합니다.
속도:DAMO-YOLOt는 놀라울 정도로 빠릅니다(T4 TensorRT 기준 2.32ms). 높은 FPS의 영상 이해나 제약이 있는 에지 디바이스에 배포하기에 이상적입니다.
복잡도: YOLOv7 매개변수와 FLOPs는 순수 효율성보다 용량에 중점을 둔 점을 반영하여 상당히 높습니다.

훈련 복잡성 참고사항

YOLO 속도와 정확도 간의 탁월한 균형을YOLO , 사용자 정의 데이터셋에서 동일한 결과를 재현하는 것은 어려울 수 있습니다. DAMO-YOLO의 훈련 방식은 종종 다단계 과정을 필요로 하며, 디스틸레이션을 위해 무거운 교사 모델을 사용해야 하는 반면, YOLOv7 구현이 더 쉬운 간단한 "처음부터 훈련" 방식을 YOLOv7 .

왜 Ultralytics 더 나은 선택인가

YOLOv7 YOLO 당시에는 큰YOLO , 해당 분야는 급속히 발전해 왔습니다. 2026년에 새로운 프로젝트를 시작하는 개발자와 연구자들에게 YOLO26은 높은 정확도와 간소화된 배포를 결합하여 두 선행 모델을 모두 능가하는 통합 솔루션을 제공합니다.

탁월한 사용 편의성 및 에코시스템

Ultralytics 사용자 친화적인 설계로 유명합니다.YOLO 복잡한 증류 파이프라인과 달리, YOLO26은 데이터 주석 작업부터 모델 배포까지 모든 과정을 처리하는 간소화된 Python 제공합니다.

훈련 효율성: 복잡한 교사-학생 설정 없이 몇 줄의 코드로 최신 모델을 훈련하세요.
잘 관리됨: 빈번한 업데이트, 방대한 문서, 활발한 커뮤니티 지원으로 프로젝트의 미래 대비가 보장됩니다.
다용도성: 탐지 기능을 넘어, YOLO26은 인스턴스 분할, 자세 추정, 분류, 방향성 경계 상자(OBB)를 기본적으로 지원합니다.

YOLO26 기술적 돌파구

YOLO26은 기존 아키텍처의 한계를 해결하는 몇 가지 핵심 혁신을 도입합니다:

엔드투엔드 NMS 설계: 비최대 억제(NMS)를 제거함으로써 YOLO26은 추론 지연 시간을 줄이고 출력 로직을 단순화합니다. 이는 YOLOv7 표준YOLO 모두에서 누락된 기능입니다.
MuSGD 최적화기: Kimi K2와 같은 대규모 언어 모델(LLM) 훈련에서 영감을 받은 이 하이브리드 최적화기는 SGD 뮤 SGD 결합하여 더 빠른 수렴과 안정적인 훈련을 제공합니다.
에지 최적화: 분포 초점 손실(DFL) 제거 및 특정 CPU 통해 YOLO26은 이전 세대에 비해 CPU 추론 속도가 최대 43% 향상되어,YOLO 목표로 삼았던 저지연 요구 사항을 해결합니다.
ProgLoss + STAL: 고급 손실 함수는 드론 영상 및 로봇 공학에 필수적인 소형 물체 탐지 성능을 향상시킵니다.

YOLO26에 대해 더 알아보기

코드 예시: Ultralytics 사용한 훈련

이 예시는 Ultralytics 사용하여 최신 YOLO26 모델을 얼마나 쉽게 훈련시킬 수 있는지 보여줍니다. 이 단일 인터페이스는 기존 저장소에서 요구되던 복잡한 구성 파일과 다단계 파이프라인을 대체합니다.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended over YOLOv7/DAMO-YOLO)
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

# Export to ONNX for deployment
model.export(format="onnx")

결론

YOLOv7 YOLO 모두 컴퓨터 비전 발전에 크게YOLO . YOLOv7 수작업으로 설계된 아키텍처가 교묘한 훈련 전략을 통해 여전히 최첨단 성능을 달성할 수 있음을 YOLOv7 ,YOLO 지연 시간 제약 환경에서 신경망 아키텍처 설계(NAS)의 힘을YOLO .

그러나 오늘날 실용적인 실제 배포 환경에서는 YOLO26이 확실한 선택입니다. 높은 정확도와 속도의 성능 균형을 제공하며, 트랜스포머에 비해 훈련 중 메모리 요구량이 현저히 낮고, Ultralytics 강력한 지원을 받습니다. 에지 환경이든 클라우드 환경이든, YOLO26의 엔드투엔드 설계와 다양한 작업 지원은 생산 환경으로의 가장 효율적인 경로를 제공합니다.

추가 자료

지원되는 모델 전체 목록을 살펴보세요.
Ultralytics 훈련 모니터링 방법을 알아보세요.
YOLO11의 이점을 이해하세요 YOLO11의 장점을 이해하세요.