YOLOv7 YOLO: 아키텍처 혁신과 속도의 균형
2022년에는 실시간 객체 탐지 분야에서 YOLOv7 와 YOLO 큰 변화를 겪었습니다. 두 모델 모두 정확도와 지연 시간의 한계를 넘어서려는 목표를 공유했지만, 근본적으로 다른 공학적 접근법을 통해 이 과제에 도전했습니다. YOLOv7 "bag-of-freebies" 접근법을 통해 훈련 과정 최적화에 YOLOv7 반면,YOLO 신경망 구조 탐색(NAS)을YOLO 효율적인 구조를 자동으로 발견하는 방식을 채택했습니다.
이 포괄적인 비교 분석은 두 모델의 아키텍처, 성능 지표 및 훈련 방법론을 탐구하여 특정 컴퓨터 비전 애플리케이션에 적합한 모델을 선택하는 데 도움을 드립니다. 기존 프로젝트에는 두 모델 모두 여전히 유효하지만, YOLO26과 같은 현대적 솔루션이 신규 개발에 권장되는 표준이 된 이유도 함께 논의하겠습니다.
YOLOv7: 훈련 가능한 무료 아이템 가방
2022년 7월 출시된 YOLOv7 YOLO 주요 YOLOv7 , 추론 비용을 증가시키지 않으면서 정확도를 향상시킨 아키텍처 개혁에 중점을 YOLOv7 .
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 기관: 대만 중앙연구원 정보과학연구원
- 날짜:06
- Arxiv:2207.02696
- GitHub:https://github.com/WongKinYiu/yolov7
아키텍처 혁신
YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)를 YOLOv7 . 최단 및 최장 기울기 경로를 제어하는 표준 ELAN과 달리, E-ELAN은 확장, 셔플, 병합 카디널리티를 활용하여 원래 기울기 경로를 파괴하지 않으면서 네트워크의 학습 능력을 향상시킵니다. 이 설계는 모델이 더 다양한 특징을 학습할 수 있게 하여 다음과 같은 복잡한 데이터셋에서 성능을 개선합니다. COCO과 같은 복잡한 데이터셋에서 성능을 향상시킵니다.
YOLOv7 핵심 개념은 "훈련 가능한 프리비즈 백(trainable bag-of-freebies)" YOLOv7 . 이는 모델 재매개변수화 및 동적 레이블 할당과 같은 최적화 기법으로, 정확도 향상을 위해 훈련 비용을 증가시키지만 추론 시에는 어떠한 페널티도 발생시키지 않습니다. 이로 인해 YOLOv7 의료 영상 분석이나 안전이 중요한 산업 검사 등 높은 정밀도가 요구되는 시나리오에 YOLOv7 .
YOLO: 신경망 구조 탐색을 통한 효율성
알리바바 그룹이 개발한YOLO 이후 DAMO-Academy의 비전 제품군에 통합됨)는 속도와 낮은 지연 시간을 최우선으로 하여, 특히 엄격한 밀리초 단위의 제약이 적용되는 산업용 애플리케이션을 대상으로 개발되었습니다.
- 작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- 조직:조직: 알리바바 그룹
- 날짜:23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
MAE-NAS 및 증류
YOLO 아키텍처는 MAE-NAS (효율성 자동화 신경망 아키텍처 검색 방법)라는 기법을 통해 도출되었습니다. 이 자동화 프로세스는 특정 지연 시간 예산 하에서 탐지 성능을 극대화하는 백본 구조를 찾아냈습니다. 또한 효율적인 특징 융합을 위한 RepGFPN (Rep-매개변수화 일반화 특징 피라미드 네트워크)과 경량 탐지 헤드인 ZeroHead를 도입했습니다.
YOLO 두드러진 특징은 증류(distillation)에 대한 강한YOLO . 모델은 일반적으로 더 큰 "교사(teacher)" 모델의 도움을 받아 훈련되며, 이 교사 모델은 "학생(student)" 모델이 더 나은 표현을 학습하도록 안내한다. 이는 인상적인 효율성을 제공하지만, 표준 객체 탐지 워크플로우에 비해 훈련 파이프라인을 상당히 복잡하게 만든다.
성능 비교
다음 표는 YOLOv7 YOLO 모델의 성능을 비교합니다. YOLOv7 더 높은 정확도(mAP)로 확장되는 반면,YOLO 속도에 최적화된 극도로 경량화된 모델을YOLO .
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
상충관계 분석
- 정확도:YOLOv7x는 53.1% mAP 로 선두를 달리며, 탐지 누락이 치명적인 작업에 적합합니다.
- 속도:DAMO-YOLOt는 놀라울 정도로 빠릅니다(T4 TensorRT 기준 2.32ms). 높은 FPS의 영상 이해나 제약이 있는 에지 디바이스에 배포하기에 이상적입니다.
- 복잡도: YOLOv7 매개변수와 FLOPs는 순수 효율성보다 용량에 중점을 둔 점을 반영하여 상당히 높습니다.
훈련 복잡성 참고사항
YOLO 속도와 정확도 간의 탁월한 균형을YOLO , 사용자 정의 데이터셋에서 동일한 결과를 재현하는 것은 어려울 수 있습니다. DAMO-YOLO의 훈련 방식은 종종 다단계 과정을 필요로 하며, 디스틸레이션을 위해 무거운 교사 모델을 사용해야 하는 반면, YOLOv7 구현이 더 쉬운 간단한 "처음부터 훈련" 방식을 YOLOv7 .
왜 Ultralytics 더 나은 선택인가
YOLOv7 YOLO 당시에는 큰YOLO , 해당 분야는 급속히 발전해 왔습니다. 2026년에 새로운 프로젝트를 시작하는 개발자와 연구자들에게 YOLO26은 높은 정확도와 간소화된 배포를 결합하여 두 선행 모델을 모두 능가하는 통합 솔루션을 제공합니다.
탁월한 사용 편의성 및 에코시스템
Ultralytics 사용자 친화적인 설계로 유명합니다.YOLO 복잡한 증류 파이프라인과 달리, YOLO26은 데이터 주석 작업부터 모델 배포까지 모든 과정을 처리하는 간소화된 Python 제공합니다.
- 훈련 효율성: 복잡한 교사-학생 설정 없이 몇 줄의 코드로 최신 모델을 훈련하세요.
- 잘 관리됨: 빈번한 업데이트, 방대한 문서, 활발한 커뮤니티 지원으로 프로젝트의 미래 대비가 보장됩니다.
- 다용도성: 탐지 기능을 넘어, YOLO26은 인스턴스 분할, 자세 추정, 분류, 방향성 경계 상자(OBB)를 기본적으로 지원합니다.
YOLO26 기술적 돌파구
YOLO26은 기존 아키텍처의 한계를 해결하는 몇 가지 핵심 혁신을 도입합니다:
- 엔드투엔드 NMS 설계: 비최대 억제(NMS)를 제거함으로써 YOLO26은 추론 지연 시간을 줄이고 출력 로직을 단순화합니다. 이는 YOLOv7 표준YOLO 모두에서 누락된 기능입니다.
- MuSGD 최적화기: Kimi K2와 같은 대규모 언어 모델(LLM) 훈련에서 영감을 받은 이 하이브리드 최적화기는 SGD 뮤 SGD 결합하여 더 빠른 수렴과 안정적인 훈련을 제공합니다.
- 에지 최적화: 분포 초점 손실(DFL) 제거 및 특정 CPU 통해 YOLO26은 이전 세대에 비해 CPU 추론 속도가 최대 43% 향상되어,YOLO 목표로 삼았던 저지연 요구 사항을 해결합니다.
- ProgLoss + STAL: 고급 손실 함수는 드론 영상 및 로봇 공학에 필수적인 소형 물체 탐지 성능을 향상시킵니다.
코드 예시: Ultralytics 사용한 훈련
이 예시는 Ultralytics 사용하여 최신 YOLO26 모델을 얼마나 쉽게 훈련시킬 수 있는지 보여줍니다. 이 단일 인터페이스는 기존 저장소에서 요구되던 복잡한 구성 파일과 다단계 파이프라인을 대체합니다.
from ultralytics import YOLO
# Load the latest YOLO26 model (recommended over YOLOv7/DAMO-YOLO)
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
결론
YOLOv7 YOLO 모두 컴퓨터 비전 발전에 크게YOLO . YOLOv7 수작업으로 설계된 아키텍처가 교묘한 훈련 전략을 통해 여전히 최첨단 성능을 달성할 수 있음을 YOLOv7 ,YOLO 지연 시간 제약 환경에서 신경망 아키텍처 설계(NAS)의 힘을YOLO .
그러나 오늘날 실용적인 실제 배포 환경에서는 YOLO26이 확실한 선택입니다. 높은 정확도와 속도의 성능 균형을 제공하며, 트랜스포머에 비해 훈련 중 메모리 요구량이 현저히 낮고, Ultralytics 강력한 지원을 받습니다. 에지 환경이든 클라우드 환경이든, YOLO26의 엔드투엔드 설계와 다양한 작업 지원은 생산 환경으로의 가장 효율적인 경로를 제공합니다.