콘텐츠로 건너뛰기

YOLOv7 YOLO: 아키텍처 혁신과 속도의 균형

2022년에는 실시간 객체 탐지 분야에서 YOLOv7YOLO 큰 변화를 겪었습니다. 두 모델 모두 정확도와 지연 시간의 한계를 넘어서려는 목표를 공유했지만, 근본적으로 다른 공학적 접근법을 통해 이 과제에 도전했습니다. YOLOv7 "bag-of-freebies" 접근법을 통해 훈련 과정 최적화에 YOLOv7 반면,YOLO 신경망 구조 탐색(NAS)을YOLO 효율적인 구조를 자동으로 발견하는 방식을 채택했습니다.

이 포괄적인 비교 분석은 두 모델의 아키텍처, 성능 지표 및 훈련 방법론을 탐구하여 특정 컴퓨터 비전 애플리케이션에 적합한 모델을 선택하는 데 도움을 드립니다. 기존 프로젝트에는 두 모델 모두 여전히 유효하지만, YOLO26과 같은 현대적 솔루션이 신규 개발에 권장되는 표준이 된 이유도 함께 논의하겠습니다.

YOLOv7: 훈련 가능한 무료 아이템 가방

2022년 7월 출시된 YOLOv7 YOLO 주요 YOLOv7 , 추론 비용을 증가시키지 않으면서 정확도를 향상시킨 아키텍처 개혁에 중점을 YOLOv7 .

아키텍처 혁신

YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)를 YOLOv7 . 최단 및 최장 기울기 경로를 제어하는 표준 ELAN과 달리, E-ELAN은 확장, 셔플, 병합 카디널리티를 활용하여 원래 기울기 경로를 파괴하지 않으면서 네트워크의 학습 능력을 향상시킵니다. 이 설계는 모델이 더 다양한 특징을 학습할 수 있게 하여 다음과 같은 복잡한 데이터셋에서 성능을 개선합니다. COCO과 같은 복잡한 데이터셋에서 성능을 향상시킵니다.

YOLOv7 핵심 개념은 "훈련 가능한 프리비즈 백(trainable bag-of-freebies)" YOLOv7 . 이는 모델 재매개변수화 및 동적 레이블 할당과 같은 최적화 기법으로, 정확도 향상을 위해 훈련 비용을 증가시키지만 추론 시에는 어떠한 페널티도 발생시키지 않습니다. 이로 인해 YOLOv7 의료 영상 분석이나 안전이 중요한 산업 검사 등 높은 정밀도가 요구되는 시나리오에 YOLOv7 .

7에 대해 자세히 알아보기

알리바바 그룹이 개발한YOLO 이후 DAMO-Academy의 비전 제품군에 통합됨)는 속도와 낮은 지연 시간을 최우선으로 하여, 특히 엄격한 밀리초 단위의 제약이 적용되는 산업용 애플리케이션을 대상으로 개발되었습니다.

MAE-NAS 및 증류

YOLO 아키텍처는 MAE-NAS (효율성 자동화 신경망 아키텍처 검색 방법)라는 기법을 통해 도출되었습니다. 이 자동화 프로세스는 특정 지연 시간 예산 하에서 탐지 성능을 극대화하는 백본 구조를 찾아냈습니다. 또한 효율적인 특징 융합을 위한 RepGFPN (Rep-매개변수화 일반화 특징 피라미드 네트워크)과 경량 탐지 헤드인 ZeroHead를 도입했습니다.

YOLO 두드러진 특징은 증류(distillation)에 대한 강한YOLO . 모델은 일반적으로 더 큰 "교사(teacher)" 모델의 도움을 받아 훈련되며, 이 교사 모델은 "학생(student)" 모델이 더 나은 표현을 학습하도록 안내한다. 이는 인상적인 효율성을 제공하지만, 표준 객체 탐지 워크플로우에 비해 훈련 파이프라인을 상당히 복잡하게 만든다.

성능 비교

다음 표는 YOLOv7 YOLO 모델의 성능을 비교합니다. YOLOv7 더 높은 정확도(mAP)로 확장되는 반면,YOLO 속도에 최적화된 극도로 경량화된 모델을YOLO .

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

상충관계 분석

  • 정확도:YOLOv7x는 53.1% mAP 로 선두를 달리며, 탐지 누락이 치명적인 작업에 적합합니다.
  • 속도:DAMO-YOLOt는 놀라울 정도로 빠릅니다(T4 TensorRT 기준 2.32ms). 높은 FPS의 영상 이해나 제약이 있는 에지 디바이스에 배포하기에 이상적입니다.
  • 복잡도: YOLOv7 매개변수와 FLOPs는 순수 효율성보다 용량에 중점을 둔 점을 반영하여 상당히 높습니다.

훈련 복잡성 참고사항

YOLO 속도와 정확도 간의 탁월한 균형을YOLO , 사용자 정의 데이터셋에서 동일한 결과를 재현하는 것은 어려울 수 있습니다. DAMO-YOLO의 훈련 방식은 종종 다단계 과정을 필요로 하며, 디스틸레이션을 위해 무거운 교사 모델을 사용해야 하는 반면, YOLOv7 구현이 더 쉬운 간단한 "처음부터 훈련" 방식을 YOLOv7 .

왜 Ultralytics 더 나은 선택인가

YOLOv7 YOLO 당시에는 큰YOLO , 해당 분야는 급속히 발전해 왔습니다. 2026년에 새로운 프로젝트를 시작하는 개발자와 연구자들에게 YOLO26은 높은 정확도와 간소화된 배포를 결합하여 두 선행 모델을 모두 능가하는 통합 솔루션을 제공합니다.

탁월한 사용 편의성 및 에코시스템

Ultralytics 사용자 친화적인 설계로 유명합니다.YOLO 복잡한 증류 파이프라인과 달리, YOLO26은 데이터 주석 작업부터 모델 배포까지 모든 과정을 처리하는 간소화된 Python 제공합니다.

  • 훈련 효율성: 복잡한 교사-학생 설정 없이 몇 줄의 코드로 최신 모델을 훈련하세요.
  • 잘 관리됨: 빈번한 업데이트, 방대한 문서, 활발한 커뮤니티 지원으로 프로젝트의 미래 대비가 보장됩니다.
  • 다용도성: 탐지 기능을 넘어, YOLO26은 인스턴스 분할, 자세 추정, 분류, 방향성 경계 상자(OBB)를 기본적으로 지원합니다.

YOLO26 기술적 돌파구

YOLO26은 기존 아키텍처의 한계를 해결하는 몇 가지 핵심 혁신을 도입합니다:

  1. 엔드투엔드 NMS 설계: 비최대 억제(NMS)를 제거함으로써 YOLO26은 추론 지연 시간을 줄이고 출력 로직을 단순화합니다. 이는 YOLOv7 표준YOLO 모두에서 누락된 기능입니다.
  2. MuSGD 최적화기: Kimi K2와 같은 대규모 언어 모델(LLM) 훈련에서 영감을 받은 이 하이브리드 최적화기는 SGD 뮤 SGD 결합하여 더 빠른 수렴과 안정적인 훈련을 제공합니다.
  3. 에지 최적화: 분포 초점 손실(DFL) 제거 및 특정 CPU 통해 YOLO26은 이전 세대에 비해 CPU 추론 속도가 최대 43% 향상되어,YOLO 목표로 삼았던 저지연 요구 사항을 해결합니다.
  4. ProgLoss + STAL: 고급 손실 함수는 드론 영상 및 로봇 공학에 필수적인 소형 물체 탐지 성능을 향상시킵니다.

YOLO26에 대해 더 알아보기

코드 예시: Ultralytics 사용한 훈련

이 예시는 Ultralytics 사용하여 최신 YOLO26 모델을 얼마나 쉽게 훈련시킬 수 있는지 보여줍니다. 이 단일 인터페이스는 기존 저장소에서 요구되던 복잡한 구성 파일과 다단계 파이프라인을 대체합니다.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended over YOLOv7/DAMO-YOLO)
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

# Export to ONNX for deployment
model.export(format="onnx")

결론

YOLOv7 YOLO 모두 컴퓨터 비전 발전에 크게YOLO . YOLOv7 수작업으로 설계된 아키텍처가 교묘한 훈련 전략을 통해 여전히 최첨단 성능을 달성할 수 있음을 YOLOv7 ,YOLO 지연 시간 제약 환경에서 신경망 아키텍처 설계(NAS)의 힘을YOLO .

그러나 오늘날 실용적인 실제 배포 환경에서는 YOLO26이 확실한 선택입니다. 높은 정확도와 속도의 성능 균형을 제공하며, 트랜스포머에 비해 훈련 중 메모리 요구량이 현저히 낮고, Ultralytics 강력한 지원을 받습니다. 에지 환경이든 클라우드 환경이든, YOLO26의 엔드투엔드 설계와 다양한 작업 지원은 생산 환경으로의 가장 효율적인 경로를 제공합니다.

추가 자료


댓글