YOLOv7 대 DAMO-YOLO: 포괄적인 기술 비교
실시간 객체 탐지 분야는 연구자와 엔지니어들이 속도와 정확성 사이의 최적의 균형을 찾기 위해 노력하며 지속적으로 발전하고 있습니다. 이 기술 비교에서는 2022년의 주목할 만한 두 가지 아키텍처인 YOLOv7과 DAMO-YOLO를 심층적으로 다룹니다. 두 모델 모두 모델 학습, 아키텍처 설계, 배포 등 다양한 과제를 해결하며 컴퓨터 비전 커뮤니티에 새로운 개념을 도입했습니다.
모델 배경 및 기술적 세부 정보
아키텍처를 살펴보기 전에 이 두 모델의 기원을 이해하는 것이 중요합니다. 두 모델 모두 주요 연구 그룹에 의해 개발되었으며 실시간 객체 탐지의 경계를 넓히기 위한 고급 방법론을 도입했습니다.
YOLOv7 세부 정보
YOLO 제품군의 연장선으로 개발된 YOLOv7은 추론 비용을 증가시키지 않으면서 정확도를 크게 향상하기 위해 학습 가능한 "bag-of-freebies" 개념을 도입했습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 기관: 대만 중앙연구원 정보과학연구소
- 날짜: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- 문서: https://docs.ultralytics.com/models/yolov7/
DAMO-YOLO 세부 정보
Alibaba Group의 연구원들이 만든 DAMO-YOLO는 다양한 하드웨어에 최적화된 고효율 모델을 구축하기 위해 신경망 구조 탐색(NAS)과 고급 지식 증류에 집중했습니다.
- 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- 조직: Alibaba Group
- 날짜: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
아키텍처 혁신
YOLOv7: 그래디언트 경로 분석 및 재매개변수화
YOLOv7은 **E-ELAN(Extended Efficient Layer Aggregation Networks)**에 중점을 둡니다. 저자들은 네트워크의 그래디언트 경로를 분석하여 원래의 그래디언트 경로를 저하시키지 않으면서 네트워크가 지속적으로 학습할 수 있도록 E-ELAN을 설계했습니다. 또한 YOLOv7은 추론 중에 모델 재매개변수화를 효과적으로 활용하여 레이어를 원활하게 병합함으로써 FLOPs를 줄이고 실행 시간을 단축합니다. 이로 인해 최신 GPU에서의 실시간 추론에 매우 뛰어난 성능을 발휘합니다.
DAMO-YOLO: 신경망 구조 탐색 및 RepGFPN
DAMO-YOLO는 대기 시간 제약 조건 하에서 **신경망 구조 탐색(NAS)**을 적극적으로 활용한다는 점에서 차별화됩니다. 모바일 기기나 특정 엣지 가속기와 같은 특정 하드웨어에 맞춤화된 최적의 백본을 찾기 위해 MAE-NAS라는 프레임워크를 사용합니다. 넥 부분에는 효율적인 RepGFPN(Rep-parameterized Generalized Feature Pyramid Network)을 도입했으며, 예측 헤드의 계산 부담을 최소화하기 위해 ZeroHead 설계를 채택했습니다.
YOLOv7은 강력한 내재적 아키텍처 최적화에 의존하는 반면, DAMO-YOLO는 복잡한 다단계 지식 증류 과정에 크게 의존합니다. 이는 대형 교사 모델을 학습시켜 작은 학생 모델로 지식을 증류해야 하므로 학습 단계에서 계산 비용이 많이 발생할 수 있습니다.
성능 및 메트릭 비교
이 모델들을 비교할 때는 mAP (Mean Average Precision), 추론 속도, 모델 복잡도를 살펴보는 것이 중요합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
위 표는 YOLOv7이 고정밀 분야(YOLOv7x)로 잘 확장되는 반면, DAMO-YOLO는 제한된 환경을 위해 고도로 최적화된 초소형 모델을 제공함을 보여줍니다.
학습 효율성 및 메모리 요구 사항
두 아키텍처의 가장 큰 차이점은 학습 방법론에 있습니다. DAMO-YOLO가 증류에 의존한다는 것은 처음부터 새 모델을 학습시키거나 사용자 지정 컴퓨터 비전 데이터셋으로 파인튜닝할 때 종종 훨씬 더 많은 VRAM과 GPU 컴퓨팅 시간이 요구됨을 의미합니다.
반면, YOLOv7 및 이후 버전과 같이 Ultralytics 생태계에 통합된 모델은 메모리 요구 사항에 맞춰 최적화되어 있습니다. 이를 통해 개발자는 메모리 부족 오류 없이 소비자용 하드웨어에서 더 큰 배치 사이즈를 활용할 수 있어 실험 추적 및 반복 과정을 간소화할 수 있습니다.
Ultralytics의 강점
YOLOv7과 DAMO-YOLO 모두 매력적인 기능을 제공하지만, Ultralytics 생태계 내에서 모델을 배포하면 비교할 수 없는 개발자 경험을 제공합니다.
- Ease of Use: The Ultralytics Python package offers a unified, simple API. You can quickly switch between model architectures, start training loops, or run inference with a few lines of code.
- 잘 관리된 생태계: Ultralytics는 빈번한 업데이트를 제공하여 최신 PyTorch 릴리스 및 CUDA 드라이버와 네이티브 호환성을 보장합니다. 또한 ONNX, TensorRT, OpenVINO와 같은 형식으로 모델을 쉽게 내보낼 수 있습니다.
- Versatility: Unlike DAMO-YOLO, which is strictly an object detector, the Ultralytics ecosystem supports diverse tasks natively. Models from the Ultralytics family can perform standard bounding box detection, pose estimation, instance segmentation, and Oriented Bounding Boxes (OBB).
코드 예시: 빠르게 시작하기
Ultralytics 모델을 사용하여 로드, 학습 및 추론을 실행하는 방법은 다음과 같습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")
# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for deployment
model.export(format="onnx")Ultralytics를 사용하면 학습된 가중치를 다양한 하드웨어 가속 형식(예: TensorRT 또는 CoreML)으로 내보내는 과정이 내보내기 명령의 단일 인수를 통해 처리되므로 복잡한 스크립트 구성에 드는 시간을 절약할 수 있습니다.
차세대 모델: YOLO26
YOLOv7은 여전히 강력한 레거시 아키텍처이지만, 이 분야는 빠르게 발전했습니다. 새로운 배포의 경우, 이전 세대의 거의 모든 측정 항목에서 성능을 능가하는 Ultralytics YOLO26(2026년 1월 출시)이 권장 표준입니다.
- 엔드투엔드 NMS-Free 설계: YOLOv10에서 처음 개척된 YOLO26은 NMS(Non-Maximum Suppression) 후처리를 네이티브로 제거합니다. 이는 로봇 공학 및 자율 주행 기술에 중요한 결정론적이고 초저지연 추론을 보장합니다.
- MuSGD 옵티마이저: 고급 LLM 학습 기술(예: Moonshot AI의 Kimi K2)에서 영감을 받은 이 하이브리드 옵티마이저는 SGD와 Muon을 결합하여 데이터셋 전반에 걸쳐 매우 안정적인 학습과 더 빠른 수렴을 제공합니다.
- 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써 YOLO26은 엣지 컴퓨팅 플랫폼과 CPU에서의 성능을 크게 향상시킵니다.
- ProgLoss + STAL: 이러한 고급 손실 함수는 작은 객체 탐지에서 상당한 개선을 가져오며, YOLO26을 항공 이미지 및 상세 감시에 매우 적합하게 만듭니다.
이상적인 활용 사례
DAMO-YOLO를 선택해야 할 때
- NAS 분야의 학술 연구: 귀하의 조직이 신경망 구조 탐색 방법론 연구에 크게 투자하고 있는 경우.
- 특정 하드웨어에서의 초제약 대기 시간: 맞춤형 AI 가속기 칩을 위한 맞춤형 백본을 찾기 위해 철저한 NAS 탐색을 실행할 리소스가 있는 경우.
YOLOv7을 선택해야 하는 경우
- 기존 GPU 파이프라인: 고급 NVIDIA 하드웨어에서 YOLOv7의 특정 E-ELAN 아키텍처를 중심으로 고도로 최적화된 레거시 생산 파이프라인을 유지하는 팀의 경우.
현대적인 Ultralytics 모델(YOLO11 / YOLO26)로 마이그레이션해야 하는 이유
소매 분석, 스마트 제조, 의료에 이르기까지 대다수의 기업 애플리케이션에서 최신 Ultralytics 모델은 타의 추종을 불허합니다. Ultralytics 플랫폼과의 통합은 완벽한 ML 파이프라인을 제공하여 사용 편의성, 뛰어난 문서화, 강력한 커뮤니티 지원 및 멀티 태스크 범용성을 제공합니다. Raspberry Pi에서 재고를 추적하든 클라우드에서 무거운 분석을 실행하든, YOLO26과 같은 모델은 컴퓨터 비전의 미래를 위한 이상적인 성능 균형을 제공합니다.