Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 vs DAMO-YOLO#

실시간 객체 탐지 분야는 연구자와 엔지니어들이 속도와 정확도 사이의 최적 균형을 찾기 위해 끊임없이 노력하며 지속적으로 발전하고 있습니다. 이번 기술 비교에서는 2022년에 등장한 두 가지 주목할 만한 아키텍처인 YOLOv7DAMO-YOLO를 심층적으로 살펴봅니다. 두 모델 모두 컴퓨터 비전 커뮤니티에 새로운 개념을 도입하여 모델 학습, 아키텍처 설계, 배포 측면에서 서로 다른 과제들을 해결했습니다.

Link to this section모델 배경 및 기술적 세부 정보#

아키텍처를 자세히 알아보기 전에, 이 두 모델의 기원을 이해하는 것이 중요합니다. 두 모델 모두 선도적인 연구 그룹에 의해 개발되었으며, 실시간 객체 탐지의 한계를 넓히기 위한 고급 방법론을 도입했습니다.

Link to this sectionYOLOv7 세부 정보#

YOLO 제품군의 연속으로 개발된 YOLOv7은 추론 비용을 증가시키지 않으면서 정확도를 크게 향상하기 위해 학습 가능한 "bag-of-freebies" 개념을 도입했습니다.

YOLOv7에 대해 더 알아보기

Link to this sectionDAMO-YOLO 세부 정보#

Alibaba Group의 연구원들이 개발한 DAMO-YOLO는 다양한 하드웨어를 위한 고효율 모델을 구축하기 위해 Neural Architecture Search (NAS) 및 고급 지식 증류(knowledge distillation)에 크게 집중했습니다.

DAMO-YOLO에 대해 더 알아보기

Link to this section아키텍처 혁신#

Link to this sectionYOLOv7: 기울기 경로 분석 및 재매개변수화(Re-parameterization)#

YOLOv7은 **Extended Efficient Layer Aggregation Networks (E-ELAN)**에 중점을 둡니다. 저자들은 네트워크의 기울기 경로를 분석하여 E-ELAN을 설계했으며, 이를 통해 원래의 기울기 경로를 저하시키지 않으면서 네트워크가 지속적으로 학습할 수 있도록 했습니다. 또한 YOLOv7은 추론 중에 모델 재매개변수화를 효과적으로 활용하여 레이어를 원활하게 융합함으로써 FLOPs를 줄이고 실행 시간을 단축합니다. 이러한 특징 덕분에 최신 GPU에서의 실시간 추론에 매우 적합합니다.

Link to this sectionDAMO-YOLO: Neural Architecture Search 및 RepGFPN#

DAMO-YOLO는 지연 시간 제약 조건 하에서 **Neural Architecture Search (NAS)**를 적극적으로 활용한다는 점에서 차별화됩니다. 이 모델은 MAE-NAS라는 프레임워크를 사용하여 모바일 장치나 특정 엣지 가속기와 같은 특정 하드웨어에 최적화된 백본을 찾습니다. 넥(neck) 구조에는 효율적인 RepGFPN(Rep-parameterized Generalized Feature Pyramid Network)을 도입했으며, 예측 헤드의 계산 부담을 최소화하기 위해 ZeroHead 설계를 채택했습니다.

증류(Distillation) 차이점

YOLOv7은 강력한 고유 아키텍처 최적화에 의존하는 반면, DAMO-YOLO는 복잡한 다단계 지식 증류 과정에 크게 의존합니다. 이는 거대한 교사 모델(teacher model)을 학습시켜 작은 학생 모델(student model)로 지식을 증류해야 하므로 학습 단계에서 높은 계산 비용이 발생할 수 있습니다.

Link to this section성능 및 지표 비교#

이 모델들을 비교할 때는 mAP (Mean Average Precision), 추론 속도, 모델 복잡도를 살펴보는 것이 중요합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

위 표는 YOLOv7이 고정밀 도메인(YOLOv7x)으로 잘 확장되는 반면, DAMO-YOLO는 제한된 환경을 위해 고도로 최적화된 초소형 모델을 제공함을 보여줍니다.

Link to this section학습 효율성 및 메모리 요구 사항#

두 아키텍처의 가장 큰 차이점은 학습 방법론에 있습니다. DAMO-YOLO가 증류에 의존한다는 것은 처음부터 새로운 모델을 학습하거나 사용자 지정 컴퓨터 비전 데이터셋으로 미세 조정(fine-tuning)할 때 더 많은 VRAM과 GPU 컴퓨팅 시간이 요구되는 경우가 많다는 것을 의미합니다.

반면, YOLOv7 및 이후 버전과 같이 Ultralytics 생태계에 통합된 모델은 메모리 요구 사항에 맞춰 크게 최적화되어 있습니다. 이를 통해 개발자는 메모리 부족 오류 없이 소비자용 하드웨어에서 더 큰 배치 사이즈를 활용할 수 있어 실험 추적 및 반복 프로세스를 간소화할 수 있습니다.

Link to this sectionUltralytics의 장점#

YOLOv7과 DAMO-YOLO 모두 뛰어난 기능을 제공하지만, Ultralytics 생태계 내에서 모델을 배포하면 비교할 수 없는 개발자 경험을 누릴 수 있습니다.

  • 사용 편의성: Ultralytics Python 패키지는 통합된 간단한 API를 제공합니다. 몇 줄의 코드만으로 모델 아키텍처 간에 빠르게 전환하거나, 학습 루프를 시작하거나, 추론을 실행할 수 있습니다.
  • 잘 관리된 생태계: Ultralytics는 최신 PyTorch 릴리스 및 CUDA 드라이버와의 네이티브 호환성을 보장하는 빈번한 업데이트를 제공합니다. 또한 모델을 ONNX, TensorRT, OpenVINO와 같은 형식으로 내보내는 과정을 간소화합니다.
  • 다재다능함: 순수 객체 탐지기인 DAMO-YOLO와 달리, Ultralytics 생태계는 다양한 작업을 네이티브로 지원합니다. Ultralytics 제품군의 모델은 표준 경계 상자 탐지, 자세 추정, 인스턴스 분할, 회전 경계 상자(OBB) 작업을 수행할 수 있습니다.

Link to this section코드 예시: 빠르게 시작하기#

Ultralytics 모델을 사용하여 로드, 학습 및 추론을 얼마나 쉽게 실행할 수 있는지 보여주는 예시입니다:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")
모델 내보내기

Ultralytics를 사용하면 학습된 가중치를 하드웨어 가속 형식(TensorRT 또는 CoreML 등)으로 내보내는 작업이 export 명령의 단일 인수를 통해 처리되므로 복잡한 스크립트 설정 시간을 절약할 수 있습니다.

Link to this section차세대: YOLO26#

YOLOv7은 강력한 레거시 아키텍처로 남아 있지만, 해당 분야는 빠르게 발전했습니다. 새로운 배포를 위해서는 2026년 1월에 출시된 Ultralytics YOLO26이 권장 표준이며, 거의 모든 지표에서 이전 세대를 능가합니다.

  • 엔드투엔드 NMS-Free 설계: YOLOv10에서 처음 개척된 YOLO26은 NMS(Non-Maximum Suppression) 후처리를 네이티브로 제거합니다. 이는 로봇 공학 및 자율 주행 기술에 필수적인 결정론적이고 초저지연인 추론을 보장합니다.
  • MuSGD 옵티마이저: 고급 LLM 학습 기술(Moonshot AI의 Kimi K2 등)에서 영감을 받은 이 하이브리드 옵티마이저는 SGD와 Muon을 결합하여 데이터셋 전반에서 매우 안정적인 학습과 빠른 수렴을 제공합니다.
  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써 YOLO26은 엣지 컴퓨팅 플랫폼과 CPU에서의 성능을 크게 향상시킵니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 작은 객체 탐지에서 상당한 개선을 가져오며, YOLO26을 항공 이미지 및 상세 감시에 매우 적합하게 만듭니다.

YOLO26에 대해 자세히 알아보기

Link to this section이상적인 사용 사례#

Link to this sectionDAMO-YOLO를 선택해야 할 때#

  • NAS에 대한 학술 연구: 귀하의 조직이 Neural Architecture Search 방법론 연구에 깊이 관여하고 있는 경우.
  • 특정 하드웨어의 초고도 제약 지연 시간: 사용자 지정 AI 가속기 칩을 위한 맞춤형 백본을 찾기 위해 철저한 NAS 검색을 실행할 자원이 있는 경우.

Link to this sectionYOLOv7을 선택해야 하는 경우#

  • 기존 GPU 파이프라인: 고성능 NVIDIA 하드웨어에서 YOLOv7의 특정 E-ELAN 아키텍처를 중심으로 최적화된 레거시 프로덕션 파이프라인을 유지 관리하는 팀의 경우.

Link to this section최신 Ultralytics 모델(YOLO11 / YOLO26)로 마이그레이션해야 하는 이유#

소매 분석, 스마트 제조, 의료 등 대다수의 엔터프라이즈 애플리케이션에서 최신 Ultralytics 모델은 타의 추종을 불허합니다. Ultralytics Platform과의 통합은 완벽한 ML 파이프라인을 제공하며, 사용 편의성, 뛰어난 문서화, 강력한 커뮤니티 지원 및 멀티 태스크 범용성을 제공합니다. Raspberry Pi에서 재고를 추적하든 클라우드에서 무거운 분석을 실행하든, YOLO26과 같은 모델은 컴퓨터 비전의 미래를 위한 이상적인 성능 균형을 제공합니다.

댓글