Link to this sectionDAMO-YOLO 대 YOLOv8#

실시간 컴퓨터 비전 분야는 연구자와 엔지니어가 속도와 정확성의 한계를 끊임없이 확장함에 따라 지속적으로 변화하고 있습니다. 이 여정에서 중요한 두 가지 이정표는 DAMO-YOLO와 Ultralytics YOLOv8입니다. 두 모델 모두 지연 시간(latency)과 평균 정밀도(mAP) 간의 균형을 최적화하는 것을 목표로 하지만, 객체 탐지 문제를 해결하기 위해 근본적으로 다른 아키텍처 및 철학적 접근 방식을 취합니다.

이 종합적인 기술 분석에서는 다음 인공지능 프로젝트에 적합한 도구를 선택할 수 있도록 두 모델의 기본 아키텍처, 학습 방법론 및 실제 배포 사례를 비교합니다.

Link to this section모델 계보 및 사양#

이 딥러닝 모델들의 기원을 이해하면 설계 목표와 배포 생태계에 관한 귀중한 맥락을 얻을 수 있습니다.

Link to this sectionDAMO-YOLO 세부 정보#

저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
조직: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: tinyvision/DAMO-YOLO

DAMO-YOLO에 대해 더 알아보기

Link to this sectionUltralytics YOLOv8 상세 정보#

저자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
조직: Ultralytics
날짜: 2023-01-10
GitHub: ultralytics/ultralytics
문서: YOLOv8 문서

YOLOv8에 대해 더 알아보기

Link to this section아키텍처 혁신#

두 아키텍처의 성능 특성은 고유한 구조적 결정에서 비롯됩니다.

Link to this sectionDAMO-YOLO: 아키텍처 탐색 기반의 접근#

DAMO-YOLO는 최적의 네트워크 구조를 자동으로 발견하기 위해 신경 아키텍처 탐색(NAS)에 크게 의존합니다. 이 모델은 낮은 지연 시간으로 높은 성능을 제공하는 백본을 검색하는 MAE-NAS라는 개념을 도입했습니다. 또한, 다양한 공간적 척도(spatial scale)에 걸쳐 특징 융합을 향상하기 위해 효율적인 RepGFPN(재매개변수화된 일반화 특징 피라미드 네트워크)을 사용합니다.

학습을 개선하기 위해 Alibaba 팀은 ZeroHead 설계와 AlignedOTA 레이블 할당을 통합했습니다. 더 나아가, 대규모 교사 모델(teacher model)이 경량 학생 모델(student model)을 지도하여 학술 벤치마크에서 더 높은 정확도 지표를 끌어내는 복잡한 지식 증류(knowledge distillation) 과정에 크게 의존합니다.

Link to this sectionYOLOv8: 능률적이고 다재다능한 모델#

Ultralytics는 YOLOv8을 통해 개발자 우선 접근 방식을 취했습니다. YOLOv5의 앵커 기반 설계에서 앵커 프리(anchor-free) 아키텍처로 전환하여 바운딩 박스 예측 수를 크게 줄이고 추론 속도를 높였습니다. C2f(2개의 컨볼루션이 포함된 교차 단계 부분 병목 현상) 모듈을 도입하여 과도한 계산 오버헤드 없이 그래디언트 흐름과 특징 표현을 개선했습니다.

바운딩 박스만을 목표로 하는 모델과 달리, YOLOv8은 처음부터 멀티모달(multi-modal)을 지향하도록 설계되었습니다. 통합된 PyTorch 코드베이스는 인스턴스 세그멘테이션, 포즈 추정 및 이미지 분류를 기본적으로 지원하므로, 엔지니어들이 서로 다른 저장소를 조합할 필요가 없습니다.

효율적인 학습

Ultralytics 모델은 대규모 트랜스포머 기반 아키텍처에 비해 학습 중 메모리 사용량이 본질적으로 낮아, 일반적인 소비자용 GPU에서도 최첨단 결과를 얻을 수 있습니다.

Link to this section성능 비교#

원시 지표를 비교할 때는 이론적 능력이 하드웨어 성능으로 어떻게 전환되는지 분석하는 것이 중요합니다. 아래 표는 모델 크기 전반에 걸친 장단점을 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

DAMO-YOLO는 증류 기술 덕분에 강력한 파라미터 대비 정확도 비율을 보이지만, YOLOv8은 더 넓은 범위의 모델 크기(Nano에서 Extra-large까지)를 제공합니다. YOLOv8 Nano 모델은 에지 최적화의 정수를 보여주며, 적은 리소스를 소비하면서도 매우 유용한 정밀도를 제공합니다.

Link to this section생태계 및 개발자 경험#

학술 논문과 프로덕션 준비 시스템 간의 진정한 차별화 요소는 생태계입니다.

DAMO-YOLO가 광범위한 지식 증류 파이프라인에 의존함에 따라 사용자 지정 학습이 번거로울 수 있습니다. 교사 모델 생성, 지식 전송 및 NAS 기반 백본 튜닝은 높은 CUDA 메모리와 고급 구성이 필요하여 민첩한 엔지니어링 팀의 속도를 늦추는 경우가 많습니다.

반면, Ultralytics 생태계는 사용 편의성을 지향합니다. Ultralytics 플랫폼을 통해 개발자는 간편한 API, 포괄적인 문서 및 강력한 실험 추적 통합 기능을 사용할 수 있습니다. 통합된 Python 프레임워크는 복잡한 파이프라인 구축을 매우 간단하게 만듭니다.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

이 능률적인 워크플로우는 OpenVINO 및 TensorRT로의 원활한 내보내기와 결합되어 로컬 프로토타이핑에서 클라우드 또는 에지 배포까지 마찰 없는 경로를 보장합니다.

Link to this section실제 애플리케이션 및 이상적인 사용 사례#

이러한 아키텍처 선택은 종종 운영 환경의 제약 조건에 따라 결정됩니다.

Link to this sectionDAMO-YOLO의 적합 분야#

DAMO-YOLO는 신경 아키텍처 탐색을 연구하는 학계 환경이나 복잡한 재매개변수화 전략을 재현하려는 연구자에게 탁월한 선택입니다. 또한, 팀이 다단계 학습을 처리할 컴퓨팅 리소스를 갖추고 있다면 제조 라인의 고속 결함 탐지와 같은 고도로 제어된 산업 응용 분야에서도 뛰어난 성능을 발휘할 수 있습니다.

Link to this section왜 Ultralytics가 프로덕션에서 앞서 나가는가#

대다수의 상업용 프로젝트에서 Ultralytics 모델은 더 우수한 성능 균형을 제공합니다.

스마트 리테일: YOLOv8의 멀티태스킹 기능을 사용하여 재고 관리를 위한 바운딩 박스 탐지와 고객 행동 분석을 위한 포즈 추정을 모두 처리합니다.
농업: 인스턴스 세그멘테이션을 활용하여 트랙터 피드에서 실시간으로 정확한 식물 경계와 잡초를 감지합니다.
항공 이미지: OBB(회전된 바운딩 박스)를 활용하여 드론이나 위성에서 회전된 차량과 선박을 정확하게 추적합니다.

기타 주목할 만한 모델

더 넓은 생태계를 탐색 중이라면, 앵커 프리 탐지 기능을 더욱 발전시킨 YOLOv10이나 YOLO11 비교에도 관심이 있으실 수 있습니다.

Link to this section미래 대비: YOLO26 도입#

YOLOv8이 여전히 기반 모델로 자리 잡고 있지만, 기술 분야는 계속 발전하고 있습니다. 모든 신규 개발에는 **YOLO26**을 권장 표준으로 사용합니다. 2026년 1월에 출시된 이 모델은 Ultralytics 라인업에서 기념비적인 도약을 의미합니다.

YOLO26은 기본 엔드 투 엔드 NMS-프리 설계를 개척하여 기존의 비최대 억제(Non-Maximum Suppression) 병목 현상을 완전히 제거했습니다. 이 구조적 돌파구는 CPU 추론 속도를 최대 43% 향상시켰으며, 에지 컴퓨팅 및 IoT 하드웨어를 위한 강력한 성능을 제공합니다.

또한, YOLO26은 대규모 언어 모델(LLM) 학습 기법에서 영감을 받은 하이브리드 MuSGD 옵티마이저를 도입하여 더 빠른 수렴과 매우 안정적인 학습 루프를 보장합니다. 새로운 ProgLoss + STAL 알고리즘과 결합된 YOLO26은 소형 객체 인식에서 비약적인 개선을 보여주며, 배포 환경에서 속도뿐만 아니라 타협 없는 정확성을 보장합니다.

YOLO26에 대해 자세히 알아보기

기여자

GLglenn-jocher¹² PDpderrenger¹

생성됨 2025년 1월 27일업데이트됨 3주 전