Link to this sectionYOLOv8 대 DAMO-YOLO#

컴퓨터 비전 분야는 끊임없이 발전하고 있으며, 새로운 아키텍처들이 엣지 디바이스와 대규모 클라우드 클러스터에서 가능한 영역의 한계를 넓히고 있습니다. 본 기술 분석에서는 두 가지 주요 실시간 객체 탐지 모델인 YOLOv8과 DAMO-YOLO를 비교합니다. 머신러닝 엔지니어들은 이들의 아키텍처, 성능 지표, 학습 방법론을 검토함으로써 배포 파이프라인을 위한 정보에 입각한 의사결정을 내릴 수 있습니다.

Link to this section모델 배경 및 기원#

두 모델 모두 비슷한 시기에 출시되었으나 서로 다른 설계 철학과 연구 목표를 바탕으로 합니다.

Link to this sectionYOLOv8 세부 정보#

저자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
조직: Ultralytics
날짜: 2023-01-10
GitHub: Ultralytics GitHub 저장소
문서: YOLOv8 공식 문서

YOLOv8에 대해 더 알아보기

Link to this sectionDAMO-YOLO 세부 정보#

저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
조직: Alibaba Group
날짜: 2022-11-23
Arxiv: DAMO-YOLO 연구 논문
GitHub: DAMO-YOLO GitHub 저장소

DAMO-YOLO에 대해 더 알아보기

Link to this section아키텍처 혁신#

Link to this sectionYOLOv8: 범용적인 앵커 프리(Anchor-Free) 설계#

Ultralytics YOLOv8은 이전 버전에 비해 상당한 개선을 이루었으며, 매우 신뢰할 수 있는 최첨단 모델로서의 입지를 굳혔습니다. 이 모델은 앵커 프리 탐지 헤드를 특징으로 하여 박스 예측 수를 줄이고 추론 속도를 높였습니다. 아키텍처는 디커플드 헤드(Decoupled Head)를 활용하여 객체성(Objectness), 분류, 회귀 작업을 분리함으로써 더욱 정확한 바운딩 박스 예측을 제공합니다.

또한 YOLOv8은 CIoU 손실과 함께 Distribution Focal Loss (DFL)을 구현하여 특히 작거나 가려진 타겟에 대해 객체 경계를 정밀하게 로컬라이징하는 모델의 능력을 향상시켰습니다. 간소화된 백본은 GPU와 CPU 실행 모두에 최적화되어 있습니다.

Link to this sectionDAMO-YOLO: 아키텍처 탐색 기반의 접근#

DAMO-YOLO는 신경 아키텍처 탐색(NAS)에 크게 의존하여 백본을 자동 설계하는 다른 접근 방식을 취합니다. Alibaba 팀은 TensorRT 가속 환경에서 최적의 지연 시간 및 정확도 트레이드오프를 제공하는 구조를 찾기 위해 "MAE-NAS"를 도입했습니다.

이 모델은 효율적인 특징 융합을 위해 RepGFPN(Reparameterized Generalized Feature Pyramid Network)을 통합하고 탐지 헤드의 계산 부담을 최소화하기 위한 "ZeroHead" 설계를 채택했습니다. 학습 과정에서는 라벨 할당을 위해 AlignedOTA를 활용하며, 타겟 학생 모델을 감독하기 위해 더 큰 교사 모델을 사용하는 복잡한 지식 증류 프로세스에 크게 의존합니다.

학습 복잡성

DAMO-YOLO는 NAS와 증류를 통해 인상적인 지연 시간 지표를 달성하지만, YOLOv8의 고도로 최적화된 단일 단계 학습 파이프라인과 비교했을 때 학습 중에 훨씬 더 많은 CUDA 메모리와 계산 시간이 필요합니다.

Link to this section성능 및 지표#

컴퓨터 비전 모델을 프로덕션 환경에 배포할 때는 정확도(mAP)와 추론 속도의 균형을 맞추는 것이 중요합니다. 아래 표는 다양한 크기에 걸친 두 모델의 성능을 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv8은 탁월한 성능 균형을 보여줍니다. YOLOv8n(nano) 모델은 DAMO-YOLOt의 850만 개 대비 320만 개의 파라미터만 필요하므로 모바일 디바이스나 엄격한 메모리 요구 사항이 있는 환경에서 월등히 뛰어납니다. 또한 YOLOv8은 클라우드 기반 워크로드를 위한 고정밀 YOLOv8x까지 확장 가능한 더 넓은 범위의 크기를 제공합니다.

Link to this section개발자 경험 및 생태계#

Link to this section사용 편의성과 학습 효율성#

가장 큰 차별화 요소 중 하나는 사용자 경험입니다. Ultralytics 생태계는 개발자의 속도를 위해 설계되었습니다. 커스텀 YOLOv8 모델을 학습하는 데에는 매우 적은 메모리 사용량만이 필요하며, 통합된 Python API 또는 CLI를 통해 실행할 수 있습니다.

반면 DAMO-YOLO의 증류 강화 학습을 재현하려면 복잡한 구성 파일을 다루고 다단계 교사-학생 실험 추적을 처리해야 하는 경우가 많습니다.

다음은 Python을 사용하여 YOLOv8을 학습, 검증 및 내보내는 것이 얼마나 간단한지에 대한 예시입니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")

# Export the trained model to ONNX format
path = model.export(format="onnx")

Link to this section비전 작업 전반의 다재다능함#

DAMO-YOLO는 엄격하게 바운딩 박스 객체 탐지만을 위해 구축되었습니다. 반면 YOLOv8 아키텍처는 기본적으로 다중 작업을 지원합니다. 모델 가중치를 교체하기만 하면 개발자는 기본 배포 코드베이스를 변경하지 않고도 인스턴스 분할, 이미지 분류, 자세 추정을 수행할 수 있습니다. 이러한 범용성은 Ultralytics 모델을 복잡한 애플리케이션에 훨씬 더 실용적으로 만듭니다.

Link to this section실제 활용 사례#

Link to this sectionYOLOv8을 사용해야 하는 경우#

YOLOv8의 속도, 정확도 및 배포 용이성의 조합은 다음에 이상적입니다.

스마트 리테일 분석: 객체 추적을 수행하여 고객 행동을 모니터링하거나 재고 확인을 자동화합니다.
농업 로봇 공학: 다양한 하드웨어에서 강력한 성능을 활용하여 실시간으로 작물이나 해충을 식별합니다.
의료 진단: 인스턴스 분할을 사용하여 의료 이미지 내 이상 징후를 빠르고 정확하게 매핑합니다.
엣지 배포: OpenVINO 및 CoreML과 같은 내보내기 형식과의 원활한 통합을 통해 YOLOv8은 제약이 있는 디바이스에서 뛰어난 성능을 발휘합니다.

Link to this sectionDAMO-YOLO를 사용해야 하는 경우#

DAMO-YOLO는 특히 다음과 같은 틈새 시나리오에서 유용할 수 있습니다.

학술적 NAS 연구: 재매개변수화 또는 자동화된 아키텍처 설계 방법론을 연구하는 팀에게 적합합니다.
엄격한 GPU 기반 파이프라인: NAS 구조가 TensorRT 실행 제한에 맞게 고도로 최적화된 특정 NVIDIA 하드웨어에서만 실행되는 애플리케이션.

Link to this section활용 사례 및 권장 사항#

YOLOv8과 DAMO-YOLO 중 선택하는 것은 프로젝트의 특정 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOv8을 선택해야 할 때#

YOLOv8은 다음과 같은 경우에 강력한 선택입니다:

범용 다중 작업 배포: Ultralytics 생태계 내에서 탐지, 분할, 분류, 자세 추정을 위한 검증된 모델이 필요한 프로젝트.
확립된 생산 시스템: 안정적이고 잘 검증된 배포 파이프라인을 갖춘 YOLOv8 아키텍처로 이미 구축된 기존 프로덕션 환경.
폭넓은 커뮤니티 및 생태계 지원: YOLOv8의 광범위한 튜토리얼, 타사 통합 및 활발한 커뮤니티 리소스를 활용하는 애플리케이션.

Link to this sectionDAMO-YOLO를 선택해야 할 때#

DAMO-YOLO는 다음의 경우 권장됩니다:

고처리량 영상 분석: 배치-1(batch-1) 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 높은 FPS 영상 스트림을 처리할 때.
산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section향후 전망: 최신 Ultralytics 모델#

YOLOv8은 여전히 매우 신뢰할 수 있는 핵심 모델이지만, 컴퓨터 비전 분야는 빠르게 움직이고 있습니다. 사용자들은 새로운 세대를 탐색하는 것도 고려해야 합니다.

YOLO26: 최신 세대인 Ultralytics YOLO26은 패러다임의 전환을 의미합니다. 이 모델은 독자적인 End-to-End NMS-Free 설계를 도입하여 NMS(Non-Maximum Suppression) 후처리와 관련된 지연 병목 현상을 완전히 제거했습니다. 새로운 MuSGD 옵티마이저(SGD와 Muon의 하이브리드)와 특수 ProgLoss + STAL 손실 함수로 구동되는 YOLO26은 매우 안정적인 학습과 크게 향상된 소형 객체 인식 성능을 달성합니다. DFL 제거(간소화된 내보내기와 더 나은 엣지/저전력 디바이스 호환성을 위해 Distribution Focal Loss 제거)와 아키텍처 최적화를 통해 이전 세대보다 CPU 추론 속도가 최대 43% 향상되어 현대적인 엣지 컴퓨팅을 위한 확실한 선택지가 되었습니다.

YOLO11: 또 다른 훌륭한 대안인 Ultralytics YOLO11은 YOLOv8 대비 점진적인 아키텍처 개선을 제공하며 커뮤니티에서 폭넓게 채택된 강력한 모델로 남아 있습니다.

워크플로우 간소화

모델을 프로토타입에서 프로덕션으로 전환할 준비가 되셨습니까? Ultralytics 플랫폼을 활용하여 데이터셋을 자동으로 주석 처리하고, 실험을 추적하며, 클라우드나 엣지 디바이스에 모델을 원활하게 배포하십시오.

결론적으로 DAMO-YOLO는 아키텍처 탐색에 대한 흥미로운 학술적 통찰력을 제공하지만, Ultralytics 모델은 훨씬 더 성숙하고 범용적이며 개발자 친화적인 생태계를 제공합니다. 입증된 안정성을 가진 YOLOv8을 그대로 사용하든, 매우 빠르고 NMS가 없는 YOLO26 아키텍처로 업그레이드하든, Ultralytics 제품군은 실시간 비전 AI를 위한 최고의 선택입니다.

기여자

GLglenn-jocher¹³

생성됨 2025년 1월 27일업데이트됨 3주 전