콘텐츠로 건너뛰기

YOLO . EfficientDet: 객체 탐지 아키텍처 심층 분석

최적의 컴퓨터 비전 아키텍처를 선택하는 것은 추론 지연 시간부터 하드웨어 비용에 이르기까지 모든 것에 영향을 미치는 중대한 결정입니다. 본 기술 비교에서는 두 가지 영향력 있는 모델, 알리바바의 YOLO Google EfficientDet를 분석합니다. EfficientDet가 확장 가능한 효율성 개념을 도입한 반면,YOLO 새로운 디스틸레이션 기법으로 실시간 성능의 한계를YOLO .

본 가이드는 그들의 아키텍처, 성능 지표 및 현대적 배포 적합성에 대한 엄격한 분석을 제공함과 동시에, Ultralytics 같은 차세대 솔루션이 사용 편의성과 에지 효율성 측면에서 어떻게 새로운 기준을 제시하고 있는지 탐구합니다.

DAMO-YOLO 개요

YOLO 알리바바 그룹이 개발한 고성능 객체 탐지YOLO . 신경망 구조 탐색(NAS) 및 중대한 재매개변수화 같은 기술을 활용하여 속도와 정확도 간의 균형을 최우선으로 고려합니다. 주로 산업용 애플리케이션을 위해 설계되어 탐지 품질을 저하시키지 않으면서 지연 시간을 줄이는 것을 목표로 합니다.

저자: 쉬셴저(Xianzhe Xu), 장이치(Yiqi Jiang), 천웨이화(Weihua Chen), 황이룬(Yilun Huang), 장위안(Yuan Zhang), 쑨시위(Xiuyu Sun)
소속:알리바바 그룹(Alibaba Group)
날짜: 2022년 11월 23일
Arxiv:YOLO
GitHub:YOLO
문서:YOLO

주요 아키텍처 기능

  • MAE-NAS 백본: 효율적인 백본 구조를 발견하기 위해 마스크드 자동 인코더(MAE) 기반 신경망 아키텍처 검색을 사용합니다.
  • 효율적인 RepGFPN: 재매개변수화(re-parameterization)를 활용하는 헤비 넥(heavy neck) 설계(유사한 YOLOv6과 유사한)을 활용하여 추론을 빠르게 유지하면서 특징을 효과적으로 융합하는 헤비 넥(heavy neck) 설계.
  • ZeroHead: 최종 예측 단계에서 계산 오버헤드를 최소화하는 경량 탐지 헤드.
  • AlignedOTA: 훈련 중 분류 및 회귀 작업 간의 정렬 불일치 문제를 해결하는 개선된 레이블 할당 전략.

EfficientDet 개요

Google 팀이 개발한 EfficientDet는 모델 확장에 체계적인 접근법을 제시했습니다. 백본, 해상도, 깊이를 동시에 확장함으로써 EfficientDet는 놀라운 효율성을 달성합니다. 이 모델은 EfficientNet 백본을 기반으로 하며, 복잡한 특징 융합을 위해 BiFPN(양방향 특징 피라미드 네트워크)을 도입합니다.

저자: Mingxing Tan, Ruoming Pang, Quoc V. Le
소속:Google
날짜: 2019년 11월 20일
Arxiv:EfficientDet 논문
GitHub:google
문서:EfficientDet README

주요 아키텍처 기능

  • 복합 스케일링: 단순한 복합 계수(파이)를 사용하여 네트워크의 너비, 깊이 및 해상도를 균일하게 스케일링하는 방법.
  • BiFPN: 가중치 기반 양방향 피라미드 네트워크로, 쉽고 빠르게 다중 스케일 특징 융합을 가능하게 합니다.
  • EfficientNet 백본: 특징 추출을 위해 강력한 EfficientNet 아키텍처를 활용합니다.

성능 비교

다음 표는YOLO EfficientDet 변형 모델의 성능을 비교합니다.YOLO 속도 대비 정확도 비율이 우수하며, 특히 재매개변수화된 블록이 빛을 발하는 GPU 두드러집니다. EfficientDet는 정확도는 높지만, 복잡한 BiFPN 연결과 느린 활성화 함수로 인해 종종 높은 지연 시간 문제를 겪습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0

결과 분석

  • 지연 시간:YOLO TensorRT 측면에서 EfficientDet보다YOLO 우수한 성능을 보입니다. 예를 들어, DAMO-YOLO는 약 mAP 50.8 mAP 달성하는 반면, EfficientDet-d4는 유사한 정확도를 위해 약 33ms가 필요합니다.
  • 아키텍처 효율성: EfficientDet의 낮은 매개변수 수(예: d0는 390만 개 매개변수만 보유)는 저장 공간 효율성을 높이지만, 복잡한 그래프 구조(BiFPN)로 인해 YOLO 모델의 간소화된 구조에 비해 실제 추론 속도가 느려지는 경우가 많습니다.
  • 자원 사용:YOLO 훈련 과정에서 "증류 강화(Distillation Enhancement)"를YOLO , 더 작은 학생 모델이 더 큰 교사 모델로부터 학습할 수 있게 하여 추론 비용을 증가시키지 않으면서 성능을 향상시킵니다.

재매개변수화 설명

YOLO RepVGG와 유사한 재매개변수화 기법을YOLO . 훈련 과정에서 모델은 복잡한 다중 분기 블록을 통해 풍부한 특징을 학습합니다. 추론 전에 이러한 분기들은 수학적으로 단일 컨볼루션으로 병합되어 정확도를 유지한 채 속도를 획기적으로 향상시킵니다.

사용 사례 및 응용 분야

각 모델이 뛰어난 부분을 이해하는 것은 작업에 적합한 도구를 선택하는 데 도움이 됩니다.

YOLO 언제 사용해야 하는가

  • 산업용 검사: 고속 컨베이어에서 결함을 감지하는 데 밀리초 단위의 지연 시간이 중요한 제조 라인에 이상적입니다.
  • 스마트 시티 감시: 높은 처리량으로 단일 GPU에서 다중 비디오 스트림을 처리할 수 있습니다.
  • 로봇공학: 장애물 회피를 위해 신속한 반응 시간이 필요한 자율 주행에 적합합니다.

EfficientDet 사용 시기

  • 학술 연구: 체계적인 확장 규칙 덕분에 모델 효율성 이론 연구의 탁월한 기준점이 된다.
  • 저장 공간이 제한된 환경: 디스크 공간이 주요 병목 현상인 경우 d0/d1 변형 모델의 극히 낮은 매개변수 수가 유리하지만, RAM 사용량과 CPU YOLO 유사한 YOLO 여전히 높을 수 있습니다.
  • 모바일 애플리케이션(레거시): 초기 모바일 배포에서는 TFLite 버전의 EfficientDet를 활용했으나, 현대적인 아키텍처인 YOLO11 과 같은 현대적인 아키텍처가 이를 대체했습니다.

Ultralytics의 강점: YOLO26의 등장

YOLO EfficientDet가 중요한 이정표였지만, 해당 분야는 진화해 왔습니다. Ultralytics 종단간 설계와 우수한 최적화를 통해 기존 아키텍처의 한계를 해결하며 현재의 최첨단 기술을 대표합니다.

YOLO26에 대해 더 알아보기

개발자들이 Ultralytics를 선호하는 이유

  1. 사용 편의성 및 생태계: Ultralytics 원활한 "초보자부터 전문가까지" 경험을 Ultralytics . 연구 저장소에서 흔히 요구하는 복잡한 구성 파일과 달리, Ultralytics 몇 줄의 Python 코드만으로 훈련을 시작할 수 Ultralytics . 생태계에는 손쉬운 데이터셋 관리와 클라우드 훈련을 위한 Ultralytics 포함됩니다.

    from ultralytics import YOLO
    
    # Load the latest YOLO26 model
    model = YOLO("yolo26n.pt")
    
    # Train on a custom dataset
    results = model.train(data="coco8.yaml", epochs=100)
    
  2. 성능 균형: YOLO26은 파레토 프론티어를 선도하도록 설계되었습니다. 이전 세대에 비해 최대 43% 빠른 CPU 제공하여 GPU가 없는 환경에서도 엣지 AI 애플리케이션의 핵심 성능을 발휘합니다.

  3. 엔드투엔드 NMS: 객체 탐지기 배포 시 가장 큰 문제점 중 하나는 비최대 억제(NMS)입니다.YOLO NMS 의존하여 후처리 과정을 복잡하게 만들고 지연 시간 변동성을 유발합니다. YOLO26은 본질적으로 엔드투엔드 방식으로, NMS 제거하여 결정론적이고 더 빠른 추론을 가능하게 합니다.

  4. 훈련 효율성 및 MuSGD: YOLO26은 SGD 하이브리드인 MuSGD 최적화기를 통합합니다. LLM 훈련에서 영감을 받은 이 혁신은 안정적인 수렴을 보장하고 광범위한 하이퍼파라미터 튜닝의 필요성을 줄입니다. 훈련 중 낮은 메모리 요구 사항과 결합되어, 메모리 집약적인 트랜스포머 하이브리드(예: RT-DETR와 같은 메모리 집약적인 트랜스포머 하이브리드에 비해 소비자용 하드웨어에서 더

  5. 다용도성: EfficientDet 및YOLO 주로 바운딩 박스에YOLO 반면, Ultralytics 인스턴스 분할, 자세 추정, OBB, 분류 등 다양한 작업을 단일 통합 API 내에서 기본적으로 지원합니다.

비교 요약

기능EfficientDetDAMO-YOLOUltralytics YOLO26
아키텍처앵커 기반, BiFPN앵커 프리, RepGFPN엔드 투 엔드, NMS
추론 속도느림 (복잡 그래프)빠름 (GPU )최첨단 기술 (CPU GPU)
배포복합체 (NMS )중간 (NMS )단순 (NMS)
훈련 기억높음보통낮음 (최적화됨)
작업 지원객체 탐지객체 탐지탐지, 분할, 자세, OBB

결론

YOLO EfficientDet 모두 컴퓨터 비전 역사에 크게 기여했습니다. EfficientDet는 복합 스케일링의 힘을 입증한 반면,YOLO 재매개변수화와 디스틸레이션의 효용성을YOLO . 그러나 2026년 새 프로젝트를 시작하는 개발자들에게는 Ultralytics 압도적인 이점을 제공합니다.

NMS 제거로 배포 파이프라인이 NMS , MuSGD 최적화기가 훈련 속도를 가속화하며, 최적화된 아키텍처가 엣지 CPU와 고성능 GPU 모두에서 탁월한 속도를 제공합니다. 스마트 카메라 시스템을 구축하든 클라우드 기반 영상 분석 플랫폼을 구축하든, Ultralytics 견고한 생태계와 성능은 이를 권장하는 선택으로 Ultralytics .

추가적인 탐구를 위해 YOLO26과 YOLOv10 비교하거나 YOLO의 장점을 이해하는 것도 흥미로울 수 있습니다. YOLO11 의 장점을 이해하는 것도 흥미로울 수 있습니다.


댓글