콘텐츠로 건너뛰기

DAMO-YOLO vs. EfficientDet: 기술 비교

빠르게 진화하는 컴퓨터 비전 환경에서 올바른 객체 감지 아키텍처를 선택하는 것은 애플리케이션의 성공을 위해 매우 중요합니다. 이 종합적인 분석에서는 알리바바의 고성능 모델인 YOLO Google 확장 가능하고 효율적인 아키텍처인 EfficientDet을 비교합니다. 두 모델 모두 속도, 정확성, 계산 비용 사이의 영원한 트레이드오프 문제를 해결하면서 이 분야에 상당한 혁신을 가져왔습니다.

모델 개요

성능 메트릭에 대해 자세히 알아보기 전에 각 모델의 혈통과 아키텍처 철학을 이해하는 것이 중요합니다.

DAMO-YOLO

알리바바 그룹에서 개발한 YOLO (증류 강화 신경 구조 검색 기반 YOLO)는 정확도 저하 없이 추론 속도를 극대화하는 데 중점을 둡니다. 백본을 위한 신경 구조 검색(NAS), 효율적인 RepGFPN(재파라미터화된 일반화된 특징 피라미드 네트워크), 제로헤드로 알려진 경량 감지 헤드와 같은 기술을 도입합니다.

YOLO 세부 정보:

DAMO-YOLO에 대해 자세히 알아보세요.

EfficientDet

Google Brain 팀에서 개발한 EfficientDet은 복합 스케일링 방법을 제안하여 객체 감지에 혁신을 일으켰습니다. 이 접근 방식은 백본, 특징 네트워크, 예측 네트워크의 해상도, 깊이, 폭을 균일하게 확장합니다. 이 방식은 쉽고 빠르게 특징을 융합할 수 있는 BiFPN(양방향 특징 피라미드 네트워크)을 특징으로 합니다.

효율적 세부 정보:

EfficientDet에 대해 자세히 알아보세요.

성능 분석: 속도, 정확도 및 효율성

다음 차트와 표는 COCO 데이터 세트에서 EfficientDet과 YOLO 모델을 정량적으로 비교한 것입니다. 이러한 벤치마크는 각 아키텍처의 뚜렷한 최적화 목표를 강조합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

주요 내용

데이터를 통해 각 모델 제품군별로 뚜렷한 강점을 관찰할 수 있습니다:

  1. GPU 지연 시간: YOLO GPU 추론 속도에서 우위를 점합니다. 예를 들어 DAMO-YOLOm 를 달성합니다. 평균 평균 정밀도mAP 49.2를 기록했으며 지연 시간은 T4 GPU 5.09ms에 불과했습니다. 대조적으로 EfficientDet-d4는 비슷한 49.7의 mAP 보이지만 33.55ms로 훨씬 느립니다.
  2. 파라미터 효율성: EfficientDet은 매개변수 측면에서 매우 가볍고 부동 소수점 연산(FLOP). EfficientDet-d0 는 390만 개의 파라미터만 사용하기 때문에 스토리지 효율성이 높지만, 그렇다고 해서 YOLO 같은 아키텍처 최적화 모델에 비해 최신 GPU에서 추론 속도가 항상 빨라지는 것은 아닙니다.
  3. CPU 성능: EfficientDet은 신뢰할 수 있는 CPU 벤치마크를 제공하므로 GPU 가속을 사용할 수 없는 레거시 하드웨어에서도 여전히 실행 가능한 옵션입니다.

아키텍처 노트

YOLO 속도 이점은 신경망 아키텍처 검색(NAS)을 사용하여 하드웨어 지연 시간에 대한 특정 최적화에 기인하는 반면, EfficientDet은 실제 지연 시간과 항상 선형적으로 상관관계가 있는 것은 아닌 이론적 FLOP에 최적화되어 있습니다.

심층적인 아키텍처 분석

EfficientDet: 복합 확장 기능의 힘

EfficientDet은 모바일 역병목 컨볼루션(MBConv)을 활용하는 EfficientNet 백본을 기반으로 구축되었습니다. 이 솔루션의 가장 큰 특징은 가중치가 부여된 양방향 피처 피라미드 네트워크인 BiFPN입니다. 하향식으로만 피처를 합산하는 기존 FPN과 달리, BiFPN은 각 피처 레이어를 학습 가능한 가중치로 처리하여 정보가 하향식과 상향식으로 모두 흐르도록 합니다. 이를 통해 네트워크는 다양한 입력 특징의 중요성을 이해할 수 있습니다.

이 모델은 네트워크 폭, 깊이 및 해상도를 균일하게 증가시키는 복합 계수인 phi를 사용하여 스케일링되므로 더 큰 모델(예 d7)는 정확성과 효율성 측면에서 균형을 유지합니다.

YOLO: 속도 지향적 혁신

YOLO 실시간 레이턴시에 초점을 맞춰 다른 접근 방식을 취합니다. MAE-NAS (아키텍처 검색 자동화 방법)를 사용하여 특정 지연 시간 제약 조건에서 최적의 백본 구조를 찾습니다.

주요 혁신은 다음과 같습니다:

  • RepGFPN: 표준 GFPN보다 개선된 기능으로, 재매개변수화를 통해 기능 융합 경로를 최적화하여 속도를 향상시킵니다.
  • 제로헤드: 일반적으로 최종 예측 레이어와 관련된 계산 부담을 줄여주는 간소화된 탐지 헤드입니다.
  • AlignedOTA: 학습 중 분류 작업과 회귀 작업 간의 정렬 불일치를 해결하는 라벨 할당 전략입니다.

사용 사례 및 응용 분야

아키텍처의 차이에 따라 실제 시나리오에서 각 모델이 뛰어난 부분이 결정됩니다.

  • EfficientDet은 스토리지 제약이 있는 환경이나 FLOP을 최소화하는 것이 중요한 CPU 추론에 의존하는 애플리케이션에 이상적입니다. 배터리 수명(FLOP과 상관관계가 있는)이 주요 관심사인 모바일 애플리케이션 및 임베디드 시스템에서 자주 사용됩니다.
  • YOLO GPU에서 실시간 추론이 필요한 산업 자동화, 자율 주행, 보안 감시 분야에서 탁월한 성능을 발휘합니다. 지연 시간이 짧아 프레임 드롭 없이 고프레임률 비디오 스트림을 처리할 수 있습니다.

Ultralytics 이점

YOLO EfficientDet이 지원되는 모델이지만, 그 외에도 Ultralytics 에코시스템은 최신 AI 개발을 위한 보다 포괄적인 솔루션을 제공합니다. 다음과 같은 최신 YOLO11 및 다목적 YOLOv8 과 같은 모델은 사용성, 성능 및 기능 세트에서 상당한 이점을 제공합니다.

YOLO11에 대해 자세히 알아보세요

왜 Ultralytics 선택해야 할까요?

  • 성능 균형: Ultralytics 모델은 속도와 정확도 사이에서 최상의 균형을 제공하도록 설계되었습니다. 예를 들어, YOLO11 이전 세대에 비해 뛰어난 mAP 제공하면서도 CPU와 GPU 모두에서 뛰어난 추론 속도를 유지합니다.
  • 사용 편의성: "배터리 포함" 철학에 따라, Ultralytics 간단한 Python API와 강력한 명령줄 인터페이스(CLI)를 제공합니다. 개발자는 몇 분 만에 설치부터 교육까지 완료할 수 있습니다.

    from ultralytics import YOLO
    
    # Load a pre-trained YOLO11 model
    model = YOLO("yolo11n.pt")
    
    # Run inference on an image
    results = model("path/to/image.jpg")
    
  • 잘 관리된 에코시스템: 게시 후 폐기되는 많은 연구 모델과 달리, Ultralytics GitHub 이슈 및 토론을 통해 빈번한 업데이트, 버그 수정, 커뮤니티 지원을 제공하는 활성 리포지토리를 유지합니다.

  • 다용도성: Ultralytics 모델은 바운딩 박스에만 국한되지 않습니다. 기본적으로 하나의 통합 프레임워크 내에서 인스턴스 분할, 포즈 추정, 이미지 분류, 방향성 바운딩 박스(OBB)를 모두 지원합니다.
  • 메모리 효율성: Ultralytics YOLO 모델은 훈련 중에 메모리 효율을 높이도록 설계되었습니다. 이는 상당한 양의 CUDA 메모리를 필요로 하는 트랜스포머 기반 모델이나 구형 아키텍처와는 대조적으로, 일반 소비자용 하드웨어에서도 Ultralytics 모델을 사용할 수 있게 해줍니다.
  • 훈련 효율성: 이 프레임워크는 자동 혼합 정밀도(AMP), GPU GPU 트레이닝, 캐싱과 같은 기능을 지원하므로 사용자 지정 데이터 세트를 빠르고 비용 효율적으로 트레이닝할 수 있습니다.

결론

YOLO EfficientDet은 모두 컴퓨터 비전 역사에서 중요한 이정표가 되었습니다. EfficientDet은 원칙에 입각한 확장과 효율적인 기능 융합의 힘을 보여주었고, YOLO 지연 시간을 인식하는 아키텍처 검색의 한계를 뛰어넘었습니다.

하지만 고성능과 탁월한 개발자 경험을 결합한 프로덕션 지원 솔루션을 찾는 개발자에게는 적합하지 않습니다, Ultralytics YOLO11 을 추천합니다. 강력한 에코시스템과의 통합, 다양한 컴퓨터 비전 작업 지원, 지속적인 개선으로 시각적 데이터를 실행 가능한 인사이트로 전환하는 데 가장 실용적인 도구가 될 것입니다.

다른 모델 비교 살펴보기

모델 선택 프로세스에 추가적인 도움을 받으려면 Ultralytics 설명서에서 관련 비교를 살펴보세요:


댓글