Link to this sectionEfficientDet 대 DAMO-YOLO#

확장 가능한 computer vision 파이프라인을 구축할 때, 올바른 모델 아키텍처를 선택하는 것은 배포의 실현 가능성과 탐지 정확도에 영향을 미치는 매우 중요한 결정입니다. 본 가이드에서는 시각 인식 분야에서 잘 알려진 두 가지 아키텍처인 EfficientDet과 DAMO-YOLO를 심층적이고 기술적으로 비교합니다.

두 모델 모두 object detection 분야에 상당한 혁신을 가져왔지만, 비전 AI의 급격한 발전으로 인해 더욱 통합된 생태계가 마련되었습니다. 본 분석 전반에 걸쳐 이러한 레거시 네트워크의 핵심 메커니즘을 살펴보고, 왜 Ultralytics Platform 및 Ultralytics YOLO26과 같은 현대적인 솔루션이 프로덕션 환경의 업계 표준이 되었는지 설명하겠습니다.

Link to this sectionEfficientDet: 확장 가능하고 효율적인 객체 탐지#

Google 연구진이 도입한 EfficientDet은 높은 효율성을 유지하면서 모델 아키텍처를 체계적으로 확장할 수 있도록 설계되었습니다. 이는 네트워크 깊이, 너비, 입력 해상도 전반에 걸쳐 복합 스케일링(compound scaling)을 활용하여 달성되었습니다.

EfficientDet 상세 정보: 저자: Mingxing Tan, Ruoming Pang, and Quoc V. Le
조직: Google Brain
날짜: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl

Link to this section아키텍처 혁신#

EfficientDet의 주요 기여는 Bi-directional Feature Pyramid Network(BiFPN)입니다. 기존의 FPN과 달리, BiFPN은 학습 가능한 가중치를 사용하여 서로 다른 입력 특징의 중요도를 파악함으로써 쉽고 빠른 다중 스케일 특징 융합을 가능하게 합니다. 이는 EfficientNet backbone과 결합되어 예측 가능한 방식으로 확장되는 모델 제품군(D0에서 D7)을 구성합니다.

Link to this section강점 및 약점#

EfficientDet의 핵심 강점은 파라미터 효율성에 있습니다. mean Average Precision (mAP)를 극대화해야 하는 클라우드 환경과 같이 제약이 많은 작업에서, 복합 스케일링 방식은 매우 예측 가능합니다. 그러나 EfficientDet은 처음부터 학습시키기가 매우 복잡하며, 종종 상당한 hyperparameter tuning을 요구합니다. 더욱이 특정 TensorFlow 연산에 대한 과도한 의존성으로 인해 ONNX 또는 TensorRT를 통한 엣지 배포로의 전환이 현대적인 YOLO 모델에서 볼 수 있는 간소화된 export capabilities보다 번거롭습니다.

EfficientDet에 대해 더 알아보기

Link to this sectionDAMO-YOLO: 자동화된 아키텍처 탐색의 실제 적용#

DAMO-YOLO는 신경망 아키텍처 탐색(NAS)을 활용하여 실시간 추론을 위한 최적의 네트워크 구조를 자동으로 설계하는 독특한 접근 방식을 나타냅니다.

DAMO-YOLO 상세 정보: 저자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
조직: Alibaba Group
날짜: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO

Link to this section아키텍처 혁신#

DAMO-YOLO는 몇 가지 혁신적인 기술을 도입했습니다. MAE-NAS라는 NAS 생성 백본, 넥을 위한 효율적인 RepGFPN, detection head의 계산 비용을 획기적으로 줄이는 ZeroHead 설계를 사용합니다. 또한 레이블 할당을 위해 AlignedOTA를 채택하고, 소형 변형 모델의 성능을 높이기 위해 지식 증류(knowledge distillation) 향상에 크게 의존합니다.

Link to this section강점 및 약점#

DAMO-YOLO는 TensorRT를 사용하여 NVIDIA 아키텍처에 배포하도록 특별히 설계된 GPU 추론 속도에서 뛰어난 성능을 발휘합니다. 무거운 헤드 구조를 제거함으로써 이 모델은 낮은 지연 시간으로 예측을 수행합니다. 반면, 자동화된 아키텍처 탐색으로 인해 모델 구조가 불투명해질 수 있어 수동 디버깅이나 커스텀 엣지 장치를 위한 미세 조정이 어려울 수 있습니다. 범용성이 뛰어난 Ultralytics YOLO11과 달리, DAMO-YOLO는 주로 표준 바운딩 박스 탐지에 중점을 두고 있으며 pose estimation 또는 oriented bounding box (OBB) 탐지와 같은 고급 작업에 대한 기본 지원이 부족합니다.

DAMO-YOLO에 대해 더 알아보기

Link to this section성능 비교#

경험적 트레이드오프를 이해하는 것은 모델 선택에 필수적입니다. 아래 표는 EfficientDet 제품군과 DAMO-YOLO 시리즈를 주요 performance metrics 측면에서 비교합니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

데이터 분석

EfficientDet-d7은 가장 높은 이론적 정확도를 달성하지만 엄청난 컴퓨팅 파워를 요구하므로 edge AI에는 적합하지 않습니다. DAMO-YOLO는 뛰어난 TensorRT 속도를 제공하지만, 일반적으로 하위 단계의 EfficientDet 모델과 비슷한 정확도를 얻으려면 더 많은 파라미터가 필요합니다.

Link to this section활용 사례 및 권장 사항#

EfficientDet과 DAMO-YOLO 중 선택하는 것은 프로젝트의 특정 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionEfficientDet을 선택해야 할 때#

EfficientDet은 다음 상황에 적합한 강력한 선택지입니다:

Google Cloud 및 TPU 파이프라인: EfficientDet의 네이티브 최적화가 지원되는 Google Cloud Vision API 또는 TPU 인프라와 깊게 통합된 시스템.
컴파운드 스케일링 연구: 네트워크 깊이, 너비 및 해상도 스케일링의 균형 잡힌 효과를 연구하는 데 중점을 둔 학술적 벤치마킹.
TFLite를 통한 모바일 배포: Android 또는 임베디드 Linux 장치를 위해 TensorFlow Lite 내보내기가 특별히 필요한 프로젝트.

Link to this sectionDAMO-YOLO를 선택해야 할 때#

DAMO-YOLO는 다음의 경우 권장됩니다:

고처리량 영상 분석: 배치-1(batch-1) 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 높은 FPS 영상 스트림을 처리할 때.
산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향을 연구할 때.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 강점: 레거시 모델을 넘어선 발전#

EfficientDet과 DAMO-YOLO가 귀중한 학술적 통찰을 제공하지만, 현대 개발자들은 최첨단 성능과 개발자 편의성 사이에서 균형을 잡는 프레임워크를 필요로 합니다. 바로 이 지점에서 Ultralytics ecosystem이 탁월한 가치를 발휘합니다.

Link to this section타의 추종을 불허하는 사용 편의성과 생태계#

분리되고 과도하게 커스터마이징된 연구용 리포지토리에서 모델을 배포하는 것은 종종 통합의 악몽으로 이어집니다. Ultralytics는 광범위한 문서와 파이썬다운 API를 갖춘 통합되고 well-maintained ecosystem을 제공합니다. Google Colab을 사용한 학습이든 모바일 추론을 위한 CoreML 내보내기든, 파이프라인은 단 몇 줄의 코드만으로 가능합니다.

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

Link to this sectionYOLO26 혁명#

EfficientDet이나 DAMO-YOLO를 평가하는 개발자에게 Ultralytics YOLO26은 궁극적인 진화 단계입니다. 2026년 초에 출시된 이 모델은 패러다임을 전환하는 기능을 도입했습니다.

엔드투엔드 NMS-Free 설계: YOLOv10이 처음 개척한 YOLO26은 NMS(Non-Maximum Suppression) 후처리의 필요성을 근본적으로 제거합니다. 이는 훨씬 더 간단한 배포 아키텍처와 다양한 하드웨어 전반에 걸친 일관된 지연 시간을 의미합니다.
최대 43% 더 빠른 CPU 추론: 고성능 GPU가 없는 엣지 배포(DAMO-YOLO가 고전하는 시나리오)를 위해, YOLO26은 강력하게 최적화되어 표준 CPU에서 엄청난 속도 향상을 제공합니다.
MuSGD 최적화 도구: LLM 혁신과 컴퓨터 비전의 간극을 메우는 YOLO26은 (Moonshot AI에서 영감을 받은) MuSGD 최적화 도구를 통합하여, EfficientDet의 불안정한 학습 루프에 비해 매우 안정적인 학습과 빠른 수렴을 보장합니다.
DFL 제거: Distribution Focal Loss를 제거하여 내보내기 프로세스를 간소화했으며, 저전력 마이크로컨트롤러 및 Raspberry Pi 장치와의 뛰어난 호환성을 보장합니다.
ProgLoss + STAL: 이러한 고급 손실 함수는 이전 아키텍처가 일반적으로 실패하던 영역인 소형 객체 인식에서 획기적인 개선을 가져옵니다.

Link to this section메모리 효율성 및 작업 다양성#

transformer 모델이나 고도로 결합된 NAS 네트워크와 달리, Ultralytics 모델은 엄격한 메모리 효율성이 특징입니다. 훈련 중 CUDA 메모리를 훨씬 적게 소비하므로 소비자급 하드웨어에서도 빠른 반복 학습이 가능합니다.

또한 EfficientDet과 DAMO-YOLO가 바운딩 박스에 엄격하게 제한되는 반면, Ultralytics는 정확히 동일한 직관적인 프레임워크 내에서 instance segmentation 및 image classification을 기본적으로 지원합니다. 이전 프로젝트를 유지 관리하는 사용자의 경우, Ultralytics YOLOv8은 여전히 탐색할 가치가 있는 견고하고 널리 배포된 대안입니다.

Link to this section결론#

올바른 비전 아키텍처를 선택하려면 원시적인 이론적 성능과 배포 현실을 비교 평가해야 합니다. EfficientDet은 수학적으로 우아한 스케일링 방식을 제공하며, DAMO-YOLO는 강력한 GPU 추론 속도를 제공합니다. 그러나 신속한 개발, 신뢰할 수 있는 배포 및 최첨단 기능을 우선시하는 팀에게는 Ultralytics models이 단연 앞서 있습니다. NMS-free 추론 및 MuSGD 최적화와 같은 혁신을 결합함으로써 YOLO26은 귀하의 컴퓨터 비전 프로젝트가 오늘날 이용 가능한 가장 유능하고 유지 관리하기 쉬우며 효율적인 기반 위에 구축되도록 보장합니다.

기여자

GLglenn-jocher¹⁴

생성됨 2025년 1월 27일업데이트됨 3주 전

Link to this sectionEfficientDet 대 DAMO-YOLO#

Link to this sectionEfficientDet: 확장 가능하고 효율적인 객체 탐지#

Link to this section아키텍처 혁신#

Link to this section강점 및 약점#

Link to this sectionDAMO-YOLO: 자동화된 아키텍처 탐색의 실제 적용#

Link to this section아키텍처 혁신#

Link to this section강점 및 약점#

Link to this section성능 비교#

Link to this section활용 사례 및 권장 사항#

Link to this sectionEfficientDet을 선택해야 할 때#

Link to this sectionDAMO-YOLO를 선택해야 할 때#

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

Link to this sectionUltralytics의 강점: 레거시 모델을 넘어선 발전#

Link to this section타의 추종을 불허하는 사용 편의성과 생태계#

Link to this sectionYOLO26 혁명#

Link to this section메모리 효율성 및 작업 다양성#

Link to this section결론#

댓글