콘텐츠로 건너뛰기

YOLOv6.0과 EfficientDet: 물체 감지의 속도와 정밀도 균형 맞추기

빠르게 진화하는 컴퓨터 비전 환경에서 올바른 물체 감지 아키텍처를 선택하는 것은 프로젝트의 성공을 위해 매우 중요합니다. 이 비교에서는 시각적 인식 문제를 다른 각도에서 접근하는 두 가지 대표적인 모델인 YOLOv6.0과 EfficientDet에 대해 자세히 살펴봅니다. EfficientDet은 매개변수 효율성과 확장성에 중점을 두는 반면, YOLOv6.0은 추론 지연 시간과 실시간 속도가 타협할 수 없는 산업 애플리케이션을 위해 특별히 설계되었습니다.

성능 지표 및 기술적 분석

이 두 아키텍처의 근본적인 차이점은 설계 철학에 있습니다. EfficientDet은 BiFPN이라는 정교한 기능 융합 메커니즘에 의존하기 때문에 정확도는 향상되지만 GPU의 계산 속도가 저하되는 경우가 많습니다. 반면, YOLOv6.0은 하드웨어 인식 설계를 채택하여 재파라미터화를 활용하여 추론 중 작업을 간소화함으로써 훨씬 더 높은 FPS (초당 프레임 수)를 제공합니다.

아래 표는 이러한 장단점을 보여줍니다. EfficientDet-d7은 높은 mAP 달성하지만 지연 시간이 상당합니다. 반면, YOLOv6.0l은 추론 시간을 대폭 줄이면서 비슷한 정확도를 제공하므로 실시간 추론 시나리오에 훨씬 더 적합합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

성능 최적화

산업용 배포의 경우, YOLOv6.0을 다음과 결합하여 TensorRT 와 결합하면 엄청난 속도 향상을 얻을 수 있습니다. YOLOv6 구조적 단순성 덕분에 이전 모델의 복잡한 피처 피라미드 네트워크에 비해 GPU 하드웨어 명령어에 매우 효율적으로 매핑할 수 있습니다.

YOLOv6.0: 산업용으로 구축

YOLOv6.0은 학술 연구와 산업 요구 사항 사이의 간극을 메우기 위해 설계된 단일 단계 물체 검출기입니다. 품질 검사와 같은 작업에 필요한 정밀도를 희생하지 않으면서 속도를 우선시합니다.

저자: 저자: 추이 리, 룰루 리, 이페이 겅, 홍량 장, 멍 청, 보 장, 자이단 케, 샤오밍 쉬, 샹샹 추
조직:메이투안
날짜: 2023-01-13
아카이브:YOLOv6 v3.0: 본격적인 리로딩
GitHub:YOLOv6
Docs:YOLOv6 문서

아키텍처 및 강점

YOLOv6.0의 핵심은 효율적인 백본과 "RepOpt" 설계입니다. 이 모델은 재파라미터화를 활용하여 학습 시간 다중 분기 구조와 추론 시간 단일 분기 구조를 분리합니다. 그 결과 풍부한 그라데이션으로 훈련하기 쉬우면서도 실행 속도가 매우 빠른 모델이 탄생했습니다.

  • 자가 증류: 이 학습 전략은 모델 자체의 예측이 학습을 안내하는 소프트 레이블 역할을 하는 자가 증류를 사용하여 추가 데이터 없이도 정확도를 높입니다.
  • 양자화 지원: 모델 양자화를 염두에 두고 설계되어 엣지 배포를 위해 INT8로 변환할 때 정확도 저하를 최소화합니다.
  • 산업 포커스: 밀리초 단위의 지연 시간이 중요한 제조 및 로봇 공학 분야의 AI에 이상적입니다.

YOLOv6.0에 대해 자세히 알아보기

EfficientDet: 확장 가능한 정밀도

EfficientDet은 물체 감지에 복합 스케일링 개념을 도입하여 이 분야에 혁신을 일으켰습니다. 네트워크 깊이, 폭, 해상도를 동시에 최적화하여 매개변수당 뛰어난 성능을 달성합니다.

저자: 저자: 탄 밍싱, 팡 루밍, 레 콕
조직:Google
날짜: 2019-11-20
아카이브:EfficientDet: 확장 가능하고 효율적인 객체 탐지
GitHub:google

아키텍처 및 강점

EfficientDet은 EfficientNet 백본에 의존하며 양방향 피처 피라미드 네트워크(BiFPN)를 도입합니다. 이 복잡한 넥 구조를 통해 쉽고 빠르게 멀티스케일 피처를 융합할 수 있습니다.

  • BiFPN: 기존 FPN과 달리 BiFPN은 정보가 하향식 및 상향식으로 흐르도록 하여 다양한 입력 기능에 가중치를 적용하여 그 중요성을 강조할 수 있습니다.
  • 복합 스케일링: 간단한 계수 $\phi$를 사용하면 사용 가능한 리소스에 따라 모델을 확장(d0에서 d7까지)하여 예측 가능한 정확도 계산 곡선을 제공할 수 있습니다.
  • 매개변수 효율성: 더 작은 변형(d0-d2)은 디스크 크기와 FLOPs 측면에서 매우 가볍기 때문에 스토리지 제약이 있는 환경에 유용합니다.

아키텍처 복잡성

BiFPN은 정확도에는 매우 효과적이지만, 불규칙한 메모리 액세스 패턴으로 인해 YOLO 아키텍처에 사용되는 조밀하고 규칙적인 컨볼루션 블록에 비해 GPU에서 속도가 느려질 수 있습니다. 그렇기 때문에 EfficientDet은 종종 더 적은 수의 파라미터에도 불구하고 더 높은 추론 지연 시간을 가진 벤치마크를 수행합니다.

EfficientDet에 대해 자세히 알아보세요.

실제 사용 사례

이러한 모델 간의 선택은 배포 환경의 특정 제약 조건에 따라 달라지는 경우가 많습니다.

YOLOv6.0에 이상적인 시나리오

  • 고속 제조: 모든 품목을 track 위해 높은 FPS가 필요한 빠르게 움직이는 컨베이어 벨트에서 결함을 감지합니다.
  • 자율 내비게이션: 실시간으로 비디오 피드를 처리하여 로봇이 동적인 환경을 탐색할 수 있도록 지원합니다.
  • 엣지 컴퓨팅: 처리량을 위해 GPU 리소스를 최대화해야 하는 NVIDIA Jetson과 같은 장치에 배포합니다.

EfficientDet을 위한 이상적인 시나리오

  • 의료 분석: 정밀도보다 처리 시간이 덜 중요한 엑스레이의 종양 검출과 같은 정적 고해상도 이미지를 분석합니다.
  • 원격 감지: 오프라인에서 위성 이미지를 처리하여 환경 변화나 도시 개발을 파악합니다.
  • 저용량 IoT: 저장 용량이 매우 제한되어 있어 작은 모델 파일 크기가 필요한 장치(예: EfficientDet-d0).

Ultralytics의 장점: YOLO11을 선택해야 하는 이유

YOLOv6.0 및 EfficientDet은 지원 가능한 모델이지만 Ultralytics YOLO11 은 컴퓨터 비전 기술의 최첨단을 대표합니다. YOLO11 이전 YOLO 세대의 장점들을 개선하여 원활하고 사용자 친화적인 에코시스템에 통합했습니다.

YOLO11 주요 이점

  1. 사용 편의성: Ultralytics 개발자 경험을 우선시합니다. Python API를 사용하면 EfficientDet에 필요한 복잡한 구성 파일과 달리 단 몇 줄의 코드만으로 모델을 훈련, 검증 및 배포할 수 있습니다.
  2. 다목적성: 주로 객체 감지 모델인 YOLOv6 및 EfficientDet과 달리 YOLO11 기본적으로 인스턴스 분할, 포즈 추정, 방향성 경계 상자(OBB) 및 분류를 포함한 여러 작업을 지원합니다.
  3. 성능 균형: YOLO11 속도와 정확성 사이에서 최첨단 절충안을 달성합니다. 짧은 지연 시간을 유지하면서 COCO 데이터 세트에서 이전 아키텍처보다 지속적으로 뛰어난 성능을 발휘합니다.
  4. 잘 관리된 에코시스템: 활발한 커뮤니티와 빈번한 업데이트가 Ultralytics 모델을 뒷받침합니다. 광범위한 문서와 튜토리얼에 액세스할 수 있으며, 클라우드 교육 및 데이터 세트 관리를 위해 Ultralytics HUB와 같은 도구와 원활하게 통합할 수 있습니다.
  5. 트레이닝 효율성: YOLO11 훈련 시 리소스 효율을 높이도록 설계되어 복잡한 트랜스포머 기반 모델이나 구형 아키텍처보다 빠르게 수렴하고 GPU 메모리를 덜 필요로 하는 경우가 많습니다.
from ultralytics import YOLO

# Load the YOLO11 model (recommended over older versions)
model = YOLO("yolo11n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

YOLO11에 대해 자세히 알아보세요

다른 모델 살펴보기

컴퓨터 비전 파이프라인에 대한 옵션을 평가하는 경우, Ultralytics 카탈로그에서 다른 모델을 살펴보세요. 컴퓨터 비전 파이프라인의 YOLOv8 은 다양한 작업을 위한 강력한 성능을 제공하며, 트랜스포머 기반의 RT-DETR 은 글로벌 컨텍스트 인식이 필요한 시나리오에 대한 대안을 제공합니다. 모바일 전용 애플리케이션용, YOLOv10 도 검토해 볼 가치가 있습니다. 이를 EfficientDet과 비교하면 특정 하드웨어 및 정확도 요구 사항에 맞게 미세 조정하는 데 도움이 될 수 있습니다.


댓글