콘텐츠로 건너뛰기

YOLOv7 vs. DAMO-YOLO: 상세 기술 비교

올바른 객체 감지 모델을 선택하는 것은 모든 컴퓨터 비전 프로젝트에서 매우 중요한 단계입니다. 이 결정에는 종종 정확도, 속도 및 계산 비용 간의 절충이 필요합니다. 이 페이지에서는 실시간 객체 감지에 크게 기여한 두 가지 강력한 모델인 YOLOv7과 DAMO-YOLO 간의 자세한 기술 비교를 제공합니다. 특정 요구 사항에 맞는 정보에 입각한 선택을 하는 데 도움이 되도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 살펴보겠습니다.

YOLOv7: 높은 정확도와 속도

YOLOv7은 YOLO 제품군의 주요 발전으로 소개되었으며, 계산 비용 증가 없이 훈련 효율성과 추론 속도를 모두 최적화하여 실시간 객체 검출기의 새로운 표준을 설정했습니다.

작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
소속: Institute of Information Science, Academia Sinica, Taiwan
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/

아키텍처 및 주요 기능

YOLOv7은 최첨단 성능을 달성하기 위해 몇 가지 아키텍처 혁신을 도입했습니다. 핵심 구성 요소는 모델의 백본에 있는 E-ELAN(Extended Efficient Layer Aggregation Network)으로, 그래디언트 경로를 방해하지 않고 다양한 특징을 학습할 수 있도록 네트워크의 능력을 향상시킵니다. 또한, 이 모델은 연결 기반 아키텍처에 맞게 조정된 고급 모델 스케일링 기술을 사용합니다.

가장 중요한 기여 중 하나는 추론 비용을 추가하지 않고도 정확도를 높이는 훈련 전략인 "훈련 가능한 프리비 백" 개념입니다. 여기에는 더 심층적인 감독을 위한 보조 헤드 사용과 coarse-to-fine lead guided training이 포함됩니다. YOLOv7 논문에 자세히 설명된 이러한 기술을 통해 모델은 표준 벤치마크에서 인상적인 결과를 얻을 수 있습니다.

성능 및 사용 사례

YOLOv7은 출시되자마자 속도와 정확성 사이에서 뛰어난 균형을 보여주었습니다. 실시간 비디오 분석, 자율 주행 시스템 및 고해상도 산업 검사와 같이 빠른 감지와 높은 정밀도가 모두 필요한 시나리오에서 뛰어납니다. 예를 들어 스마트 시티 애플리케이션에서 YOLOv7은 고급 교통 관리 또는 보안 시스템에서 즉각적인 위협 감지를 지원하는 데 사용할 수 있습니다.

강점

  • 뛰어난 정확도-속도 균형: mAP와 추론 속도의 강력한 조합을 제공하므로 실시간 작업에 매우 효과적입니다.
  • 효율적인 훈련: 추론 중에 계산 요구 사항을 늘리지 않고 성능을 향상시키기 위해 고급 훈련 전략을 활용합니다.
  • 검증된 성능: MS COCO와 같은 표준 데이터 세트에서 확립되고 잘 문서화된 결과를 제공합니다.

약점

  • 아키텍처 복잡성: E-ELAN과 다양한 학습 기술의 조합은 이해하고 수정하기에 복잡할 수 있습니다.
  • 리소스 집약적 학습: 추론은 빠르지만, 더 큰 YOLOv7 모델을 학습하려면 상당한 GPU 리소스가 필요합니다.
  • 제한적인 다용도성: 주로 객체 감지를 위해 설계되었으며 통합된 멀티태스킹 기능을 갖춘 최신 모델과 달리 다른 작업에 대한 커뮤니티 중심 확장이 있습니다.

YOLOv7에 대해 자세히 알아보세요

DAMO-YOLO: 에지를 위한 속도 및 효율성

Alibaba Group에서 개발한 DAMO-YOLO는 광범위한 하드웨어에서 최적의 성능을 발휘하도록 설계된 객체 감지 모델이며, 특히 에지 장치를 위한 속도와 효율성에 중점을 둡니다.

작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
기관: Alibaba Group
날짜: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444
GitHub: https://github.com/tinyvision/DAMO-YOLO

아키텍처 및 주요 기능

DAMO-YOLO는 뛰어난 속도를 달성하기 위해 여러 새로운 기술을 도입했습니다. NAS(Neural Architecture Search)를 통해 생성된 백본을 활용하여 GiraffeNet이라는 매우 효율적인 특징 추출기를 구현했습니다. 네트워크의 neck은 효율적인 RepGFPN으로, 낮은 계산 비용으로 특징 융합 능력을 균형 있게 유지합니다.

두드러진 특징은 분류 및 회귀에 대한 매개변수가 0개인 단순화된 감지 헤드인 ZeroHead로, 계산 오버헤드를 크게 줄입니다. 또한 DAMO-YOLO는 동적 레이블 할당을 위해 AlignedOTA를 사용하고 지식 증류를 사용하여 더 작은 모델의 성능을 향상시켜 빠르고 정확하게 만듭니다.

성능 및 사용 사례

DAMO-YOLO의 주요 강점은 특히 소형 변형(DAMO-YOLO-T/S)에서 뛰어난 추론 속도입니다. 따라서 모바일 애플리케이션용 온디바이스 처리, 산업 자동화의 실시간 모니터링 및 로보틱스와 같이 짧은 지연 시간이 중요한 요구 사항인 애플리케이션에 적합합니다. 확장성을 통해 개발자는 강력한 클라우드 서버에서 리소스가 제한된 에지 플랫폼에 이르기까지 특정 하드웨어 제약 조건에 맞는 모델을 선택할 수 있습니다.

강점

  • 탁월한 추론 속도: 더 작은 모델은 사용 가능한 가장 빠른 객체 감지기 중 하나이며, 낮은 지연 시간 요구 사항에 이상적입니다.
  • 확장 가능한 아키텍처: 다양한 계산 예산에 적합한 다양한 모델(Tiny, Small, Medium, Large)을 제공합니다.
  • 혁신적인 디자인: NAS 기반 백본, 효율적인 Neck 및 파라미터가 필요 없는 Head와 같은 최첨단 아이디어를 통합합니다.

약점

  • 더 큰 모델의 정확도: 경쟁력이 있지만 가장 큰 DAMO-YOLO 모델은 YOLOv7의 고급 변형의 최고 정확도에 도달하지 못할 수 있습니다.
  • 생태계 및 지원: 연구 중심 프로젝트이므로 상업적 지원을 받는 프레임워크와 동일한 수준의 포괄적인 문서, 커뮤니티 지원 또는 통합 도구를 갖추고 있지 않을 수 있습니다.

GitHub의 DAMO-YOLO

정면 대결 비교: YOLOv7 vs. DAMO-YOLO

이 두 모델을 직접 비교할 때 주요 차이점은 설계 철학에 있습니다. YOLOv7은 mAP를 최대화하기 위해 복잡한 훈련 전략을 활용하여 정확도 측면에서 실시간 감지기에 가능한 것의 경계를 넓힙니다. 대조적으로 DAMO-YOLO는 아키텍처 효율성과 원시 추론 속도를 우선시하여 더 작고 복잡한 모델에 비해 정확도가 몇 점 떨어지는 경우가 많지만 더 작은 모델을 매우 빠르게 만듭니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

Ultralytics YOLO 모델이 더 나은 선택인 이유

YOLOv7과 DAMO-YOLO는 모두 강력한 모델이지만, 더욱 현대적이고 통합되었으며 사용자 친화적인 경험을 추구하는 개발자와 연구자는 Ultralytics YOLOv8 및 최신 Ultralytics YOLO11과 같은 인기 있는 모델을 포함하는 Ultralytics YOLO 생태계를 고려해야 합니다. 이러한 모델은 다음과 같은 몇 가지 주요 이점을 제공합니다.

  • 사용 편의성: Ultralytics 모델은 간단한 Python APICLI를 특징으로 하는 간소화된 사용자 경험을 염두에 두고 설계되었습니다. 이는 광범위한 문서와 수많은 가이드에 의해 지원되므로 쉽게 시작할 수 있습니다.
  • 잘 관리되는 에코시스템: 활발한 개발, 강력한 오픈 소스 커뮤니티, 훈련에서 배포에 이르기까지 엔드 투 엔드 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻으세요.
  • 성능 균형: Ultralytics 모델은 속도와 정확성 사이에서 뛰어난 균형을 달성하여 광범위한 실제 시나리오에 적합합니다.
  • 메모리 효율성: Ultralytics YOLO 모델은 효율적인 메모리 사용을 위해 최적화되어 있으며, 다른 아키텍처에 비해 학습 및 추론에 필요한 CUDA 메모리가 더 적은 경우가 많습니다.
  • 다재다능함: YOLOv8 및 YOLO11과 같은 모델은 단일 통합 프레임워크 내에서 탐지, 분할, 분류, 자세 추정방향이 지정된 객체 탐지(OBB)를 지원하는 진정한 멀티태스킹 솔루션입니다.
  • 학습 효율성: 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치, 더 빠른 수렴 시간을 통해 이점을 얻으십시오.

결론

DAMO-YOLO와 YOLOv7은 모두 객체 탐지 분야에서 상당한 발전을 나타냅니다. DAMO-YOLO는 특히 소형 버전에서 추론 속도가 뛰어나 엣지 장치나 짧은 지연 시간을 우선시하는 애플리케이션에 적합합니다. YOLOv7은 가능한 최고의 mAP를 달성하는 것이 중요한 시나리오에 특히 적합하며, 우수한 실시간 성능을 유지하면서 정확도의 경계를 넓힙니다.

그러나 개발자는 Ultralytics 생태계 내의 모델(예: YOLOv8 또는 최신 YOLO11)을 고려할 수도 있습니다. 이러한 모델은 종종 성능, 사용 편의성, 광범위한 문서, 효율적인 훈련, 더 낮은 메모리 요구 사항 및 다재다능함의 뛰어난 균형을 제공합니다. 이는 잘 관리되는 생태계와 활발한 커뮤니티 지원을 통해 지원되는 여러 비전 작업에 걸쳐 있습니다.

다른 모델 살펴보기

DAMO-YOLO 및 YOLOv7에 관심 있는 사용자는 다음 모델도 관련이 있을 수 있습니다.

  • Ultralytics YOLOv5: 속도와 쉬운 배포로 알려진 매우 인기 있고 효율적인 모델입니다. YOLOv5 문서 살펴보기.
  • Ultralytics YOLOv8: 감지, 분할, 포즈 및 분류 작업에서 뛰어난 성능을 제공하는 다재다능한 최첨단 모델입니다. YOLOv8 문서 살펴보기.
  • YOLOv9: 정확도 및 효율성 향상을 위해 PGI 및 GELAN과 같은 혁신을 도입했습니다. YOLOv9 문서 보기.
  • YOLOv10: 대기 시간 감소를 위해 NMS-free 엔드 투 엔드 감지에 중점을 둡니다. YOLOv10 vs DAMO-YOLO 비교.
  • RT-DETR: Transformer 기반 실시간 감지 모델입니다. RT-DETR과 DAMO-YOLO 비교.


📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글