콘텐츠로 건너뛰기

DAMO-YOLO vs. YOLOv7: 상세 기술 비교

올바른 객체 감지 모델을 선택하는 것은 모든 컴퓨터 비전 프로젝트에서 매우 중요한 단계이며, 성능, 속도 및 배포 가능성에 직접적인 영향을 미칩니다. 이 페이지에서는 2022년에 해당 분야에 크게 기여한 두 가지 강력한 모델인 DAMO-YOLO와 YOLOv7 간의 자세한 기술 비교를 제공합니다. 특정 요구 사항에 맞는 정보에 입각한 결정을 내리는 데 도움이 되도록 아키텍처 차이점, 성능 지표 및 이상적인 사용 사례를 살펴보겠습니다.

DAMO-YOLO: 고급 기술을 사용한 빠르고 정확한 감지

DAMO-YOLO는 최첨단 기술의 조합을 통해 높은 성능을 달성하는 데 중점을 둔 Alibaba Group의 객체 감지 모델입니다. 특히 실제 배포 시나리오에서 속도와 정확도의 뛰어난 균형을 제공하는 것을 목표로 합니다.

아키텍처 및 주요 기능

DAMO-YOLO의 아키텍처는 성능과 효율성을 최적화하도록 설계된 몇 가지 주요 혁신을 기반으로 구축되었습니다.

  • NAS 기반 백본: NAS(Neural Architecture Search)를 활용하여 최적의 백본 네트워크를 생성합니다. 이 자동화된 접근 방식은 수동으로 설계된 네트워크보다 더 나은 속도-정확도 균형을 제공하는 아키텍처를 찾는 데 도움이 됩니다.
  • Efficient RepGFPN Neck: 이 모델은 재파라미터화 기술로 향상된 새로운 Neck 구조인 GFPN(Generalized Feature Pyramid Network)을 도입했습니다. 이 디자인은 다양한 크기의 객체를 감지하는 데 중요한 효율적인 멀티 스케일 특징 융합을 가능하게 합니다.
  • ZeroHead: DAMO-YOLO는 분류 및 회귀 작업을 분리하는 단순화된 제로 파라미터 헤드를 통합합니다. 이를 통해 성능 저하 없이 계산 복잡성과 모델 크기를 줄입니다.
  • AlignedOTA Label Assignment: AlignedOTA라는 고급 레이블 할당 전략을 사용하여 분류 점수와 지역화 정확도 간의 불일치 문제를 해결하여 더욱 정확한 탐지를 가능하게 합니다.

강점과 약점

강점:

  • 높은 추론 속도: 소형 변형(DAMO-YOLO-t/s)은 매우 빠르므로 엣지 AI 장치와 같이 짧은 대기 시간이 필요한 애플리케이션에 이상적입니다.
  • 혁신적인 기술: NAS 및 효율적인 Neck 설계와 같은 최첨단 기술을 통합하여 성능 한계를 뛰어넘습니다.

약점:

  • 생태계 통합: Ultralytics와 같은 프레임워크에서 볼 수 있는 포괄적인 생태계, 광범위한 문서 및 간소화된 사용자 경험이 부족할 수 있습니다.
  • 커뮤니티 지원: 단일 기업의 연구 중심 모델이므로, 더 널리 채택된 모델에 비해 오픈 소스 커뮤니티 규모가 작을 수 있습니다.

DAMO-YOLO에 대해 자세히 알아보세요.

YOLOv7: 실시간 정확도의 한계점을 넘어서다

Chien-Yao Wang 등이 소개한 YOLOv7은 출시 시 실시간 객체 감지기의 새로운 최첨단 기술을 확립했습니다. YOLOv7은 추론 비용을 늘리지 않고 정확도를 향상시키기 위해 훈련 프로세스 최적화에 중점을 두었습니다.

아키텍처 및 주요 기능

YOLOv7은 성능을 크게 향상시킨 여러 아키텍처 및 훈련 개선 사항을 도입했습니다.

  • E-ELAN (Extended Efficient Layer Aggregation Network): 이 고급 네트워크 구조는 원래의 gradient 경로를 방해하지 않으면서 더 다양한 특징을 학습할 수 있도록 하여 모델의 학습 능력을 향상시킵니다.
  • Compound Model Scaling: YOLOv7은 연결 기반 아키텍처에 대해 모델의 깊이와 너비를 적절하게 조정하는 모델 스케일링 전략을 사용하여 다양한 모델 크기에서 최적의 성능을 보장합니다.
  • 학습 가능한 Bag-of-Freebies: YOLOv7의 주요 기여는 추론 중에 계산 오버헤드를 추가하지 않고 최종 모델 정확도를 향상시키는 보조 헤드 및 Coarse-to-Fine Guided Loss와 같은 학습 시간 최적화를 사용한다는 것입니다(추론).

강점과 약점

강점:

  • 뛰어난 정확도-속도 균형: YOLOv7은(는) 높은 mAP와 빠른 추론 속도의 놀라운 조합을 제공하므로 실시간 추론에 매우 적합합니다.
  • 효율적인 훈련: "bag-of-freebies" 접근 방식을 통해 최종 모델의 속도를 늦추지 않고 훈련 프로세스에서 더 높은 정확도를 얻을 수 있습니다.
  • 검증된 성능: MS COCO와 같은 표준 데이터 세트에서 철저히 벤치마킹되었으며 입증된 결과를 제공합니다.

약점:

  • 복잡성: 아키텍처와 학습 전략은 처음부터 이해하고 구현하기에 복잡할 수 있습니다.
  • 제한적인 활용성: YOLOv7은 주로 객체 탐지 모델입니다. 다른 작업에 대한 커뮤니티 버전이 존재하지만, Ultralytics YOLOv8과 같은 프레임워크의 기본 제공 멀티태스크 기능이 부족합니다.
  • 리소스 집약적: 더 큰 YOLOv7 모델을 훈련하려면 상당한 GPU 리소스가 필요할 수 있습니다.

YOLOv7에 대해 자세히 알아보세요

성능 분석: 속도 vs. 정확도

DAMO-YOLO와 YOLOv7을 비교할 때 속도와 정확도 간의 절충이 분명합니다. DAMO-YOLO의 더 작은 모델(예: DAMO-YOLO-t)은 가장 빠른 추론 시간을 제공하므로 리소스가 제한된 하드웨어에서 대기 시간에 민감한 애플리케이션에 가장 적합한 선택입니다. 반면에 YOLOv7, 특히 YOLOv7x 변형은 더 높은 mAP를 달성하여 최대 정확도가 우선 순위인 시나리오에 적합합니다. 두 제품군의 중간 크기 모델인 DAMO-YOLO-l과 YOLOv7-l은 경쟁력 있는 성능을 제공하며, YOLOv7-l은 약간의 대기 시간 증가를 감수하면서 약간 더 높은 mAP를 달성합니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Ultralytics YOLO 모델을 선택해야 하는 이유

DAMO-YOLO와 YOLOv7은 강력한 모델이지만, 개발자와 연구자들은 종종 YOLOv8 및 최신 Ultralytics YOLO11과 같은 모델을 통해 Ultralytics 생태계에서 더 나은 가치를 발견합니다. Ultralytics 모델은 원시 지표를 뛰어넘는 중요한 이점을 제공합니다.

  • 사용 편의성: Ultralytics 모델은 간소화된 Python API 및 간단한 CLI commands를 제공하며, 광범위한 documentation을 통해 모델 학습, 검증 및 배포를 용이하게 합니다.
  • 잘 관리되는 에코시스템: 사용자는 활발한 개발, 강력한 오픈 소스 커뮤니티, 잦은 업데이트, 그리고 엔드 투 엔드 MLOps를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 이점을 얻습니다.
  • 성능 균형: Ultralytics 모델은 속도와 정확성 사이에서 뛰어난 균형을 제공하도록 설계되어 에지 장치에서 클라우드 서버에 이르기까지 광범위한 애플리케이션에 적합합니다.
  • 메모리 효율성: Ultralytics YOLO 모델은 학습 및 추론 중에 효율적인 메모리 사용을 위해 설계되었으며, 다른 아키텍처보다 적은 CUDA 메모리를 필요로 하는 경우가 많습니다.
  • 다재다능함: YOLOv8 및 YOLO11과 같은 모델은 탐지에만 국한되지 않습니다. 인스턴스 분할, 이미지 분류, 자세 추정방향이 지정된 객체 탐지(OBB)를 포함하여 다양한 작업을 즉시 지원하여 다양한 컴퓨터 비전 요구 사항에 대한 통합 솔루션을 제공합니다.
  • 학습 효율성: 효율적인 학습 프로세스, COCO와 같은 데이터 세트에서 즉시 사용 가능한 사전 학습된 가중치, 더 빠른 수렴 시간을 통해 이점을 얻으십시오.

결론

DAMO-YOLO와 YOLOv7은 모두 객체 탐지 분야에서 상당한 발전을 나타냅니다. DAMO-YOLO는 특히 소형 버전에서 추론 속도가 뛰어나 엣지 장치나 짧은 지연 시간을 우선시하는 애플리케이션에 적합합니다. YOLOv7은 가능한 최고의 mAP를 달성하는 것이 중요한 시나리오에 특히 적합하며, 우수한 실시간 성능을 유지하면서 정확도의 경계를 넓힙니다.

그러나 개발자는 Ultralytics 생태계 내의 모델(예: YOLOv8 또는 최신 YOLO11)을 고려할 수도 있습니다. 이러한 모델은 종종 성능, 사용 편의성, 광범위한 문서, 효율적인 훈련, 더 낮은 메모리 요구 사항 및 다재다능함의 뛰어난 균형을 제공합니다. 이는 잘 관리되는 생태계와 Ultralytics HUB를 통한 활발한 커뮤니티 지원을 통해 지원되는 여러 비전 작업에 걸쳐 있습니다.

기타 모델

DAMO-YOLO 및 YOLOv7에 관심 있는 사용자는 다음 모델도 관련이 있을 수 있습니다.

  • Ultralytics YOLOv5: 속도와 쉬운 배포로 알려진 매우 인기 있고 효율적인 모델입니다. YOLOv5 문서 살펴보기.
  • Ultralytics YOLOv8: 감지, 분할, 포즈 및 분류 작업에서 뛰어난 성능을 제공하는 다재다능한 최첨단 모델입니다. YOLOv8 문서 살펴보기.
  • YOLOv9: 정확도 및 효율성 향상을 위해 PGI 및 GELAN과 같은 혁신을 도입했습니다. YOLOv9 문서 보기.
  • YOLOv10: 대기 시간 감소를 위해 NMS-free 엔드 투 엔드 감지에 중점을 둡니다. YOLOv10 vs DAMO-YOLO 비교.
  • Ultralytics YOLO11: 앵커 프리 디자인으로 속도, 효율성 및 사용 편의성을 강조하는 Ultralytics의 최첨단 최신 모델입니다. YOLO11에 대해 자세히 알아보세요.
  • RT-DETR: Transformer 기반 실시간 감지 모델입니다. RT-DETR과 DAMO-YOLO 비교.


📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글