콘텐츠로 건너뛰기

YOLOv7 YOLO: 자세한 기술 비교

최적의 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 개발에서 추론 지연 시간, 정확도, 컴퓨팅 리소스 할당이라는 상충되는 요구 사항의 균형을 맞추는 중추적인 결정입니다. 이 기술적 분석은 실시간 감지의 한계를 뛰어넘은 2022년 말에 출시된 영향력 있는 두 가지 모델인 YOLOv7 YOLO 대조합니다. 고유한 아키텍처 혁신, 벤치마크 성능, 다양한 배포 시나리오에 대한 적합성을 검토하여 선택 프로세스를 탐색하는 데 도움을 드립니다.

YOLOv7: 실시간 정밀도를 위한 교육 최적화

YOLOv7 아키텍처 효율성과 고급 훈련 전략을 우선시하여 추론 비용을 부풀리지 않고 성능을 향상시키는 데 중점을 두어 YOLO 제품군에서 중요한 진화를 이루었습니다. Scaled-YOLOv4의 원저자가 개발한 이 제품은 네트워크가 훈련 단계에서 보다 효과적으로 학습할 수 있는 방법을 도입했습니다.

저자들: 저자: 왕치엔야오, 알렉세이 보흐코브스키, 홍위안 마크 리아오
조직:대만 학술원 정보과학연구소
날짜: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics

아키텍처 혁신

YOLOv7 핵심은 확장된 효율적인 레이어 집계 네트워크(E-ELAN)입니다. 이 아키텍처를 통해 모델은 최단 및 최장 경사 경로를 제어하여 다양한 특징을 학습할 수 있으며, 기존 경사 흐름을 방해하지 않고 수렴을 개선할 수 있습니다. 또한 YOLOv7 훈련 데이터 처리 중에 적용되는 일련의 최적화 기술인 '훈련 가능한 공짜 가방'을 사용하여 배포 중에 모델의 구조에 영향을 미치지 않습니다. 여기에는 모델 재파라미터화 및 심층 감독을 위한 보조 헤드가 포함되어 있어 백본이 강력한 특징을 포착할 수 있도록 합니다.

사은품 가방

'공짜 가방'이라는 용어는 정확도를 높이기 위해 훈련 복잡도를 높이되 실시간 추론 중에 비용이 전혀 발생하지 않는 방법을 의미합니다. 이 철학은 최종적으로 내보낸 모델이 경량으로 유지되도록 보장합니다.

강점과 약점

YOLOv7 MS COCO 벤치마크에서 뛰어난 밸런스를 자랑하며, 크기 대비 높은 평균 정밀도(mAP) 를 제공합니다. 정밀도가 가장 중요한 고해상도 작업에서 강점을 발휘합니다. 하지만 아키텍처가 복잡하기 때문에 맞춤형 연구를 위해 수정하기가 어려울 수 있습니다. 또한 추론은 효율적이지만 트레이닝 프로세스는 리소스 집약적이며 최신 아키텍처에 비해 상당한 GPU 메모리를 필요로 합니다.

YOLOv7 대해 자세히 알아보기

YOLO: 엣지를 위한 신경 아키텍처 검색

알리바바의 연구팀에서 개발한 YOLO 신경망 아키텍처 검색(NAS) 을 활용하여 지연 시간이 짧은 환경에 맞는 효율적인 네트워크 구조를 자동으로 발견하는 다른 접근 방식을 취하고 있습니다.

저자 저자: Xianzhe Xu, 이치 장, 웨이화 첸, 일룬 황, 위안 장, 시우위 선
조직:알리바바 그룹
날짜: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444
GitHubYOLO

아키텍처 혁신

YOLO 특정 지연 시간 제약 조건에서 처리량을 극대화하는 GiraffeNet이라는 백본을 생성하는 방법인 MAE-NAS를 도입했습니다. 이를 보완하는 제로헤드는 분류와 회귀 작업을 분리하는 동시에 무거운 파라미터를 제거하여 모델 크기를 크게 줄여주는 경량 탐지 헤드입니다. 또한 이 아키텍처는 다중 규모 특징 융합을 위해 효율적인 목인 RepGFPN(일반화된 특징 피라미드 네트워크)을 활용하고 라벨 할당을 위해 AlignedOTA를 사용하여 분류 점수를 로컬라이제이션 정확도와 정렬합니다.

강점과 약점

YOLO 엣지 AI 시나리오에서 탁월한 성능을 발휘합니다. 소형 버전(Tiny/Small)은 인상적인 속도를 제공하므로 모바일 장치 및 IoT 애플리케이션에 적합합니다. NAS를 사용하면 아키텍처가 수학적으로 최적화되어 효율성을 보장합니다. 반대로, 가장 큰 YOLO 모델은 때때로 순수 정확도 면에서 최상위 계층의 YOLOv7 모델에 뒤처지기도 합니다. 또한 연구 중심 프로젝트로서 광범위한 프레임워크에서 볼 수 있는 광범위한 에코시스템과 도구 지원이 부족합니다.

DAMO-YOLO에 대해 자세히 알아보세요.

성능 지표 비교

다음 표는 성능 트레이드오프를 강조하고 있습니다. YOLOv7 일반적으로 더 높은 정확도mAP를 달성하는 대신 계산 복잡성(FLOPs)이 높아지는 반면, YOLO 특히 소규모 구성에서 속도와 매개변수 효율을 우선시합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

실제 응용 분야

이러한 모델 중에서 선택하는 것은 배포 하드웨어와 필요한 특정 컴퓨터 비전 작업에 따라 달라집니다.

  • 하이엔드 보안 및 분석(YOLOv7): 보안 경보 시스템이나 세부적인 트래픽 관리와 같이 정확도 1퍼센트 포인트가 중요한 강력한 서버에서 실행되는 애플리케이션의 경우 YOLOv7 유력한 후보입니다. 미세한 디테일까지 식별할 수 있어 고해상도 비디오 스트림에서 작은 물체를 감지하는 데 적합합니다.
  • 엣지 디바이스 및 로보틱스(YOLO): 자율 로봇이나 모바일 앱과 같이 지연 시간 예산이 엄격한 시나리오에서는 YOLO 경량 아키텍처가 빛을 발합니다. 매개변수 수가 적기 때문에 메모리 대역폭에 대한 부담을 줄여주며, 이는 물체 감지를 수행하는 배터리 구동식 디바이스에 매우 중요합니다.

Ultralytics 이점: 왜 현대화해야 할까요?

YOLOv7 YOLO 충분히 가능한 모델이지만, AI의 환경은 빠르게 발전하고 있습니다. 미래 지향적이고 효율적이며 사용자 친화적인 솔루션을 찾는 개발자와 연구자는 특히 다음과 같은 Ultralytics 에코시스템을 고려해야 합니다. YOLO11. 최신 Ultralytics 모델로 업그레이드하면 몇 가지 뚜렷한 이점을 얻을 수 있습니다:

1. 간소화된 사용 편의성

Ultralytics 모델은 개발자 경험을 우선시합니다. 복잡한 환경 설정과 수동 스크립트 실행이 필요한 리서치 리포지토리와 달리, Ultralytics 통합된 Python API와 CLI 제공합니다. 단 몇 줄의 코드만으로 모델을 훈련, 검증 및 배포할 수 있습니다.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

2. 포괄적인 활용성

YOLOv7 YOLO 주로 바운딩 박스 감지를 위해 설계되었습니다. 반면, YOLO11 동일한 프레임워크 내에서 인스턴스 분할, 포즈 추정, 방향성 물체 감지(OBB), 이미지 분류 등 다양한 작업을 기본적으로 지원합니다. 따라서 라이브러리를 전환하지 않고도 스포츠에서 사람의 자세를분석하는 것과 같은 복잡한 문제를 해결할 수 있습니다.

3. 뛰어난 성능과 효율성

YOLO11 다년간의 연구개발을 바탕으로 계산 오버헤드를 크게 줄이면서 최첨단 정확도를 제공합니다. 앵커가 필요 없는 탐지 헤드와 최적화된 백엔드 작업을 채택하여 이전 YOLO 버전이나 다음과 같은 트랜스포머 기반 모델에 비해 트레이닝과 추론 과정에서 메모리 사용량이 더 적습니다. RT-DETR. 이러한 효율성은 클라우드 컴퓨팅 비용 절감과 엣지 하드웨어에서의 빠른 처리로 이어집니다.

4. 강력한 에코시스템 및 지원

Ultralytics 모델을 채택하면 잘 관리되는 번성하는 에코시스템에 연결됩니다. 잦은 업데이트, 방대한 문서, 활발한 커뮤니티 채널을 통해 지원되지 않는 코드를 디버깅할 필요가 없습니다. 또한, Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 모델을 쉽게 배포하고 데이터 세트를 관리할 수 있습니다.

YOLO11에 대해 자세히 알아보세요

결론

YOLOv7 YOLO 모두 2022년 물체 감지 분야에 크게 기여했습니다. YOLOv7 학습 가능한 최적화 기법으로 정확도를 높일 수 있는 방법을 보여주었고, YOLO 효율적인 에지 지원 모델을 생성하기 위한 신경망 아키텍처 검색의 힘을 보여주었습니다.

하지만 오늘날의 프로덕션 환경에서는 그렇지 않습니다, YOLO11 는 비전 AI 기술의 정점을 보여줍니다. YOLO 속도, YOLOv7 정밀도, Ultralytics 프레임워크의 탁월한 사용성을 결합한 YOLO11 개발 주기를 가속화하고 애플리케이션 성능을 개선하는 다용도 솔루션을 제공합니다. 스마트 시티 인프라를 구축하든 제조 품질 관리를 최적화하든, Ultralytics 모델은 성공에 필요한 신뢰성과 효율성을 제공합니다.

다른 모델 살펴보기

컴퓨터 비전 환경에서 다른 옵션을 탐색하는 데 관심이 있다면 다음 모델을 고려해 보세요:

  • Ultralytics YOLOv8: 견고하고 업계에서 폭넓게 채택된 것으로 알려진 YOLO11 이전 버전입니다.
  • YOLOv10: 지연 시간을 줄이기 위해 NMS 훈련에 중점을 둔 실시간 검출기입니다.
  • YOLOv9: 딥 네트워크에서 정보 손실을 줄이기 위해 프로그래머블 그라데이션 정보(PGI)를 도입합니다.
  • RT-DETR: 높은 정확도를 제공하지만 일반적으로 더 많은 GPU 메모리를 필요로 하는 트랜스포머 기반 검출기입니다.
  • YOLOv6: 산업용 애플리케이션에 최적화된 또 다른 효율성 중심 모델입니다.

댓글