콘텐츠로 건너뛰기

YOLOv6.0과 YOLOv7: 산업용 속도와 정확도에 대한 심층 분석

최적의 객체 감지 모델을 선택하는 것은 추론 속도, 정확도, 계산 효율성의 균형을 맞추는 데 달려 있는 중요한 결정입니다. 이 기술 비교에서는 산업 중심 프레임워크인 YOLOv6.0과 산업 중심 프레임워크인 YOLOv7의 차이점을 살펴보고, 훈련 가능한 "공짜 가방"을 사용하여 정확도의 한계를 뛰어넘도록 설계된 모델입니다. 개발자는 아키텍처, 벤치마크 및 이상적인 사용 사례를 분석하여 특정 배포 제약 조건에 가장 적합한 솔루션을 결정할 수 있습니다.

YOLOv6.0: 산업 효율성을 위한 설계

YOLOv6-3.0은 실시간 속도와 하드웨어 효율성이 필수적인 산업 응용 분야에 맞게 특별히 조정된 YOLO 시리즈의 중요한 진화를 나타냅니다. Meituan에서 개발한 이 버전은 지연 시간과 정확성 간의 균형을 최적화하는 데 중점을 두어 에지 컴퓨팅 및 높은 처리량 환경에 적합한 선택입니다.

저자: 저자: 추이 리, 루루 리, 이페이 겅, 홍량 장, 멍 청, 보 장, 자이단 케, 샤오밍 쉬, 샹샹 추
조직:메이투안
날짜: 2023-01-13
Arxiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
문서ultralytics

아키텍처 및 주요 기능

YOLOv6.0의 아키텍처는 하드웨어 인식 설계라는 개념을 중심으로 구축되었습니다. 이 아키텍처는 재파라미터화 가능한 백본 (EfficientRep)을 사용하여 모델이 학습 중에는 복잡한 구조를 활용하여 더 나은 기능 학습을 하고 추론 중에는 더 간단하고 빠른 구조로 축소할 수 있도록 합니다. 이 기술은 메모리 액세스 비용을 크게 줄이고 추론 대기 시간을 개선합니다.

주요 아키텍처 혁신은 다음과 같습니다:

  • 양방향 연결(BiC): 이 모듈은 특징 전파를 강화하여 로컬라이제이션 정확도를 향상시킵니다.
  • 앵커 지원 학습 (AAT): 학습을 안정화하고 성능을 향상시키기 위해 앵커 기반 및 앵커 프리 검출기의 이점을 결합한 전략입니다.
  • 자가 증류: YOLOv6.0은 학생 모델이 자체 교사 모델 예측을 통해 학습하는 자가 증류 기술을 활용하여 외부의 대규모 모델 없이도 정확도를 개선합니다.

강점과 약점

YOLOv6.0의 주요 강점은 추론 속도에 있습니다. 벤치마크에서 알 수 있듯이, 더 작은 변형(예: YOLOv6.0n)은 GPU 하드웨어에서 매우 빠르기 때문에 높은 프레임 속도를 처리해야 하는 비디오 분석 파이프라인에 이상적입니다. 또한 모델 정량화를 지원하므로 리소스가 제한된 하드웨어에 쉽게 배포할 수 있습니다.

그러나 이전 버전의 YOLOv6 주로 물체 감지에만 국한되어 있었으며, 세분화나 포즈 추정을 기본적으로 지원하는 보다 포괄적인 프레임워크에서 볼 수 있는 다용도성이 부족했습니다. 또한, 효율성은 높지만 다른 커뮤니티 중심 프로젝트에 비해 생태계 지원이 광범위하지 않았습니다.

이상적인 사용 사례

YOLOv6.0은 다음과 같은 시나리오에서 탁월한 성능을 발휘합니다:

  • 제조 라인: 컨베이어 벨트에서 고속 결함 감지가 필요한 경우.
  • 리테일 분석: 전산 리소스가 제한되어 있는 대기열 관리 및 재고 추적에 적합합니다.
  • 임베디드 시스템: NVIDIA Jetson 시리즈와 같은 장치에 배포합니다.

YOLOv6 대해 자세히 알아보기

YOLOv7: 트레이닝 가능한 공짜 가방 최적화하기

YOLOv7은 추론 비용을 늘리지 않고 정확도를 최대화하기 위해 아키텍처 개선에 중점을 둡니다. 저자들은 "학습 가능한 무료 기술 모음(trainable bag-of-freebies)"을 도입했습니다. 이는 학습 중에 모델의 성능을 향상시키지만 추론 아키텍처나 속도를 변경하지 않는 최적화 방법입니다.

저자들: 저자: 왕치엔야오, 알렉세이 보흐코브스키, 홍위안 마크 리아오
조직:대만 학술원 정보과학연구소
날짜: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics

아키텍처 및 주요 기능

YOLOv7 E-ELAN(확장된 효율적인 계층 집계 네트워크)을 도입했습니다. 이 아키텍처는 모델이 최단 및 최장 경사 경로를 제어하여 네트워크가 효과적으로 수렴하도록 함으로써 보다 다양한 특징을 학습할 수 있도록 합니다.

눈에 띄는 기능은 다음과 같습니다:

  • 모델 스케일링: 깊이 또는 너비만 스케일링하던 이전 방식과 달리, YOLOv7 단순한 크기 조정이 아닌 레이어를 연결하는 복합 스케일링 방식을 제안하여 모델의 최적화 속성을 유지합니다.
  • 보조 헤드 훈련: 모델은 훈련 중에 보조 헤드를 사용하여 리드 헤드를 보조합니다. 이 심층 감독 기법은 중간 계층의 학습을 향상시키지만 속도를 유지하기 위해 추론 중에 제거됩니다.
  • 계획된 재파라미터화된 컨볼루션: 성능 저하를 방지하기 위해 특정 계층에서 ID 연결을 피하는 재매개변수화의 특수한 애플리케이션입니다.

강점과 약점

YOLOv7 COCO 데이터 세트에서 인상적인 평균 정밀도(mAP) 점수를 달성하는 등 높은 정확도로 잘 알려져 있습니다. 실시간 제약 조건과 고충실도 탐지의 필요성 사이의 간극을 효과적으로 메웁니다.

단점은 아키텍처의 복잡성과 보조 헤드의 사용으로 인해 단순한 아키텍처에 비해 트레이닝 프로세스가 메모리 집약적일 수 있다는 점입니다. 추론 단계에서는 효율적이지만, 훈련 단계에서는 특히 더 큰 "E6E" 변형의 경우 상당한 GPU 메모리가 필요합니다.

이상적인 사용 사례

YOLOv7 특히 다음과 같은 경우에 적합합니다:

  • 세부적인 감시: 복잡한 보안 영상에서 작은 물체나 미묘한 동작을 식별합니다.
  • 자율 주행: 안전과 내비게이션에 있어 정밀도가 중요한 분야.
  • 과학 연구: 의료 영상이나 생물학적 조사와 같이 높은 AP 메트릭이 필요한 애플리케이션.

YOLOv7 대해 자세히 알아보기

성능 비교: 메트릭 및 분석

다음 표는 COCO 검증 데이터 세트에서 YOLOv6.0과 YOLOv7 변형의 성능을 비교한 것입니다. 모델 크기, 계산 부하(FLOPs) 및 속도 간의 상충 관계를 강조합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

벤치마크 해석하기

YOLOv7x는 가장 높은 정확도(53.1% mAP)를 달성하지만, 훨씬 더 많은 파라미터(71.3M)와 플롭스(189.9B)가 필요합니다. 반면, YOLOv6.0n은 극한의 속도에 최적화되어 T4 GPU 1.17ms의 추론을 달성하여 정확도는 낮지만 가장 큰 YOLOv7 변형보다 약 10배 더 빠릅니다.

데이터는 명확한 차이를 보여줍니다: 지연 시간이 짧은 환경에서는 YOLOv6.0이 우세한 반면, 최대 탐지 품질이 우선시되고 하드웨어 리소스가 더 풍부한 환경에서는 YOLOv7 더 우수합니다.

Ultralytics 이점: 원시 메트릭 그 이상

YOLOv6 YOLOv7 강력한 기능을 제공하지만, 컴퓨터 비전 환경은 빠르게 진화하고 있습니다. 미래 지향적이고 다재다능하며 사용자 친화적인 솔루션을 찾는 개발자와 연구자를 위한 솔루션입니다, Ultralytics YOLO11YOLOv8 은 원시 벤치마크를 뛰어넘는 강력한 이점을 제공합니다.

사용 편의성 및 에코시스템

고급 AI 모델을 채택하는 데 있어 가장 중요한 장벽 중 하나는 구현의 복잡성입니다. Ultralytics 모델은 간소화된 사용자 경험으로 유명합니다. 사용자는 간단한 Python API와 CLI 사용해 단 몇 줄의 코드만으로 모델을 학습, 검증, 배포할 수 있습니다. 이는 종종 복잡한 환경 설정과 구성 조정이 필요한 연구 중심 리포지토리와는 대조적입니다.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed/accuracy balance)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

작업 전반에 걸친 다양한 활용성

주로 탐지에만 집중했던 이전의 YOLO 버전과 달리, Ultralytics 모델은 기본적으로 멀티모달입니다. 단일 프레임워크가 지원합니다:

성능 균형과 효율성

다음과 같은 Ultralytics 모델 YOLO11과 같은 울트라리틱스 모델은 속도와 정확도 사이에 최적의 균형을 제공하도록 설계되었습니다. 이들은 종종 YOLOv6 같은 효율적인 아키텍처와 관련된 추론 속도를 유지하면서 YOLOv7 더 높은 mAP 달성합니다. 또한, Ultralytics 모델은 훈련 효율성을 위해 설계되어 트랜스포머 기반 모델(예: RT-DETR)에 비해 GPU 메모리 사용량이 적어 실험 주기를 단축하고 클라우드 컴퓨팅 비용을 절감할 수 있습니다.

잘 관리된 에코시스템

Ultralytics 모델을 선택한다는 것은 지원되는 에코시스템을 구매하는 것을 의미합니다. 여기에는 다음이 포함됩니다:

  • 잦은 업데이트: 아키텍처 및 가중치를 정기적으로 개선합니다.
  • 광범위한 내보내기 지원: 다음으로 원활하게 내보내기 ONNX, TensorRT, CoreML 및 TFLite 원활하게 내보내어 모든 기기에 배포할 수 있습니다.
  • 커뮤니티: 방대한 개발자 커뮤니티와 방대한 문서로 언제나 도움을 받을 수 있습니다.

결론

YOLOv6.0과 YOLOv7 모두 컴퓨터 비전 분야에 큰 기여를 해왔습니다. 초고속 추론 및 정량화 지원이 필요한 산업용 애플리케이션에는 YOLOv6.0이 적합합니다. YOLOv7 은 감지 정확도가 가장 중요하고 하드웨어 제약이 유연한 시나리오에서 강력한 경쟁자로 남아 있습니다.

하지만 최첨단 성능과 탁월한 사용 편의성, 다목적성, 배포 유연성을 결합한 종합적인 솔루션이 필요합니다, Ultralytics YOLO11 은 최신 AI 개발을 위한 탁월한 선택입니다. 엣지에 배포하든 클라우드에서 확장하든, Ultralytics 에코시스템은 성공에 필요한 도구를 제공합니다.

더 자세히 알아보려면 YOLOX에 대한 비교를 살펴보거나 다음 기능을 검토해 보세요. RT-DETR 의 기능을 검토해 보세요.


댓글