콘텐츠로 건너뛰기

YOLOv6.0 대 YOLOv7: 실시간 객체 탐지 아키텍처 탐색

실시간 컴퓨터 비전의 진화는 아키텍처 효율성과 훈련 방법론의 급속한 발전으로 특징지어졌다. 이 분야에 중대한 영향을 미친 두 가지 주요 모델은 YOLOv6.0과 YOLOv7입니다. 두 프레임워크 모두 추론 속도와 탐지 정확도 사이의 균형을 맞추기 위한 새로운 기법을 도입했으며, 고급 서버 GPU부터 에지 디바이스에 이르는 다양한 배포 환경을 목표로 합니다.

이 포괄적인 기술 비교는 두 플랫폼의 아키텍처, 성능 지표 및 이상적인 사용 사례를 탐구하는 동시에, 현대적인 Ultralytics 최신 YOLO26 모델이 이러한 기초 개념을 바탕으로 어떻게 구축되어 비교할 수 없는 개발자 경험을 제공하는지 강조합니다.

YOLOv6.0: 산업용 처리량 최적화

메이투안 비전 AI 부서에서 개발한 YOLOv6. YOLOv6 고처리량 산업용 애플리케이션을 위해 특별히 설계되었습니다. 하드웨어 가속기에서의 성능 극대화에 중점을 두어, 전용 GPU를 활용한 배치 처리가 가능한 환경에서 강력한 후보로 꼽힙니다.

  • 저자: 리추이, 리루루, 겅이페이, 장홍량, 첸멍, 장보, 케자이단, 쉬샤오밍, 추샹샹
  • 조직: 메이투안
  • 날짜: 2023-01-13
  • 아카이브: 2301.05586
  • GitHub: YOLOv6

아키텍처 혁신

YOLOv6.YOLOv6 GPU에서 메모리 접근 비용을 최적화하도록 설계된 하드웨어 친화적 아키텍처인 EfficientRep 백본을 기반으로 합니다. 서로 다른 스케일 간 특징 융합을 강화하기 위해, 이 모델은 목 부분에 양방향 연결(BiC) 모듈을 도입했습니다. 이를 통해 네트워크는 이전 버전보다 복잡한 공간적 계층 구조를 더 효과적으로 포착할 수 있습니다.

또한 YOLOv6. YOLOv6 앵커 보조 훈련(AAT) 전략을 구현합니다. 이 접근법은 앵커 기반 훈련의 풍부한 기울기 신호와 앵커 없는 추론의 간소화된 배포 이점을 결합하여, 후처리 속도를 희생하지 않으면서 모델이 보다 안정적으로 수렴하도록 돕습니다.

6에 대해 자세히 알아보기

하드웨어 고려 사항

YOLOv6. YOLOv6 서버급 GPU(예: NVIDIA )에서 탁월한 성능을 보이지만, 특정 구조적 재매개변수에 대한 과도한 의존성으로 인해 최신 아키텍처에 비해 순수 CPU 기반 엣지 디바이스에서 때때로 최적화되지 않은 지연 시간이 발생할 수 있습니다.

YOLOv7: 프리비즈 백의 선구자

중화민국 학술원 연구진이 발표한 YOLOv7 기울기 경로 분석과 추론 비용을 증가시키지 않는 훈련 시간 최적화에 중점을 두는 차별화된 접근법을 YOLOv7 . 연구진은 이를 "훈련 가능한 무료 요소 모음(trainable bag-of-freebies)"이라는 개념으로 명명했다.

  • 저자: 왕천야오, 알렉세이 보치코프스키, 리아오홍위안 마크
  • 기관: 대만 중앙연구원 정보과학연구원
  • 날짜: 2022-07-06
  • 아카이브: 2207.02696
  • GitHub: WongKinYiu/yolov7

아키텍처 혁신

YOLOv7 핵심은 확장 효율적 레이어 집계 네트워크(E-ELAN) YOLOv7 . E-ELAN은 기존 네트워크 토폴로지를 방해하지 않으면서 서로 다른 레이어가 더 다양한 특징을 학습할 수 있도록 하여 기울기 경로를 최적화합니다. 이로 인해 최상위 수준의 평균 정밀도(mAP)를 달성할 수 있는 높은 표현력을 지닌 모델이 구현됩니다.

YOLOv7 모델 재매개변수를 적극 활용하여 추론 시 배치 정규화와 함께 컨볼루션 레이어를 병합합니다. 이는 매개변수 수를 줄이고 NVIDIA와 같은 프레임워크를 사용하여 배포할 때 전파 속도를 높입니다. NVIDIA TensorRT 이나 ONNX와 같은 프레임워크를 사용할 때 전방 전파 속도를 높입니다.

7에 대해 자세히 알아보기

성능 비교

MS COCO 데이터셋에서 이러한 모델들을 평가할 때, 우리는 초경량 YOLOv6 정확도에 중점을 둔 고도로 매개변수화된 YOLOv7 사이에서 뚜렷한 상충관계를 관찰한다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

데이터에 따르면 YOLOv6. YOLOv6 탁월한 추론 속도를 제공하여 고주파수 영상 분석에 적합합니다. 반면 YOLOv7x는 최고 mAP 달성하여, 원시 프레임 속도보다 탐지 정확도가 최우선인 작업에서 우위를 점합니다.

사용 사례 및 권장 사항

YOLOv6 YOLOv7 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLOv7 .

6 선택해야 할 때

YOLOv6 다음과 같은 경우에 강력한 YOLOv6 :

  • 산업용 하드웨어 인식 배포: 모델의 하드웨어 인식 설계와 효율적인 재매개변수화가 특정 대상 하드웨어에서 최적화된 성능을 제공하는 시나리오.
  • 빠른 단일 단계 탐지: 통제된 환경에서 실시간 영상 처리를 GPU 상의 순수 추론 속도를 최우선으로 하는 애플리케이션.
  • 메이투안 생태계 통합: 이미 메이투안의 기술 스택 및 배포 인프라 내에서 작업 중인 팀들.

7 선택해야 할 때

YOLOv7 다음에 권장YOLOv7 :

  • 학술적 벤치마킹: 2022년 당시 최첨단 결과를 재현하거나 E-ELAN 및 훈련 가능한 프리비즈 백(bag-of-freebies) 기법의 효과를 연구하는 것.
  • 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략 탐구
  • 기존 커스텀 파이프라인: YOLOv7 특정 아키텍처를 기반으로 구축된 고도로 커스터마이징된 파이프라인을 보유한 프로젝트로, 쉽게 리팩토링할 수 없습니다.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

Ultralytics : 미래로 나아가는 발걸음

YOLOv6.0과 YOLOv7 중요한 YOLOv7 , 서로 다른 저장소를 생산 파이프라인에 통합하는 것은 모델 배포 및 하이퍼파라미터 튜닝에 종종 어려움을 초래합니다. Ultralytics 간소화된 통합 인터페이스를 제공함으로써 이러한 문제점을 해결합니다.

왜 Ultralytics 선택해야 할까요?

  • 사용 편의성: Ultralytics Python 사용하면 개발자가 몇 줄의 코드만으로 모델을 로드, 훈련 및 내보낼 수 있습니다. 구형 모델에서 최신 아키텍처로 전환하는 데는 단 하나의 문자열만 변경하면 됩니다.
  • 잘 관리된 생태계: Ultralytics 빈번한 업데이트, 활발한 커뮤니티 지원, 그리고 탄탄한 문서를 Ultralytics .
  • 다용도성: 경계 상자에 주로 초점을 맞춘 이전 모델들과 달리, Ultralytics 인스턴스 분할, 자세 추정, 방향성 경계 상자(OBB)를 포함한 다중 작업 학습을 기본적으로 지원합니다.
  • 메모리 요구 사항: Ultralytics YOLO Transformer 기반 아키텍처(예: RT-DETR과 같은 트랜스포머 기반 아키텍처에 비해 훈련 중 더 낮은 메모리 사용량을 유지하여 연구자들이 소비자용 하드웨어에서도 효과적으로 훈련할 수 있도록 합니다.

YOLO26으로 업그레이드

최고의 성능을 추구하는 개발자들을 위해, YOLO26 (2026년 1월 출시)은 객체 탐지의 패러다임을 근본적으로 전환합니다. 완전한 엔드투엔드 NMS( NMS) 설계를 도입하여 복잡한 후처리 로직을 제거하고, 에지 디바이스에서의 지연 시간 편차를 크게 줄입니다.

YOLO26의 주요 혁신은 다음과 같습니다:

  • MuSGD 최적화기: SGD 뮤온의 정교한 하이브리드로, 놀라울 정도로 안정적인 학습 역학과 더 빠른 수렴을 보장합니다.
  • DFL 제거: 분산 초점 손실(Distribution Focal Loss)을 제거함으로써 YOLO26은 내보내기 호환성을 단순화하고 저전력 장치에서의 성능을 향상시킵니다.
  • ProgLoss + STAL: 소형 물체 인식에서 현저한 개선을 가져오는 고급 손실 함수.
  • 타의 추종을 불허하는 속도: 이전 세대 대비 최대 43% 빠른 CPU 구현하여 라즈베리 파이 (Raspberry Pi )나 Apple CoreML 배포와 같은 임베디드 시스템에 완벽합니다.

생태계 내의 다른 고성능 모델로는 YOLO11YOLOv8가 있으며, 두 모델 모두 기존 하드웨어 통합에 탁월한 성능 균형을 제공합니다.

미래에 대비한 파이프라인 구축

Ultralytics 플랫폼에서 컴퓨터 비전 애플리케이션을 구축하면, 데이터셋 로더나 배포 스크립트를 재작성하지 않고도 향후 최신 모델에 즉시 접근할 수 있습니다.

코드 예시: 간소화된 훈련

다음 코드 조각은 Ultralytics 사용하여 최신 YOLOv6 모델을 얼마나 손쉽게 훈련할 수 있는지 보여줍니다. 이 정확한 워크플로는 YOLO11 YOLOv8 완벽하게 적용되며, 기존 저장소에서 일반적으로 요구되는 반복적인 코드를 추상화합니다.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cuda:0",  # Automatically utilizes PyTorch GPU acceleration
)

# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for cross-platform deployment
model.export(format="onnx")

결론

YOLOv6.0과 YOLOv7 실시간 탐지 과제의 다양한 측면을 YOLOv7 해결했습니다. YOLOv6. YOLOv6 산업용 GPU 특화된 강력한 성능을 발휘하는 반면, YOLOv7 엄격한 기울기 경로 최적화를 통해 높은 정확도를 YOLOv7 .

그러나 탁월한 다용도성, 최소한의 배포 마찰, 최첨단 성능을 요구하는 현대적 애플리케이션에는 Ultralytics 확실한 선택지입니다. NMS 아키텍처, 고급 MuSGD 최적화기, Ultralytics 심층적 통합을 통해 개발자는 그 어느 때보다 빠르게 강력하고 확장 가능한 비전 AI 솔루션을 배포할 수 있습니다.


댓글