콘텐츠로 건너뛰기

YOLOv7 YOLOv10: 실시간 탐지를 위한 아키텍처 비교

물체 탐지 모델의 진화는 지속적으로 더 높은 정확도와 더 낮은 지연 시간을 추구하는 특징을 보여왔다. 이 여정에서 두 가지 중요한 이정표는 YOLOv7(2022년 중반 출시)와 YOLOv10입니다. 두 아키텍처 모두 출시 당시 최첨단 기술을 발전시켰지만, 근본적으로 다른 설계 철학을 보여줍니다. YOLOv7 "bag-of-freebies"를 통해 훈련 과정을 최적화하는 데 YOLOv7 반면, YOLOv10 비최대 억제(NMS)의 필요성을 제거하는 종단간 접근법을 YOLOv10 .

이 가이드는 연구자와 엔지니어가 컴퓨터 비전 프로젝트에 적합한 도구를 선택할 수 있도록 상세한 기술적 비교를 제공합니다. 아키텍처, 성능 지표, 배포 워크플로를 분석하여 YOLOv10같은 최신 버전 및 더 새로운 YOLO26—가 확장 가능한 AI 솔루션에 선호되는 선택지인 이유를 보여줍니다.

모델 성능 비교

아래 표는 두 모델 간의 성능 차이를 보여줍니다. YOLOv10 특히 소형 모델 변종에서 YOLOv7 비해 YOLOv10 더 낮은 지연 시간과 더 높은 효율성(더 적은 매개변수 및 FLOPs)을 제공합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv7: 무료 기능의 집합체, 강력한 성능의 주역

2022년 7월 출시된 YOLOv7 는 추론 비용을 증가시키지 않으면서 훈련 과정을 최적화하기 위해 개발되었습니다. 저자들은 "훈련 가능한 무료 요소 모음(trainable bag-of-freebies)"이라는 개념을 도입했는데, 이는 훈련 중 정확도를 향상시키지만 추론 시에는 버려져 모델의 속도를 유지하는 최적화 방법을 의미합니다.

주요 기술 세부사항:

YOLOv7 확장 효율적 레이어 집계 네트워크(E-ELAN)를 YOLOv7 . 이 아키텍처는 가장 짧고 긴 기울기 경로를 효과적으로 제어함으로써 모델이 더 다양한 특징을 학습할 수 있게 합니다. 또한 깊이와 너비 같은 아키텍처 속성을 동시에 조정하는 모델 스케일링 기법을 적용하여 다양한 크기에서 최적의 성능을 보장합니다. COCO 높은 성능을 보였음에도, YOLOv7 앵커 기반 YOLOv7 , 현대적인 앵커 프리 방식에 비해 하이퍼파라미터 조정이 복잡할 수 YOLOv7 .

7에 대해 자세히 알아보기

YOLOv10: 실시간 엔드투엔드 객체 detect

2024년 5월 칭화대학교 연구진에 의해 공개된 YOLOv10YOLO NMS(Negative Margin Score) 없이도 학습이 가능하도록 하여 YOLO 중대한 전환점을 마련했습니다.

주요 기술 세부사항:

YOLOv10 실시간 탐지에서 오랫동안 지속된 병목 현상인 후처리 단계의 비최대 억제(NMS) 의존성을 YOLOv10 . 일관된 이중 할당 방식을 채택함으로써 YOLOv10 종단간 훈련을 YOLOv10 모델이 최종 예측을 직접 출력할 수 있게 합니다. NMS 제거는 추론 지연 시간을 NMS 줄이고 배포 파이프라인을 단순화하며, 특히 후처리 오버헤드가 큰 엣지 디바이스에서 효과적입니다. 또한 효율성과 정확성을 종합적으로 고려한 모델 설계는 경량 분류 헤드와 공간-채널 분리 다운샘플링 등 다양한 구성 요소를 최적화하여 계산적 중복을 줄입니다.

10에 대해 자세히 알아보기

비평적 비교: 건축과 사용성

두 모델 모두 강력하지만, 아키텍처의 차이로 인해 각각의 이상적인 사용 사례가 결정됩니다.

NMS 대 앵커 기반

가장 큰 차이점은 후처리 요구사항입니다. YOLOv7 중첩된 경계 상자를 필터링하기 NMS (최소 중첩 점수)에 YOLOv7 . 효과적이긴 하지만, NMS 탐지된 객체 수에 비례하여 지연 시간을 NMS 예측 시간이 변동됩니다. 반면 YOLOv10 엔드투엔드 설계는 결정론적 추론 시간을 제공하며, 이는 자율주행차와 같은 안전이 중요한 실시간 애플리케이션에 필수적입니다.

효율성과 자원 사용

YOLOv10 탁월한 효율성을 YOLOv10 . 비교표에서 확인할 수 있듯이, YOLOv10b는 YOLOv7 유사한 정확도를 달성하면서도 매개변수를65% 줄였습니다. 모델 크기의 이 같은 급격한 감소는 메모리 소비량 감소를 의미하며, 이는 YOLOv10 모바일 앱이나 IoT 기기와 같은 메모리 제약 환경에 YOLOv10 적합하게 만듭니다.

메모리 효율성

에지 디바이스를 대상으로 하는 개발자에게 YOLOv10 감소된 매개변수 수는 추론 중 RAM 사용량을 현저히 YOLOv10 . 이를 통해 동일한 하드웨어에서 더 큰 배치 크기 실행이나 다른 AI 모델과의 멀티태스킹이 가능해집니다.

학습 및 생태계

모델을 둘러싼 생태계는 개발자에게의 실용성을 결정합니다. 이 점에서 Ultralytics 빛을 발합니다. 두 모델 모두 Ultralytics Python 통해 접근 가능하며, 이는 사용자 경험을 통합합니다.

  • 사용 편의성: 단일 문자열을 변경하여 모델 간 전환이 가능합니다(예: model = YOLO("yolov10n.pt"))입니다.
  • 통합 모드: Ultralytics 훈련, 검증 및 ONNX, TensorRT, CoreML 같은 형식으로의 내보내기를 위한 명령어를 Ultralytics .
  • 훈련 효율성: Ultralytics 원시 PyTorch 비해 CUDA 사용량을 최소화하도록 최적화되어 있어, 소비자용 GPU에서 더 큰 배치 크기를 지원합니다.
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (swappable with YOLOv7)
model = YOLO("yolov10n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

미래: YOLO26

YOLOv7 YOLOv10 , 이 분야는 빠르게 발전하고 YOLOv10 . 새로 출시된 YOLOv26 (2026년 1월)은 YOLOv10 NMS 기반을 YOLOv10 더 큰 속도와 정확도를 위한 추가 혁신을 도입했습니다.

  • 엔드투엔드 NMS: YOLOv10 마찬가지로 YOLOv26은 기본적으로 엔드투엔드 방식으로, 결정론적 지연 시간을 보장합니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받아 개발된 이 하이브리드 최적화기는 안정적인 훈련과 더 빠른 수렴을 보장합니다.
  • 에지 최적화: 분포 초점 손실(DFL) 제거로 YOLO26은 CPU에서 최대 43% 더 빠른 속도를 보여, 에지 컴퓨팅에 최적의 선택이 됩니다.
  • 다용도성: YOLO26은 OBB, 자세 추정, 분할을 포함한 모든 작업을 지원합니다.

YOLO26에 대해 더 알아보기

결론

YOLOv7 YOLOv10 사이의 선택은 특정 제약 조건에 따라 YOLOv10 .

  • 기존 시스템이 YOLOv7의 특정 아키텍처에 최적화되어 유지 관리 중이거나, 연구 비교를 위해 특정 "bag-of-freebies" 기능이 필요한 경우 YOLOv7 선택하십시오.
  • 새로운 배포 환경에서 낮은 지연 시간과 높은 효율성이 요구될 경우 YOLOv10 선택하십시오. NMS 없는 설계와 축소된 매개변수 수로 인해 실시간 에지 애플리케이션에 이상적입니다.

그러나 속도, 정확도, 사용 편의성의 최적 균형을 위해 최신 YOLO26을 검토할 것을 권장합니다. 강력한 Ultralytics 지원을 받는 이 솔루션은 컴퓨터 비전 개발을 위한 가장 미래 지향적인 선택지입니다.

추가 자료


댓글