콘텐츠로 건너뛰기

YOLOv10 YOLOv7: 실시간 객체 탐지의 진화

지난 몇 년간 컴퓨터 비전의 급속한 발전은 실시간 애플리케이션을 위한 점점 더 효율적인 아키텍처를 탄생시켰습니다. 비교하면 YOLOv10YOLOv7 을 비교해 보면 이 진화 과정의 중요한 전환기를 확인할 수 있습니다. YOLOv7 매우 효과적인 훈련 전략과 아키텍처 확장성을 YOLOv7 반면, YOLOv10 오랫동안 지속되어 온 비최대 억제(NMS)에 대한 의존성을 제거함으로써 배포 방식을 YOLOv10 .

두 모델 모두 출시 당시 객체 탐지의 한계를 뛰어넘었으나, 현대적인 Ultralytics YOLO26과 같은 차세대 모델의 도입은 오늘날의 AI 실무자들에게 훨씬 우수한 작업 흐름을 제공합니다.

모델 프로필 및 기원

이러한 모델들의 기원을 이해하는 것은 그들의 아키텍처 설계 선택과 이를 주도하는 학술 연구에 관한 귀중한 맥락을 제공한다.

YOLOv10

10에 대해 자세히 알아보기

YOLOv7

7에 대해 자세히 알아보기

아키텍처 혁신

YOLOv7

2022년 출시된 YOLOv7 기울기 경로 최적화에 중점을 YOLOv7 . 확장 효율적 레이어 집계 네트워크(E-ELAN)를 도입하여 모델이 원래 기울기 경로를 파괴하지 않으면서 더 다양한 특징을 학습할 수 있게 했습니다. 또한 저자들은 훈련 중 재매개변수화 기법을 활용하는 "훈련 가능한 무료 기능 모음(trainable bag-of-freebies)" 방법론을 구현했는데, 이는 추론 시 제거되어 빠른 실행 속도를 유지할 수 있었습니다. 이러한 인상적인 최적화에도 불구하고, YOLOv7 후처리 NMS YOLOv7 NMS (최소화 중복 교차 점유)에 크게 의존하여 밀집된 장면 분석 시 가변적인 지연 시간을 발생시켰습니다.

YOLOv10

YOLOv10 NMS 현상을 직접 YOLOv10 . 훈련 과정에서 일관된 이중 할당을 도입함으로써 칭화대 연구팀은 NMS 종단간 탐지를 가능하게 했습니다. 이 듀얼 헤드 접근법은 훈련 시 풍부한 감독 신호를 위한 일대다 할당을 수행하는 한 가지 분기와, NMS 추론이 가능한 일대일 할당을 수행하는 다른 분기를 사용합니다. 이러한 아키텍처 전환은 고속 영상 분석에 적합한 일관되고 초저지연 추론을 보장합니다. 또한 YOLOv10 효율성과 정확성을 종합적으로 고려한 모델 설계를 YOLOv10 이전 세대에서 발견된 계산적 중복성을 제거했습니다.

후처리 영향

NMS 제거는 추론 속도를 높일 뿐만 아니라, AI 가속기 및 NPU와 같은 에지 AI 하드웨어에서의 배포를 크게 단순화합니다. 이러한 하드웨어에서는 맞춤형 NMS 컴파일하는 것이 특히 어렵기로 악명 높습니다.

성능 비교

COCO 원시 지표를 비교할 때 세대 간 격차가 뚜렷이 드러난다. YOLOv10 매개변수, 계산 요구사항, 정확도 사이에서 훨씬 더 유리한 절충점을 YOLOv10 .

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

위에서 볼 수 있듯이, YOLOv10x는 YOLOv7x의 53.1% 대비 54. mAP 우수한 mAP 제공하면서도 약 20% 적은 매개변수를 사용합니다. 또한 경량화된 YOLOv10 (Nano 및 Small)은 탁월한 TensorRT 속도를 제공하여 모바일 배포에 매우 매력적입니다.

Ultralytics 에코시스템의 이점

건축 관련 논문을 연구하는 것도 통찰력을 제공하지만, 현대 컴퓨터 비전 개발은 견고하고 잘 관리되는 프레임워크에 의존합니다. Ultralytics 지원하는 모델을 선택하면 프로토타입에서 생산 환경으로 신속하게 전환하려는 개발자에게 막대한 이점을 제공합니다.

간소화된 개발

YOLOv10 YOLOv7 YOLOv10 표준 Ultralytics Python 통해 접근할 YOLOv7 . 이는 수천 줄에 달하는 반복적인 코드를 간단하고 직관적인 API로 대체하여 비교할 수 없는 사용 편의성을 제공합니다. 또한 Ultralytics YOLO 훈련 시 중량급 트랜스포머 아키텍처에 비해 CUDA 사용량이 현저히 낮아, 소비자용 하드웨어에서도 더 큰 배치 크기를 사용할 수 있게 합니다.

탁월한 다용도성

기존 저장소들은 주로 바운딩 박스 탐지에만 집중하는 반면, 통합된 Ultralytics 다양한 작업을 원활하게 지원합니다. 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB) 탐지 등 어떤 작업을 수행하든 워크플로는 동일하게 유지됩니다.

코드 예시: 일관된 훈련 워크플로

다음 코드 스니펫은 데이터 증강과 학습률 스케줄링을 자동으로 처리하는 원활한 훈련 과정을 보여줍니다:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

사용 사례 및 권장 사항

YOLOv10 YOLOv7 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLOv7 .

10 선택해야 할 때

YOLOv10 다음에 대한 강력한 YOLOv10 :

  • NMS 실시간 감지: 비최대 억제(NMS) 없이 종단 간 감지의 이점을 제공하는 애플리케이션으로, 배포 복잡성을 줄입니다.
  • 균형 잡힌 속도-정확도 절충점: 다양한 모델 규모에 걸쳐 추론 속도와 탐지 정확도 간의 강력한 균형이 요구되는 프로젝트들.
  • 일관된 지연 시간 애플리케이션: 로봇 공학 이나 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.

7 선택해야 할 때

YOLOv7 다음에 권장YOLOv7 :

  • 학술적 벤치마킹: 2022년 당시 최첨단 결과를 재현하거나 E-ELAN 및 훈련 가능한 프리비즈 백(bag-of-freebies) 기법의 효과를 연구하는 것.
  • 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략 탐구
  • 기존 커스텀 파이프라인: YOLOv7 특정 아키텍처를 기반으로 구축된 고도로 커스터마이징된 파이프라인을 보유한 프로젝트로, 쉽게 리팩토링할 수 없습니다.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

새로운 표준: YOLO26 소개

YOLOv10 2024년에 거대한 YOLOv10 , 컴퓨터 비전 분야는 놀라울 정도로 빠르게 진화하고 YOLOv10 . 모든 신규 개발에는 최신 세대 모델인 Ultralytics 강력히 권장합니다. 2026년 1월 출시된 이 모델은 실시간 비전 AI의 절대적 정점을 보여주며, YOLOv7 YOLOv10 모두 크게 능가합니다.

YOLO26에 대해 더 알아보기

YOLO26은 현대적 배포 환경을 위해 특별히 설계된 전례 없는 혁신을 제공합니다:

  • 엔드투엔드 NMS 설계: YOLOv10 마련한 기반 위에 구축된 YOLOv26은 NMS 단계를 원천적으로 제거하여 더 간소화된 배포 파이프라인과 일관된 고속 추론을 실현합니다.
  • 최대 43% 빠른 CPU : 에지 컴퓨팅 및 전용 GPU가 없는 기기를 위해 극도로 최적화되어 하드웨어 비용을 대폭 절감합니다.
  • DFL 제거: 분포 초점 손실(Distribution Focal Loss)이 완전히 제거되어 내보내기 로직이 획기적으로 단순화되었으며, 저전력 에지 장치 및 마이크로컨트롤러와의 호환성이 크게 향상되었습니다.
  • MuSGD 최적화기: Moonshot AI의 Kimi K2에서 영감을 받은 이 SGD 하이브리드 방식은 대규모 언어 모델(LLM) 훈련 혁신을 컴퓨터 비전 분야에 직접 도입하여 놀라울 정도로 안정적인 훈련 역학과 더 빠른 수렴을 실현합니다.
  • ProgLoss + STAL: 이 고급 손실 함수들은 드론, 로봇공학, 스마트 시티 모니터링에 핵심적이면서도 역사적으로 어려운 분야인 소형 물체 인식에서 현저한 개선을 제공합니다.
  • 특정 작업 개선 사항: YOLO26은 단순한 탐지기가 아닙니다. 초정밀 자세 추적을 위한 잔차 로그 가능도 추정(RLE)과 OBB 경계 문제를 제거하는 특수 각도 손실 알고리즘을 포함하며, 세분화된 의미적 분할 손실도 적용합니다.

데이터셋 관리 및 훈련

데이터셋 관리, YOLO26 훈련, 클라우드 모델 배포에 있어 최고의 경험을 원하신다면 Ultralytics 살펴보세요. Python 완벽하게 호환되는 노코드 인터페이스를 제공합니다.

실제 사용 사례

적절한 아키텍처 선택은 하드웨어 및 애플리케이션 제약 조건에 크게 좌우됩니다.

YOLOv7 사용 시기

YOLOv7 특정 tensor 깊이 통합된 기존 파이프라인을 유지하거나 2022년 및 2023년 학술 벤치마크를 재현할 때 여전히 신뢰할 수 있는 YOLOv7 . 고급 서버 GPU에서 뛰어난 성능을 발휘합니다.

YOLOv10 언제 사용해야 하는가

YOLOv10 엄격하고 변하지 않는 지연 시간이 요구되는 시나리오에서 YOLOv10 . NMS 않기 때문에, 물체 수가 크게 변동하지만 프레임당 처리 시간은 일정하게 유지되어야 하는 고밀도 군중 계수나 제조 결함 검출에 탁월합니다.

YOLO26을 언제 사용해야 하는가

YOLO26은 모든 신규 프로젝트에 최적의 선택입니다. 기본적인 라즈베리 파이에 정교한 보안 경보 시스템을 구축하는 것부터 대규모 클라우드 기반 영상 분석을 실행하는 데 이르기까지, 뛰어난 CPU 고급 소형 물체 탐지 CPU 이전 세대보다 훨씬 뛰어납니다.

대체 현대 아키텍처를 탐구하고자 하는 개발자를 위해, 저희는 다음과 같은 트랜스포머 기반 검출기에 대한 광범위한 지원도 제공합니다. RT-DETR 와 같은 트랜스포머 기반 검출기 및 Ultralytics YOLO11과 같은 이전 세대 표준 모델에 대해서도 광범위한 지원을 제공합니다.


댓글