YOLOv10 YOLOv7: 실시간 객체 탐지의 진화
지난 몇 년간 컴퓨터 비전의 급속한 발전은 실시간 애플리케이션을 위한 점점 더 효율적인 아키텍처를 탄생시켰습니다. 비교하면 YOLOv10 와 YOLOv7 을 비교해 보면 이 진화 과정의 중요한 전환기를 확인할 수 있습니다. YOLOv7 매우 효과적인 훈련 전략과 아키텍처 확장성을 YOLOv7 반면, YOLOv10 오랫동안 지속되어 온 비최대 억제(NMS)에 대한 의존성을 제거함으로써 배포 방식을 YOLOv10 .
두 모델 모두 각 출시 당시 객체 detect의 한계를 확장했지만, 현대의 Ultralytics ecosystem과 YOLO26과 같은 차세대 모델의 도입은 오늘날의 AI 실무자들에게 훨씬 우수한 워크플로우를 제공합니다.
모델 프로필 및 기원
이러한 모델들의 기원을 이해하는 것은 그들의 아키텍처 설계 선택과 이를 주도하는 학술 연구에 관한 귀중한 맥락을 제공한다.
YOLOv10
- 저자: Ao Wang, Hui Chen, Lihao Liu, et al.
- 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: YOLOv10: 실시간 종단 간 객체 detect
- GitHub: THU-MIG/yolov10
- 문서: Ultralytics YOLOv10 문서
YOLOv7
- 저자: 왕천야오, 알렉세이 보치코프스키, 리아오홍위안 마크
- 기관: 대만 중앙연구원 정보과학연구원
- 날짜: 2022-07-06
- Arxiv: YOLOv7: 학습 가능한 bag-of-freebies로 새로운 최고 성능 달성
- GitHub: WongKinYiu/yolov7
- 문서: Ultralytics YOLOv7 문서
아키텍처 혁신
YOLOv7
2022년 출시된 YOLOv7 기울기 경로 최적화에 중점을 YOLOv7 . 확장 효율적 레이어 집계 네트워크(E-ELAN)를 도입하여 모델이 원래 기울기 경로를 파괴하지 않으면서 더 다양한 특징을 학습할 수 있게 했습니다. 또한 저자들은 훈련 중 재매개변수화 기법을 활용하는 "훈련 가능한 무료 기능 모음(trainable bag-of-freebies)" 방법론을 구현했는데, 이는 추론 시 제거되어 빠른 실행 속도를 유지할 수 있었습니다. 이러한 인상적인 최적화에도 불구하고, YOLOv7 후처리 NMS YOLOv7 NMS (최소화 중복 교차 점유)에 크게 의존하여 밀집된 장면 분석 시 가변적인 지연 시간을 발생시켰습니다.
YOLOv10
YOLOv10 NMS 현상을 직접 YOLOv10 . 훈련 과정에서 일관된 이중 할당을 도입함으로써 칭화대 연구팀은 NMS 종단간 탐지를 가능하게 했습니다. 이 듀얼 헤드 접근법은 훈련 시 풍부한 감독 신호를 위한 일대다 할당을 수행하는 한 가지 분기와, NMS 추론이 가능한 일대일 할당을 수행하는 다른 분기를 사용합니다. 이러한 아키텍처 전환은 고속 영상 분석에 적합한 일관되고 초저지연 추론을 보장합니다. 또한 YOLOv10 효율성과 정확성을 종합적으로 고려한 모델 설계를 YOLOv10 이전 세대에서 발견된 계산적 중복성을 제거했습니다.
후처리 영향
NMS 제거는 추론 속도를 높일 뿐만 아니라, AI 가속기 및 NPU와 같은 에지 AI 하드웨어에서의 배포를 크게 단순화합니다. 이러한 하드웨어에서는 맞춤형 NMS 컴파일하는 것이 특히 어렵기로 악명 높습니다.
성능 비교
COCO 원시 지표를 비교할 때 세대 간 격차가 뚜렷이 드러난다. YOLOv10 매개변수, 계산 요구사항, 정확도 사이에서 훨씬 더 유리한 절충점을 YOLOv10 .
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
위에서 보듯이, YOLOv10x는 YOLOv7x의 53.1%에 비해 54.4%의 우수한 mAP를 제공하며 약 20% 더 적은 파라미터를 사용합니다. 또한, 경량 YOLOv10 모델(Nano 및 Small)은 탁월한 TensorRT 배포 속도를 제공하여 모바일 배포에 매우 매력적입니다.
Ultralytics 에코시스템의 이점
건축 관련 논문을 연구하는 것도 통찰력을 제공하지만, 현대 컴퓨터 비전 개발은 견고하고 잘 관리되는 프레임워크에 의존합니다. Ultralytics 지원하는 모델을 선택하면 프로토타입에서 생산 환경으로 신속하게 전환하려는 개발자에게 막대한 이점을 제공합니다.
간소화된 개발
YOLOv10과 YOLOv7 모두 표준 Ultralytics python 패키지를 통해 접근할 수 있습니다. 이는 수천 줄의 상용구 코드를 간단하고 직관적인 API로 대체하여 탁월한 사용 편의성을 제공합니다. 또한, Ultralytics YOLO 모델은 무거운 트랜스포머 아키텍처에 비해 학습 중 훨씬 적은 CUDA 메모리를 필요로 하므로, 소비자용 하드웨어에서 더 큰 배치 크기를 사용할 수 있습니다.
탁월한 다용도성
기존 저장소들은 주로 바운딩 박스 탐지에만 집중하는 반면, 통합된 Ultralytics 다양한 작업을 원활하게 지원합니다. 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB) 탐지 등 어떤 작업을 수행하든 워크플로는 동일하게 유지됩니다.
코드 예시: 일관된 학습 워크플로우
다음 코드 스니펫은 데이터 증강과 학습률 스케줄링을 자동으로 처리하는 원활한 훈련 과정을 보여줍니다:
from ultralytics import YOLO
# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")
# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export to ONNX format for rapid deployment
model.export(format="onnx")
사용 사례 및 권장 사항
YOLOv10과 YOLOv7 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
10 선택해야 할 때
YOLOv10 다음에 대한 강력한 YOLOv10 :
- NMS-Free 실시간 detect: NMS(Non-Maximum Suppression) 없이 엔드투엔드 detect의 이점을 얻어 배포 복잡성을 줄이는 애플리케이션.
- 균형 잡힌 속도-정확도 절충: 다양한 모델 규모에서 추론 속도와 detect 정확도 사이의 강력한 균형이 필요한 프로젝트.
- 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.
7 선택해야 할 때
YOLOv7 다음에 권장YOLOv7 :
- 학술적 벤치마킹: 2022년 시대의 최첨단 결과를 재현하거나 E-ELAN 및 훈련 가능한 bag-of-freebies 기술의 효과를 연구합니다.
- 재매개변수화 연구: 계획된 재매개변수화 컨볼루션과 복합 모델 스케일링 전략을 연구합니다.
- 기존 사용자 지정 파이프라인: YOLOv7의 특정 아키텍처를 중심으로 구축되어 쉽게 리팩토링할 수 없는 고도로 사용자 지정된 파이프라인을 가진 프로젝트.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
- 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.
새로운 표준: YOLO26 소개
YOLOv10 2024년에 거대한 YOLOv10 , 컴퓨터 비전 분야는 놀라울 정도로 빠르게 진화하고 YOLOv10 . 모든 신규 개발에는 최신 세대 모델인 Ultralytics 강력히 권장합니다. 2026년 1월 출시된 이 모델은 실시간 비전 AI의 절대적 정점을 보여주며, YOLOv7 YOLOv10 모두 크게 능가합니다.
YOLO26은 현대적 배포 환경을 위해 특별히 설계된 전례 없는 혁신을 제공합니다:
- 종단 간 NMS-Free 설계: YOLOv10이 마련한 기반을 바탕으로, YOLO26은 더 간단한 배포 파이프라인과 일관된 고속 추론을 위해 NMS 후처리를 기본적으로 제거합니다.
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 및 전용 GPU가 없는 장치에 고도로 최적화되어 하드웨어 비용을 대폭 절감합니다.
- DFL 제거: Distribution Focal Loss가 완전히 제거되어 내보내기 로직이 획기적으로 간소화되었고, 저전력 엣지 장치 및 마이크로컨트롤러와의 호환성이 크게 향상되었습니다.
- MuSGD Optimizer: Moonshot AI의 Kimi K2에서 영감을 받은 SGD와 Muon의 이 하이브리드는 대규모 언어 모델(LLM) 훈련 혁신을 컴퓨터 비전에 직접 도입하여 놀랍도록 안정적인 훈련 역학과 더 빠른 수렴을 가능하게 합니다.
- ProgLoss + STAL: 이러한 고급 손실 함수들은 작은 객체 인식에서 상당한 개선을 제공하며, 이는 드론, 로봇 공학 및 스마트 도시 모니터링에 중요한, 역사적으로 어려웠던 영역입니다.
- 작업별 개선 사항: YOLO26은 단순한 detect가 아닙니다. 특화된 Semantic segmentation loss, 초정밀 자세 track을 위한 Residual Log-Likelihood Estimation (RLE), 그리고 OBB 경계 문제를 제거하기 위한 특화된 각도 손실 알고리즘을 포함합니다.
데이터셋 관리 및 훈련
데이터셋 관리, YOLO26 훈련, 클라우드 모델 배포에 있어 최고의 경험을 원하신다면 Ultralytics 살펴보세요. Python 완벽하게 호환되는 노코드 인터페이스를 제공합니다.
실제 사용 사례
적절한 아키텍처 선택은 하드웨어 및 애플리케이션 제약 조건에 크게 좌우됩니다.
YOLOv7 사용 시기
YOLOv7 특정 tensor 깊이 통합된 기존 파이프라인을 유지하거나 2022년 및 2023년 학술 벤치마크를 재현할 때 여전히 신뢰할 수 있는 YOLOv7 . 고급 서버 GPU에서 뛰어난 성능을 발휘합니다.
YOLOv10 언제 사용해야 하는가
YOLOv10 엄격하고 변하지 않는 지연 시간이 요구되는 시나리오에서 YOLOv10 . NMS 않기 때문에, 물체 수가 크게 변동하지만 프레임당 처리 시간은 일정하게 유지되어야 하는 고밀도 군중 계수나 제조 결함 검출에 탁월합니다.
YOLO26을 언제 사용해야 하는가
YOLO26은 모든 신규 프로젝트에 최적의 선택입니다. 기본적인 라즈베리 파이에 정교한 보안 경보 시스템을 구축하는 것부터 대규모 클라우드 기반 영상 분석을 실행하는 데 이르기까지, 뛰어난 CPU 고급 소형 물체 탐지 CPU 이전 세대보다 훨씬 뛰어납니다.
대체 현대 아키텍처를 탐구하고자 하는 개발자를 위해, 저희는 다음과 같은 트랜스포머 기반 검출기에 대한 광범위한 지원도 제공합니다. RT-DETR 와 같은 트랜스포머 기반 검출기 및 Ultralytics YOLO11과 같은 이전 세대 표준 모델에 대해서도 광범위한 지원을 제공합니다.