Link to this sectionYOLOv10 대 YOLOv7#
지난 몇 년간 컴퓨터 비전 분야의 급격한 발전으로 실시간 애플리케이션을 위한 더욱 효율적인 아키텍처들이 등장했습니다. YOLOv10과 YOLOv7을 비교하면 이러한 진화의 결정적인 전환기를 확인할 수 있습니다. YOLOv7이 매우 효과적인 학습 전략과 아키텍처 스케일링을 도입했다면, YOLOv10은 오랫동안 사용되어 온 Non-Maximum Suppression(NMS)에 대한 의존성을 제거하여 배포 방식을 혁신했습니다.
두 모델 모두 출시 당시 객체 탐지의 한계를 확장했지만, 오늘날의 현대적인 Ultralytics 에코시스템과 YOLO26과 같은 차세대 모델의 등장은 현대 AI 실무자들에게 훨씬 더 우수한 워크플로를 제공합니다.
Link to this section모델 프로필 및 기원#
이들 모델의 기원을 이해하면 아키텍처 설계 선택과 이를 뒷받침하는 학술 연구에 대한 유용한 맥락을 파악할 수 있습니다.
Link to this sectionYOLOv10 세부 정보#
- 저자: Ao Wang, Hui Chen, Lihao Liu 외
- 소속 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: YOLOv10: 실시간 엔드투엔드 객체 탐지
- GitHub: THU-MIG/yolov10
- 문서: Ultralytics YOLOv10 문서
Link to this sectionYOLOv7 세부 정보#
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 소속: 대만 중앙연구원 정보과학연구소
- 날짜: 2022-07-06
- Arxiv: YOLOv7: 학습 가능한 bag-of-freebies로 새로운 SOTA 달성
- GitHub: WongKinYiu/yolov7
- 문서: Ultralytics YOLOv7 문서
Link to this section아키텍처 혁신#
Link to this sectionYOLOv7 접근 방식#
2022년에 출시된 YOLOv7은 그래디언트 경로 최적화에 중점을 두었습니다. 이 모델은 E-ELAN(Extended Efficient Layer Aggregation Network)을 도입하여, 원래의 그래디언트 경로를 훼손하지 않으면서 더 다양한 특징을 학습할 수 있게 했습니다. 또한 저자들은 "학습 가능한 bag-of-freebies" 방법론을 구현하여, 학습 중에는 재매개변수화(re-parameterization) 기법을 활용하고 추론 시에는 이를 융합(fuse)하여 빠른 실행 속도를 유지하도록 했습니다. 이러한 인상적인 최적화에도 불구하고 YOLOv7은 여전히 후처리 단계에서 NMS에 크게 의존하여 밀집된 장면 분석 시 가변적인 지연 시간을 발생시켰습니다.
Link to this sectionYOLOv10의 혁신#
YOLOv10은 NMS 병목 현상을 직접 해결했습니다. 칭화대학교 연구팀은 학습 과정에서 일관된 듀얼 할당(dual assignments)을 도입하여 NMS가 필요 없는 엔드투엔드 탐지를 가능하게 했습니다. 이 듀얼 헤드 접근 방식은 학습 중 풍부한 감독 신호를 위해 일대다(one-to-many) 할당을 사용하는 브랜치와, NMS 없는 추론을 위해 일대일(one-to-one) 할당을 사용하는 또 다른 브랜치를 사용합니다. 이러한 아키텍처 전환은 고속 비디오 분석에 적합한 일관된 초저 추론 지연 시간을 보장합니다. 또한 YOLOv10은 전체적인 효율성과 정확도를 중심으로 한 모델 설계를 채택하여 이전 세대에 존재하던 계산상의 중복성을 제거했습니다.
NMS 후처리를 제거하면 추론 속도가 빨라질 뿐만 아니라, 맞춤형 NMS 연산을 컴파일하기 어려운 AI 가속기나 NPU와 같은 엣지 AI 하드웨어에서의 배포가 크게 간소화됩니다.
Link to this section성능 비교#
MS COCO 데이터셋에서 원시 메트릭을 비교하면 세대 차이가 분명하게 드러납니다. YOLOv10은 매개변수, 계산 요구 사항, 정확도 사이에서 훨씬 유리한 균형을 달성합니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
위에서 볼 수 있듯이, YOLOv10x는 YOLOv7x의 53.1%보다 우수한 54.4%의 mAP를 제공하면서도 매개변수는 약 20% 더 적게 사용합니다. 또한 가벼운 YOLOv10 모델(Nano 및 Small)은 탁월한 TensorRT 배포 속도를 제공하여 모바일 배포에 매우 매력적입니다.
Link to this sectionUltralytics 생태계의 이점#
아키텍처 논문을 공부하는 것도 통찰력을 주지만, 현대 컴퓨터 비전 개발은 견고하고 잘 관리된 프레임워크에 의존합니다. Ultralytics 지원 모델을 선택하면 프로토타입에서 프로덕션으로 빠르게 전환하려는 개발자에게 엄청난 이점을 제공합니다.
Link to this section효율적인 개발 환경#
YOLOv10과 YOLOv7 모두 표준 Ultralytics Python 패키지를 통해 액세스할 수 있습니다. 이는 수천 줄의 상용구 코드를 간단하고 직관적인 API로 대체하여 독보적인 사용 편의성을 제공합니다. 또한 Ultralytics YOLO 모델은 무거운 Transformer 아키텍처와 비교하여 학습 중 훨씬 낮은 CUDA 메모리를 요구하므로 소비자 등급 하드웨어에서도 더 큰 배치 크기를 사용할 수 있습니다.
Link to this section비교할 수 없는 범용성#
기존 리포지토리는 종종 경계 상자(BBox) 탐지에만 엄격하게 집중하는 반면, 통합된 Ultralytics 프레임워크는 방대한 종류의 작업을 원활하게 지원합니다. 인스턴스 분할, 자세 추정 또는 지향 경계 상자(OBB) 탐지 중 무엇을 수행하든 워크플로는 동일하게 유지됩니다.
Link to this section코드 예시: 일관된 학습 워크플로#
다음 코드 스니펫은 데이터 증강과 학습률 스케줄링을 자동으로 처리하는 원활한 학습 프로세스를 보여줍니다:
from ultralytics import YOLO
# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")
# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export to ONNX format for rapid deployment
model.export(format="onnx")Link to this section활용 사례 및 권장 사항#
YOLOv10과 YOLOv7 중 하나를 선택하는 것은 특정 프로젝트 요구 사항, 배포 제약 조건 및 에코시스템 선호도에 따라 달라집니다.
Link to this sectionYOLOv10을 선택해야 할 때#
YOLOv10은 다음 용도에 강력한 선택지입니다:
- NMS 없는 실시간 탐지: Non-Maximum Suppression 없이 엔드 투 엔드 탐지를 수행하여 배포 복잡성을 줄이는 애플리케이션.
- 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 스케일 전반에서 추론 속도와 탐지 정확도 사이의 강력한 균형이 필요한 프로젝트.
- 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.
Link to this sectionYOLOv7을 선택해야 하는 경우#
YOLOv7은 다음 상황에 권장됩니다:
- 학술 벤치마킹: 2022년 시대의 최첨단 결과를 재현하거나 E-ELAN 및 학습 가능한 bag-of-freebies 기술의 효과를 연구할 때.
- 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략을 조사할 때.
- 기존 사용자 정의 파이프라인: 쉽게 리팩토링할 수 없는 YOLOv7의 특정 아키텍처를 중심으로 구축된 고도로 사용자 정의된 파이프라인을 가진 프로젝트.
Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#
대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:
- NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
- 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.
Link to this section새로운 표준: YOLO26 소개#
YOLOv10이 2024년에 큰 도약을 이루었지만, 컴퓨터 비전 환경은 매우 빠르게 변화합니다. 모든 새로운 개발에는 최신 세대 모델인 Ultralytics YOLO26을 강력히 권장합니다. 2026년 1월에 출시된 이 모델은 실시간 비전 AI의 절대적인 정점을 나타내며, YOLOv7과 YOLOv10을 모두 크게 뛰어넘습니다.
YOLO26은 현대적인 배포 환경을 위해 특별히 설계된 전례 없는 혁신을 가져옵니다:
- 엔드투엔드 NMS-Free 설계: YOLOv10이 마련한 기반을 바탕으로, YOLO26은 더 단순한 배포 파이프라인과 일관된 고속 추론을 위해 NMS 후처리를 기본적으로 제거합니다.
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 및 전용 GPU가 없는 장치에 최적화되어 하드웨어 비용을 크게 절감합니다.
- DFL 제거: Distribution Focal Loss가 완전히 제거되어 내보내기 로직을 근본적으로 단순화하고, 저전력 엣지 장치 및 마이크로컨트롤러와의 호환성을 크게 향상시킵니다.
- MuSGD 옵티마이저: Moonshot AI의 Kimi K2에서 영감을 받은 이 SGD와 Muon의 하이브리드는 대규모 언어 모델(LLM) 학습의 혁신을 컴퓨터 비전에 직접 도입하여, 매우 안정적인 학습 역학(dynamics)과 더 빠른 수렴을 제공합니다.
- ProgLoss + STAL: 이러한 고급 손실 함수들은 드론, 로봇 공학 및 스마트 시티 모니터링에 필수적인 소형 객체 인식 영역에서 주목할 만한 개선을 제공합니다.
- 작업별 개선 사항: YOLO26은 단순한 탐지기가 아닙니다. 여기에는 특수 시맨틱 분할 손실, 초정밀 자세 추적을 위한 RLE(Residual Log-Likelihood Estimation), OBB 경계 문제를 제거하기 위한 특수 각도 손실 알고리즘이 포함되어 있습니다.
데이터셋 관리, YOLO26 학습 및 클라우드 배포에 있어 최고의 경험을 원하신다면 Ultralytics 플랫폼을 확인해 보십시오. Python SDK를 완벽하게 보완하는 노코드 인터페이스를 제공합니다.
Link to this section실제 활용 사례#
적절한 아키텍처 선택은 사용자의 하드웨어 및 애플리케이션 제약 조건에 따라 크게 달라집니다.
Link to this sectionYOLOv7을 사용해야 하는 경우#
YOLOv7은 특정 텐서 구조와 이미 깊게 통합된 레거시 파이프라인을 유지하거나 2022년 및 2023년의 학술 벤치마크를 재현해야 할 때 신뢰할 수 있는 선택으로 남아 있습니다. 고성능 서버 GPU에서 훌륭한 성능을 발휘합니다.
Link to this sectionYOLOv10을 사용해야 하는 경우#
YOLOv10은 엄격하고 변하지 않는 지연 시간이 필요한 시나리오에서 빛을 발합니다. NMS-free 모델이기 때문에 객체 수가 급격히 변하지만 프레임당 처리 시간이 일정하게 유지되어야 하는 고밀도 군중 계수 또는 제조 결함 탐지에 매우 적합합니다.
Link to this sectionYOLO26을 사용해야 할 때#
YOLO26은 모든 신규 프로젝트를 위한 확실한 선택입니다. 기본적인 Raspberry Pi에서의 정교한 보안 경보 시스템 배포부터 대규모 클라우드 기반 비디오 분석 실행에 이르기까지, 뛰어난 CPU 속도와 고급 소형 객체 탐지 기능 덕분에 이전 세대보다 훨씬 우수합니다.
대안적인 현대 아키텍처를 탐색하는 데 관심이 있는 개발자를 위해, RT-DETR과 같은 Transformer 기반 탐지기와 이전 세대의 핵심 모델인 Ultralytics YOLO11에 대한 광범위한 지원도 제공합니다.