YOLOv10 YOLO: 실시간 객체 탐지기의 기술적 비교
현대적인 컴퓨터 비전 파이프라인을 구축할 때, 적절한 실시간 객체 탐지 아키텍처를 선택하는 것이 매우 중요합니다. 이 포괄적인 기술 분석에서는 YOLOv10 과 YOLO 아키텍처, 성능 지표 및 이상적인 사용 사례를 살펴봅니다. 두 모델 모두 객체 탐지 능력에서 상당한 도약을 이루었지만, 목표를 달성하기 위해 서로 다른 아키텍처 경로를 취합니다.
프로젝트가 제한된 에지 AI 하드웨어에 배포해야 하는지, 아니면 클라우드 GPU에서 최대 정확도를 요구하는지에 상관없이, 이러한 아키텍처의 미묘한 차이를 이해하면 정보에 기반한 결정을 내리는 데 도움이 될 것입니다.
YOLOv10 탐구하기
칭화대학교 연구진이 소개한 YOLOv10 는 본질적으로 종단간 접근법을 도입함으로써 YOLO 혁명을 일으켰으며, 후처리 과정에서 비최대 억제(NMS)의 필요성을 효과적으로 제거했습니다.
YOLOv10 :
- 저자: Ao Wang, Hui Chen, Lihao Liu, et al.
- 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: ultralytics
주요 아키텍처 기능
YOLOv10 주요 혁신은 NMS 훈련하기 위한 일관된 이중 할당 ( Consistent Dual Assignments ) 전략입니다. 기존 객체 탐지기는 중복되는 경계 상자를 필터링 NMS 크게 의존하는데, 이는 예측 불가능한 지연 시간을 초래합니다. 이는 자율주행차나 고속 로봇공학과 같은 실시간 애플리케이션의 주요 병목 현상입니다. YOLOv10 객체당 하나의 최적 경계 상자를 직접 예측함으로써 예측 가능하고 초저지연 추론을 YOLOv10 .
또한 본 모델은 전체적 효율성-정확도 중심 설계를 채택합니다. 이 아키텍처는 경량 분류 헤드와 공간-채널 분리 다운샘플링을 포함한 다양한 구성 요소를 최적화하여 계산적 중복을 크게 줄입니다. 그 결과, 경쟁력 있는 평균 정밀도(mAP)를 유지하면서도 더 적은 매개변수 수와 FLOPs를 자랑하는 아키텍처를 구현합니다.
생산용 간소화된 수출
YOLOv10 추론 그래프에서 NMS YOLOv10 때문에, 모델을 ONNX 이나 TensorRT 으로 내보내는 작업이 크게 간소화되어, 특히 엣지 배포에 매우 적합합니다.
사용 예시
YOLOv10 Ultralytics 깊이 YOLOv10 Ultralytics Python 통해 매우 쉽게 사용할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to TensorRT format
model.export(format="engine", half=True)
YOLO 탐구하기
알리바바 그룹이 개발한YOLO 자동화된 신경망 구조 탐색(NAS)을 통해 고효율 네트워크 구조를 발견하는 데YOLO , 속도와 정확도의 파레토 최전선을 확장하는 것을 목표로 합니다.
YOLO 세부 정보:
- 저자: 쉬셴저, 장이치, 천웨이화, 황이룬, 장위안, 쑨시위
- 조직: 알리바바 그룹
- 날짜: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: YOLO
주요 아키텍처 기능
YOLO 산업용 애플리케이션에 맞춤화된 여러 혁신적인 기술을YOLO . 이 모델의 핵심은 다중 목표 진화적 탐색을 통해 생성된 MAE-NAS 백본입니다. 이 자동화된 프로세스는 사전 정의된 계산 예산을 엄격히 준수하는 백본 구조를 발견하여 정확도와 추론 지연 시간 사이의 정교한 균형을 이루도록 합니다.
또한 이 아키텍처는 효율적인 RepGFPN 목 구조를 활용합니다. 이 피라미드형 특징 네트워크는 서로 다른 스케일 간 특징 융합을 개선하도록 설계되었으며, 이는 물체의 크기가 극단적으로 다양한 항공 이미지 분석과 같은 복잡한 작업에 매우 중요합니다. 이를 보완하기 위해YOLO ZeroHead를YOLO . ZeroHead는 최소한의 탐지 헤드로, 최종 예측 레이어의 복잡성을 획기적으로 줄여 추론 과정에서 소중한 계산 시간을 절약합니다.
성능 비교
객체 탐지 아키텍처를 평가할 때 추론 속도, 매개변수 효율성, 탐지 정확도 사이의 적절한 균형을 찾는 것이 가장 중요하다. 아래 표는 YOLOv10 YOLO 각 모델YOLO 성능을 비교한다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
벤치마크에서 확인된 바와 같이, YOLOv10 TensorRT, 특히 나노 변형에서 YOLOv10 탁월한 지연 시간 프로파일을 제공하며,YOLO 유사 모델보다 훨씬 적은 매개변수와 FLOPs를 요구합니다.YOLO 타이니 mAP 강력한 mAP YOLO , YOLOv10 매개변수 효율성과 추론 지연 시간은 제한된 배포 환경에서 뚜렷한 이점을 제공합니다.
사용 사례 및 권장 사항
YOLOv10 YOLO 중 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라YOLO .
10 선택해야 할 때
YOLOv10 다음에 대한 강력한 YOLOv10 :
- NMS 실시간 감지: 비최대 억제(NMS) 없이 종단 간 감지의 이점을 제공하는 애플리케이션으로, 배포 복잡성을 줄입니다.
- 균형 잡힌 속도-정확도 절충점: 다양한 모델 규모에 걸쳐 추론 속도와 탐지 정확도 간의 강력한 균형이 요구되는 프로젝트들.
- 일관된 지연 시간 애플리케이션: 로봇 공학 이나 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.
YOLO 선택해야 할 때
YOLO 다음에 권장YOLO :
- 고처리량 비디오 분석: 고정된 NVIDIA GPU 높은 FPS의 비디오 스트림을 처리하며, 배치 1 처리량이 주요 지표입니다.
- 산업용 제조 라인: 전용 하드웨어에서 엄격한 GPU 제약이 적용되는 시나리오, 예를 들어 조립 라인에서의 실시간 품질 검사.
- 신경망 구조 탐색 연구: 자동화된 구조 탐색(MAE-NAS)과 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향 연구.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
- CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
- 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.
Ultralytics 이점
두 모델 모두 기술적으로 인상적이지만, 생산 환경을 위한 아키텍처 선택은 단순한 지표 이상의 요소를 고려해야 합니다. Ultralytics 기본적으로 지원하는 모델로 구축하면 개발자와 연구자 모두에게 비교할 수 없는 이점을 제공합니다.
사용 편의성과 잘 관리된 생태계
독립형 학술 저장소는 종종 방치되는 반면, Ultralytics 강력하고 지속적으로 관리되는 생태계를 Ultralytics . NAS 파이프라인에 크게 의존하는 모델을 위한 복잡한 환경 구축은 부담스러울 수 있습니다. 반면 Ultralytics 방대한 문서로 뒷받침되는 표준화된 직관적인 Python 강력한 CLI Ultralytics . 이는 맞춤형 비전 솔루션의 출시 기간을 획기적으로 단축시킵니다.
훈련 효율성과 메모리 요구 사항
대규모 모델 훈련은 금방 계산 비용이 많이 들게 됩니다. Ultralytics YOLO 훈련 및 추론 시 낮은 CUDA 사용량으로 역사적으로 알려져 있습니다. 이러한 효율성 덕분에 개발자는 소비자용 하드웨어나 비용 효율적인 클라우드 인스턴스에서 모델을 훈련할 수 있으며, Transformer 기반 모델 작업 시 흔히 발생하는 메모리 부족 오류 없이 작업할 수 있습니다. RT-DETR과 같은 트랜스포머 기반 모델 작업 시 흔히 발생하는 메모리 부족 오류 없이 소비자용 하드웨
실험 추적
Ultralytics 주요 MLOps 도구와 Ultralytics 통합됩니다. 다음 도구와의 통합을 통해 track 훈련 진행 track 손쉽게 track 수 있습니다. Weights & Biases, Comet, 또는 ClearML 를 추가적인 보일러플레이트 코드 없이 사용할 수 있습니다.
작업 전반에 걸친 다양한 활용성
많은 전문 탐지 모델의 주요 한계는 그 초점이 좁다는 점입니다. Ultralytics 내에서 여러분은 단순히 객체 탐지에만 국한되지 않습니다. 해당 도구는 인스턴스 분할, 이미지 분류, 자세 추정, 방향성 바운딩 박스(OBB) 탐지를 포함한 다양한 컴퓨터 비전 작업으로 원활하게 확장됩니다.
앞으로의 전망: YOLO26의 진화
YOLOv10 NMS 추론을 YOLOv10 YOLO NAS의 힘을YOLO , 컴퓨터 비전 분야는 빠르게 진화하고 있습니다. 최첨단 솔루션을 찾는 개발자라면 Ultralytics 확인해 보시길 권합니다.
YOLO11의 정식 후속작으로 출시됨 YOLO11의 정식 후속 모델로 출시된 YOLO26은 YOLOv10 구축한 NMS 없는 기반을 바탕으로 YOLOv10 이를 훨씬 더 발전시켰습니다.
YOLO26의 주요 발전 사항은 다음과 같습니다:
- 최대 43% 빠른 CPU : 에지 컴퓨팅 및 저전력 기기에 특화 최적화.
- DFL 제거: 배포 초점 손실(Distribution Focal Loss) 기능이 제거되어 더 간편한 내보내기와 다양한 배포 대상과의 향상된 호환성을 보장합니다.
- MuSGD 최적화기: SGD 뮤온의 하이브리드로, 컴퓨터 비전 분야에 직접 적용 가능한 고급 LLM 훈련 안정성과 더 빠른 수렴을 제공합니다.
- ProgLoss + STAL: 소규모 물체 인식에서 현저한 향상을 제공하는 획기적으로 개선된 손실 함수로, 농업 및 원격 감지와 같은 사용 사례에 필수적입니다.
새롭게 개편된 Ultralytics 활용하면 개발자는 YOLO26과 같은 차세대 모델을 몇 번의 클릭만으로 손쉽게 주석 처리하고, 훈련시키고, 배포할 수 있어 컴퓨터 비전 파이프라인이 최첨단이면서 미래에도 대비할 수 있도록 보장합니다.