YOLOv10 YOLO: 실시간 객체 탐지기의 기술적 비교
현대적인 컴퓨터 비전 파이프라인을 구축할 때, 적절한 실시간 객체 탐지 아키텍처를 선택하는 것이 매우 중요합니다. 이 포괄적인 기술 분석에서는 YOLOv10 과 YOLO 아키텍처, 성능 지표 및 이상적인 사용 사례를 살펴봅니다. 두 모델 모두 객체 탐지 능력에서 상당한 도약을 이루었지만, 목표를 달성하기 위해 서로 다른 아키텍처 경로를 취합니다.
프로젝트가 제한된 에지 AI 하드웨어에 배포해야 하는지, 아니면 클라우드 GPU에서 최대 정확도를 요구하는지에 상관없이, 이러한 아키텍처의 미묘한 차이를 이해하면 정보에 기반한 결정을 내리는 데 도움이 될 것입니다.
YOLOv10 탐구하기
칭화대학교 연구진이 소개한 YOLOv10 는 본질적으로 종단간 접근법을 도입함으로써 YOLO 혁명을 일으켰으며, 후처리 과정에서 비최대 억제(NMS)의 필요성을 효과적으로 제거했습니다.
YOLOv10 :
- 저자: Ao Wang, Hui Chen, Lihao Liu, et al.
- 기관: 칭화대학교
- 날짜: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 문서: https://docs.ultralytics.com/models/YOLOv10/
주요 아키텍처 기능
YOLOv10 주요 혁신은 NMS 훈련하기 위한 일관된 이중 할당 ( Consistent Dual Assignments ) 전략입니다. 기존 객체 탐지기는 중복되는 경계 상자를 필터링 NMS 크게 의존하는데, 이는 예측 불가능한 지연 시간을 초래합니다. 이는 자율주행차나 고속 로봇공학과 같은 실시간 애플리케이션의 주요 병목 현상입니다. YOLOv10 객체당 하나의 최적 경계 상자를 직접 예측함으로써 예측 가능하고 초저지연 추론을 YOLOv10 .
또한 본 모델은 전체적 효율성-정확도 중심 설계를 채택합니다. 이 아키텍처는 경량 분류 헤드와 공간-채널 분리 다운샘플링을 포함한 다양한 구성 요소를 최적화하여 계산적 중복을 크게 줄입니다. 그 결과, 경쟁력 있는 평균 정밀도(mAP)를 유지하면서도 더 적은 매개변수 수와 FLOPs를 자랑하는 아키텍처를 구현합니다.
생산용 간소화된 수출
YOLOv10은 추론 그래프에서 NMS 연산을 제거하므로, ONNX 또는 TensorRT와 같은 형식으로 모델을 내보내는 것이 크게 단순화되어 엣지 배포에 매우 적합합니다.
사용 예시
YOLOv10 Ultralytics 깊이 YOLOv10 Ultralytics Python 통해 매우 쉽게 사용할 수 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to TensorRT format
model.export(format="engine", half=True)
YOLO 탐구하기
Alibaba Group이 개발한 DAMO-YOLO는 자동화된 신경망 아키텍처 검색(NAS)을 통해 고도로 효율적인 네트워크 구조를 발견하는 데 중점을 두며, 속도와 정확도의 파레토 프론티어를 확장하는 것을 목표로 합니다.
YOLO 세부 정보:
- 저자: 쉬셴저, 장이치, 천웨이화, 황이룬, 장위안, 쑨시위
- 조직: 알리바바 그룹
- 날짜: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: YOLO
주요 아키텍처 기능
DAMO-YOLO는 산업용 애플리케이션에 맞춰진 여러 가지 새로운 기술을 도입합니다. 모델의 기반은 다목적 진화 검색을 통해 생성된 MAE-NAS 백본입니다. 이 자동화된 프로세스는 미리 정의된 계산 예산을 엄격히 준수하는 백본 구조를 발견하여 정확도와 추론 지연 시간 사이의 미묘한 균형을 이룹니다.
또한, 이 아키텍처는 Efficient RepGFPN 넥을 활용합니다. 이 피처 피라미드 네트워크는 다양한 스케일에서 피처 융합을 개선하도록 설계되었으며, 이는 객체 크기가 크게 다른 항공 이미지 분석과 같은 복잡한 작업에 매우 중요합니다. 이를 보완하기 위해 DAMO-YOLO는 최종 예측 레이어의 복잡성을 크게 줄여 추론 시 귀중한 계산 시간을 절약하는 미니멀리스트 detect 헤드인 ZeroHead를 구현합니다.
성능 비교
객체 탐지 아키텍처를 평가할 때 추론 속도, 매개변수 효율성, 탐지 정확도 사이의 적절한 균형을 찾는 것이 가장 중요하다. 아래 표는 YOLOv10 YOLO 각 모델YOLO 성능을 비교한다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
벤치마크에서 볼 수 있듯이, YOLOv10은 TensorRT에서 특히 나노 변형에서 DAMO-YOLO의 유사 모델보다 훨씬 적은 파라미터와 FLOPs를 필요로 하면서 일관되게 뛰어난 지연 시간 프로파일을 제공합니다. DAMO-YOLO가 타이니 변형에서 강력한 mAP를 제공하는 반면, YOLOv10 계열의 파라미터 효율성과 추론 지연 시간은 제약된 배포 환경에서 분명한 이점을 제공합니다.
사용 사례 및 권장 사항
YOLOv10과 DAMO-YOLO 중 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.
10 선택해야 할 때
YOLOv10 다음에 대한 강력한 YOLOv10 :
- NMS-Free 실시간 detect: NMS(Non-Maximum Suppression) 없이 엔드투엔드 detect의 이점을 얻어 배포 복잡성을 줄이는 애플리케이션.
- 균형 잡힌 속도-정확도 절충: 다양한 모델 규모에서 추론 속도와 detect 정확도 사이의 강력한 균형이 필요한 프로젝트.
- 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.
YOLO 선택해야 할 때
DAMO-YOLO는 다음 경우에 권장됩니다.
- 고처리량 비디오 분석: 배치-1 처리량이 주요 지표인 고정 NVIDIA GPU 인프라에서 고FPS 비디오 스트림을 처리합니다.
- 산업 제조 라인: 조립 라인의 실시간 품질 검사와 같이 전용 하드웨어에서 엄격한 GPU 지연 시간 제약이 있는 시나리오.
- 신경망 아키텍처 탐색 연구: 자동화된 아키텍처 탐색(MAE-NAS) 및 효율적인 재매개변수화된 백본이 detect 성능에 미치는 영향 연구.
Ultralytics YOLO26)를 선택해야 할 때
대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:
- NMS-Free 엣지 배포: NMS(Non-Maximum Suppression) 후처리 복잡성 없이 일관되고 낮은 지연 시간의 추론을 요구하는 애플리케이션.
- CPU 전용 환경: 전용 GPU 가속이 없는 장치에서 YOLO26의 최대 43% 더 빠른 CPU 추론이 결정적인 이점을 제공합니다.
- 작은 객체 detect: 항공 드론 이미지 또는 IoT 센서 분석과 같이 ProgLoss 및 STAL이 작은 객체에 대한 정확도를 크게 향상시키는 까다로운 시나리오.
Ultralytics 이점
두 모델 모두 기술적으로 인상적이지만, 생산 환경을 위한 아키텍처 선택은 단순한 지표 이상의 요소를 고려해야 합니다. Ultralytics 기본적으로 지원하는 모델로 구축하면 개발자와 연구자 모두에게 비교할 수 없는 이점을 제공합니다.
사용 편의성 및 잘 관리된 생태계
독립형 학술 저장소는 종종 방치되는 반면, Ultralytics 강력하고 지속적으로 관리되는 생태계를 Ultralytics . NAS 파이프라인에 크게 의존하는 모델을 위한 복잡한 환경 구축은 부담스러울 수 있습니다. 반면 Ultralytics 방대한 문서로 뒷받침되는 표준화된 직관적인 Python 강력한 CLI Ultralytics . 이는 맞춤형 비전 솔루션의 출시 기간을 획기적으로 단축시킵니다.
훈련 효율성과 메모리 요구 사항
대규모 모델 훈련은 금방 계산 비용이 많이 들게 됩니다. Ultralytics YOLO 훈련 및 추론 시 낮은 CUDA 사용량으로 역사적으로 알려져 있습니다. 이러한 효율성 덕분에 개발자는 소비자용 하드웨어나 비용 효율적인 클라우드 인스턴스에서 모델을 훈련할 수 있으며, Transformer 기반 모델 작업 시 흔히 발생하는 메모리 부족 오류 없이 작업할 수 있습니다. RT-DETR과 같은 트랜스포머 기반 모델 작업 시 흔히 발생하는 메모리 부족 오류 없이 소비자용 하드웨
실험 추적
Ultralytics 주요 MLOps 도구와 Ultralytics 통합됩니다. 다음 도구와의 통합을 통해 track 훈련 진행 track 손쉽게 track 수 있습니다. Weights & Biases, Comet, 또는 ClearML 를 추가적인 보일러플레이트 코드 없이 사용할 수 있습니다.
작업 전반에 걸친 다양한 활용성
많은 전문 detect 모델의 중요한 한계는 좁은 초점입니다. Ultralytics 생태계 내에서는 객체 detect에만 국한되지 않습니다. 이 도구들은 인스턴스 segment, 이미지 분류, 자세 추정 및 oriented bounding box (obb) detect를 포함한 여러 컴퓨터 비전 작업으로 원활하게 확장됩니다.
앞으로의 전망: YOLO26의 진화
YOLOv10 NMS 추론을 YOLOv10 YOLO NAS의 힘을YOLO , 컴퓨터 비전 분야는 빠르게 진화하고 있습니다. 최첨단 솔루션을 찾는 개발자라면 Ultralytics 확인해 보시길 권합니다.
YOLO11의 정식 후속작으로 출시됨 YOLO11의 정식 후속 모델로 출시된 YOLO26은 YOLOv10 구축한 NMS 없는 기반을 바탕으로 YOLOv10 이를 훨씬 더 발전시켰습니다.
YOLO26의 주요 발전 사항은 다음과 같습니다:
- 최대 43% 더 빠른 CPU 추론: 엣지 컴퓨팅 및 저전력 장치에 특화하여 최적화되었습니다.
- DFL 제거: Distribution Focal Loss가 제거되어 내보내기가 간소화되고 다양한 배포 대상과의 호환성이 향상되었습니다.
- MuSGD 옵티마이저: SGD와 뮤온의 하이브리드로, 고급 LLM 훈련 안정성과 더 빠른 수렴을 컴퓨터 비전에 직접 도입합니다.
- ProgLoss + STAL: 농업 및 원격 감지와 같은 사용 사례에 필수적인 작은 객체 인식에서 현저한 향상을 제공하는 획기적으로 개선된 손실 함수.
새롭게 개편된 Ultralytics 플랫폼을 활용함으로써 개발자는 몇 번의 클릭만으로 YOLO26과 같은 차세대 모델을 원활하게 주석 달고, 훈련하고, 배포하여 컴퓨터 비전 파이프라인이 최첨단이며 미래에도 유효하도록 보장할 수 있습니다.