YOLOv10 YOLO11: 실시간 객체 감지의 새로운 지평을 열다

올바른 컴퓨터 비전 모델을 선택하는 것은 모든 AI 프로젝트의 성공을 위해 속도, 정확성, 배포 용이성 간의 균형을 맞추는 데 매우 중요합니다. 이 가이드에서는 다음과 같은 두 모델을 자세히 비교합니다. YOLOv10과 NMS 훈련에 초점을 맞춘 학술용 릴리스인 Ultralytics YOLO11와 엔터프라이즈급 성능과 다목적성을 위해 설계된 유명한 YOLO 시리즈의 최신 버전인 울트라트래픽스 YOLO11을 비교합니다.

YOLOv10 지연 시간을 줄이기 위해 흥미로운 아키텍처 개념을 도입했다면, YOLO11 뛰어난 정확도, 광범위한 작업 지원, 데이터 주석부터 모델 배포까지 워크플로우를 간소화하는 강력한 에코시스템으로 최신 기술을 개선했습니다.

YOLOv10: NMS 전문가

YOLOv10 비최대 억제NMS의 필요성을 제거하여 추론 파이프라인을 최적화한다는 특정 목표를 가진 학술 연구에서 탄생했습니다. 이 접근 방식은 특정 엣지 시나리오에서 지연 시간을 줄이는 것을 목표로 합니다.

저자: Ao Wang, Hui Chen, Lihao Liu 외
조직:조직: 칭화 대학교
날짜: 2024-05-23
Arxiv:2405.14458
GitHub:THU-MIG/yolov10
Docs:YOLOv10 문서

아키텍처 및 혁신

YOLOv10 가장 큰 특징은 NMS 필요 NMS 훈련을 위한 일관된 이중 할당 전략입니다. 기존의 YOLO 모델은 하나의 객체에 대해 여러 개의 바운딩 박스를 예측하는 경우가 많아 중복을 필터링하기 위해 NMS 후처리가 필요했습니다. YOLOv10 훈련 손실을 수정하여 모델이 객체당 하나의 최적 박스를 직접 출력하도록 유도합니다. 또한, 전체적 효율성과 정확도 중심의 모델 설계를 채택하여 경량 분류 헤드를 활용하여 FLOP과 매개변수 수를 줄입니다.

강점과 약점

강점:

NMS 추론: 이 모델은 NMS 단계를 제거하여 후처리 대기 시간을 줄임으로써 비매트릭스 작업을 위해 CPU 성능이 제한된 하드웨어에서 유용할 수 있습니다.
매개변수 효율성: 아키텍처는 경량으로 설계되어 상대적으로 적은 수의 매개변수로도 우수한 정확도를 달성할 수 있습니다.

약점:

제한된 범용성: YOLOv10 거의 전적으로 객체 감지에만 초점을 맞추고 있습니다. 인스턴스 분할이나 포즈 추정과 같은 복잡한 작업에 대한 기본 지원이 부족하여 다방면의 AI 애플리케이션에서 활용도가 제한적입니다.
연구 중심 지원: 학술 프로젝트로서 엔터프라이즈 지원 모델과 동일한 수준의 장기 유지 관리, 업데이트 빈도 또는 배포 도구와의 통합을 제공하지 않을 수 있습니다.

이상적인 사용 사례

YOLOv10 특정 임베디드 하드웨어의 엄격한 지연 시간 예산을 충족하기 위해 NMS 단계를 제거하는 것이 중요한 고도로 전문화된 단일 작업 애플리케이션에 가장 적합합니다.

YOLOv10 대해 자세히 알아보기

Ultralytics YOLO11: 다용도성 및 성능의 정점

Ultralytics YOLO11은 YOLOv8 및 YOLOv5의 유산을 기반으로 하는 최첨단 비전 AI를 나타냅니다. 이는 단순한 모델이 아닌 실제 AI 문제에 대한 포괄적인 솔루션으로 설계되었습니다.

저자: Glenn Jocher, Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHub:ultralyticsultralytics
Docs:YOLO11 문서

아키텍처 및 에코시스템

YOLO11 향상된 백본 및 넥 아키텍처로 앵커 프리 감지 메커니즘을 개선하고 특징 추출 효율을 향상시키는 C3k2 및 C2PSA 모듈을 통합했습니다. 경쟁사와 달리 YOLO11 멀티태스크에 강합니다. 단일 프레임워크가 감지, 세분화, 분류, 포즈 추정, OBB(Oriented Bounding Box)를 지원하므로 개발자는 AI 스택을 통합할 수 있습니다.

결정적으로, YOLO11 Ultralytics 에코시스템의 지원을 받습니다. 따라서 데이터 관리를 위한 도구와의 원활한 통합, 다음과 같은 형식으로의 손쉬운 모델 내보내기를 보장합니다. ONNX 및 TensorRT와 같은 형식으로 모델을 쉽게 내보내고, 강력한 커뮤니티 지원을 제공합니다.

주요 이점

뛰어난 성능 균형: YOLO11 지속적으로 더 높은 mAP 점수를 지속적으로 더 높게 달성하는 동시에 뛰어난 추론 속도를 유지하며, GPU의 실제 처리량에서 NMS 사용하지 않는 대안보다 우수한 성능을 발휘하는 경우가 많습니다.
탁월한 다목적성: 스포츠 선수를 track , 의료 이미지를 segment , 항공 뷰에서 회전된 물체를 detect 할 때 YOLO11 하나의 Python API로 이 모든 것을 처리합니다.
사용 편의성: Ultralytics 인터페이스는 단순함으로 유명합니다. 몇 줄의 코드만으로 최첨단 모델을 학습할 수 있어 고급 AI에 대한 액세스를 대중화합니다.
훈련 효율성: 최적화된 훈련 루틴과 고품질의 사전 훈련된 가중치를 통해 더 빠른 컨버전스가 가능하므로 시간과 컴퓨팅 리소스를 절약할 수 있습니다.
메모리 요구 사항 감소: 다음과 같은 트랜스포머 기반 아키텍처에 비해 RT-DETR과 같은 트랜스포머 기반 아키텍처에 비해 YOLO11 트레이닝 시 메모리 효율이 훨씬 더 높기 때문에 더 다양한 하드웨어에서 사용할 수 있습니다.

생태계 혜택

YOLO11 사용하면 실험 추적을 위한 MLFlow 및 OpenVINO 를 포함한 통합 제품군에 액세스할 수 있으므로 프로젝트가 프로토타입에서 프로덕션까지 원활하게 확장될 수 있습니다.

YOLO11에 대해 자세히 알아보세요

성능 비교: 속도, 정확성, 효율성 비교: 속도, 정확성, 효율성

YOLOv10 YOLO11 비교할 때는 매개변수 수를 넘어 실제 성능 메트릭을 살펴보는 것이 필수적입니다. YOLOv10 NMS 제거하여 이론적 복잡성을 줄인 반면, YOLO11 TensorRT 사용하는 T4 GPU 같은 표준 하드웨어 구성에서 뛰어난 추론 속도를 보여줍니다.

데이터에 따르면 대부분의 애플리케이션에서 YOLO11 더 나은 절충안을 제공하는 것으로 나타났습니다. 예를 들어, YOLO11n은 YOLOv10n과 동일한 정확도(39. mAP)를 달성하지만 Ultralytics API가 지원하는 더 강력한 아키텍처를 갖추고 있습니다. 모델 크기가 커질수록 정확도 면에서 YOLO11 장점은 더욱 두드러지며, YOLO11x는 54. mAP 도달하여 탐지 정밀도에 대한 높은 기준을 설정합니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

분석

속도: YOLO11 거의 모든 모델 크기에 걸쳐 GPUTensorRT에서 더 빠른 추론을 제공합니다. 예를 들어, YOLO11l은 6.2ms로 실행되는 반면 YOLOv10l은 8.33ms로 실시간 비디오 분석에 있어 상당한 처리량 이점을 제공합니다.
정확도: YOLO11은 mAP에서 지속적으로 YOLOv10을 능가하여 오탐지 수를 줄이고 더 나은 localization을 보장하며, 이는 자율 탐색 또는 결함 detect와 같은 안전에 중요한 작업에 매우 중요합니다.
계산: YOLOv10 파라미터를 최소화하는 반면, YOLO11 실제 계산 그래프를 최적화하여 더 빠른 실행 시간을 제공함으로써 파라미터 수만으로 속도가 결정되지 않는다는 것을 증명합니다.

실제 애플리케이션 및 코드 예제

모델의 진정한 테스트는 프로덕션 워크플로우에 얼마나 쉽게 통합되는지입니다. YOLO11 간단한 Python 인터페이스로 이 부분에서 탁월합니다. 아래는 사전 학습된 YOLO11 모델을 로드하고 이미지에서 추론을 실행하는 방법의 예시입니다.

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

이 간단한 스니펫을 통해 최첨단 성능에 액세스할 수 있습니다. 동일한 API를 사용하면 사용자 지정 데이터 세트에 대한 학습, 모델 성능 검증 또는 비디오 스트림의 오브젝트 추적으로 손쉽게 전환할 수 있습니다.

결론 결론: 평결

동안 YOLOv10 은 NMS 아키텍처에 대한 혁신적인 시각을 제공하며 학술 연구나 제약이 많은 엣지 시나리오에 적합한 선택입니다, Ultralytics YOLO11 은 대다수의 개발자와 기업에게 탁월한 선택입니다.

더 높은 정확도, 더 빠른 실제 추론 속도, 독보적인 다용도성을 갖춘 YOLO11 최신 컴퓨터 비전을 위한 최고의 솔루션입니다. 개발자는 활발하게 유지 관리되는 Ultralytics 에코시스템의 지원을 통해 단순한 모델이 아니라 AI 여정에서 장기적인 파트너를 확보하여 애플리케이션을 견고하고 확장 가능하며 최첨단 상태로 유지할 수 있습니다.

더 자세히 알아보고 싶은 분들을 위해 다음과 같은 다른 모델과 비교해보십시오. YOLOv9 또는 RT-DETR 과 같은 다른 모델과의 비교는 물체 감지의 진화하는 환경에 대한 추가적인 맥락을 제공할 수 있습니다.