콘텐츠로 건너뛰기

YOLOv10 vs YOLO11: 객체 감지를 위한 기술 비교

최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 배포 제약 조건의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 엔드 투 엔드 효율성에 중점을 둔 모델인 YOLOv10과 다재다능함, 성능 및 사용 편의성으로 유명한 Ultralytics의 최신 최첨단 모델인 Ultralytics YOLO11 간의 포괄적인 기술 비교를 제공합니다. 정보에 입각한 선택을 할 수 있도록 아키텍처 차이점, 성능 벤치마크 및 이상적인 애플리케이션을 자세히 살펴보겠습니다.

YOLOv10: 효율성의 한계 돌파

작성자: Ao Wang, Hui Chen, Lihao Liu 외
소속: Tsinghua University
날짜: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
문서: https://docs.ultralytics.com/models/yolov10/

2024년 5월에 발표된 YOLOv10은 실시간 엔드 투 엔드 성능을 우선시하는 객체 감지 모델입니다. 주요 혁신은 기존에 추론 지연 시간을 증가시키는 요인이었던 후처리 과정에서 Non-Maximum Suppression (NMS)을 제거한 것입니다. 이는 일관성 있는 이중 할당이라는 새로운 훈련 전략을 통해 달성됩니다.

아키텍처 및 주요 기능

YOLOv10의 디자인은 효율성과 정확성에 대한 전체적인 접근 방식을 기반으로 합니다. 계산상의 중복성을 줄이고 모델의 성능을 향상시키기 위해 여러 아키텍처 최적화를 도입했습니다. 주요 기능으로는 경량 분류 헤드와 공간-채널 분리 다운샘플링 전략이 있어 정보를 보다 효과적으로 보존합니다. NMS 단계를 제거함으로써 YOLOv10은 배포 파이프라인을 단순화하고 지연 시간을 줄여 진정한 end-to-end 감지기가 되는 것을 목표로 합니다.

강점

  • 향상된 효율성: 특히 리소스가 제한된 환경에서 지연 시간-정확도 및 크기-정확도 절충에서 인상적인 성능을 보여줍니다.
  • NMS-Free 설계: NMS 사후 처리 단계를 제거하면 배포가 간소화되고 엔드 투 엔드 추론 시간이 줄어듭니다.
  • 최첨단 연구: 후처리 병목 현상을 해결하여 실시간 객체 감지에 대한 중요한 학문적 기여를 나타냅니다.

약점

  • 더 새로운 모델: 대학 연구팀의 최신 릴리스이므로, 확고하게 자리 잡은 Ultralytics 생태계에 비해 커뮤니티 규모가 더 작고 타사 통합이 더 적습니다.
  • Task Specialization: YOLOv10은 주로 객체 탐지에 중점을 둡니다. YOLO11의 기본 기능인 세분화, 분류, 포즈 추정과 같은 다른 비전 작업에 대한 기본 제공 다기능성이 부족합니다.
  • 생태계 통합: Ultralytics 프레임워크를 기반으로 구축되었지만 Ultralytics에서 직접 개발하고 유지 관리하는 모델에 비해 포괄적인 MLOps 워크플로에 통합하려면 추가 노력이 필요할 수 있습니다.

이상적인 사용 사례

YOLOv10은 낮은 지연 시간과 계산 효율성이 최우선 순위인 애플리케이션에 특히 적합합니다.

  • Edge AI: NVIDIA Jetson 또는 Raspberry Pi의 휴대폰 및 임베디드 시스템과 같이 컴퓨팅 성능이 제한된 장치에 배포하는 데 이상적입니다.
  • 고속 처리: 자율 드론 및 로봇 공학과 같이 매우 빠른 추론을 요구하는 애플리케이션에 적합합니다.
  • 실시간 분석: 교통 관리와 같이 즉각적인 객체 감지가 필요한 빠르게 변화하는 환경에 적합합니다.

YOLOv10에 대해 자세히 알아보세요

Ultralytics YOLO11: 다재다능함과 성능의 최첨단 기술

작성자: Glenn Jocher, Jing Qiu
기관: Ultralytics
날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11은 Ultralytics의 YOLO 시리즈의 최신 진화로, YOLOv8과 같이 매우 인기 있는 모델의 성공을 기반으로 합니다. 최첨단 정확도와 뛰어난 성능 균형을 제공하도록 설계되었으며 사용 및 통합이 매우 쉽습니다. YOLO11은 단순한 객체 감지기가 아니라 포괄적인 비전 AI 프레임워크입니다.

아키텍처 및 주요 기능

YOLO11은 고급 특징 추출 및 간소화된 네트워크 설계를 갖춘 고도로 최적화된 아키텍처를 특징으로 합니다. 이로 인해 이전 모델에 비해 매개변수 수가 줄어드는 경우가 많으며 정확도가 더 높습니다. YOLO11의 주요 장점은 다재다능함입니다. 객체 감지, 인스턴스 분할, 이미지 분류, 자세 추정 및 OBB(Oriented Bounding Box)를 포함한 광범위한 작업을 기본적으로 지원합니다.

이러한 다재다능함은 잘 관리되는 생태계에서 지원됩니다. Ultralytics는 간단한 Python APICLI, 광범위한 문서와 노코드 학습 및 배포를 위한 Ultralytics HUB와 같은 도구와의 원활한 통합을 통해 간소화된 사용자 경험을 제공합니다. 이 모델은 효율적인 학습 프로세스, 즉시 사용 가능한 사전 학습된 가중치, 활발한 개발 및 강력한 커뮤니티 지원의 이점을 누릴 수 있습니다. 또한 YOLO11 모델은 효율성을 고려하여 설계되었으며, 특히 트랜스포머 기반 모델과 비교하여 학습 및 추론 중에 더 낮은 메모리를 필요로 합니다.

강점

  • 최첨단 성능: 속도와 정확성 간의 뛰어난 균형을 통해 최고 수준의 mAP 점수를 달성합니다.
  • 다재다능한 멀티태스킹: 단일 모델 프레임워크로 감지, 분할, 분류, 포즈 및 OBB를 처리하여 복잡한 프로젝트에 탁월한 유연성을 제공합니다.
  • 사용 편의성: 간단하고 직관적인 API와 포괄적인 문서를 통해 초보자와 전문가 모두가 접근할 수 있습니다.
  • 견고한 생태계: 활발한 개발, 빈번한 업데이트, 강력한 커뮤니티 지원 및 Ultralytics HUB와 같은 MLOps 도구와의 원활한 통합을 통해 이점을 얻을 수 있습니다.
  • 학습 및 배포 효율성: 효율적인 학습 워크플로, 더 낮은 메모리 요구 사항을 제공하며 에지 장치에서 클라우드 서버에 이르기까지 광범위한 하드웨어에 최적화되어 있습니다.

약점

  • 단일 단계 검출기인 YOLO는 일부 특화된 2단계 검출기에 비해 매우 작은 객체에 대한 문제점이 있을 수 있습니다.
  • 더 큰 모델은 정확도가 높지만 훈련 및 배포에 상당한 컴퓨팅 리소스가 필요합니다.

이상적인 사용 사례

YOLO11은 뛰어난 성능, 다재다능성 및 사용 편의성을 결합하여 광범위한 실제 응용 분야에 이상적인 선택입니다.

  • 산업 자동화: 제조업에서 고정밀 품질 관리 및 공정 모니터링에 사용됩니다.
  • 헬스케어: 종양 감지 또는 세포 분할과 같은 작업을 위한 의료 영상 분석.
  • 보안 및 감시: 실시간 위협 감지 및 추적 기능을 갖춘 고급 보안 시스템을 강화합니다.
  • 소매 분석: 재고 관리를 개선하고 고객 행동을 분석합니다.
  • 다중 작업 프로젝트: 첨단 운전자 보조 시스템과 같이 객체 감지, 분할 및 자세 추정을 동시에 요구하는 애플리케이션에 적합합니다.

YOLO11에 대해 자세히 알아보세요

성능 비교: YOLOv10 vs. YOLO11

모델을 직접 비교할 때 뚜렷한 절충점을 관찰할 수 있습니다. YOLOv10 모델, 특히 더 작은 변형은 극도의 효율성을 위해 설계되었으며 종종 더 적은 파라미터와 FLOP를 갖습니다. 따라서 대기 시간에 민감한 작업에 강력한 경쟁자가 됩니다.

그러나 YOLO11은 더욱 강력하고 균형 잡힌 성능 프로필을 보여줍니다. 대부분의 모델 크기에서 약간 더 높은 mAP를 달성하고 CPU와 GPU(T4 TensorRT) 모두에서 훨씬 더 빠른 추론 속도를 보여줍니다. 이러한 뛰어난 속도-정확도 균형은 다중 작업 기능 및 성숙한 생태계와 결합되어 YOLO11을 대부분의 개발 및 배포 시나리오에서 더욱 실용적이고 강력한 선택으로 만듭니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

결론: 어떤 모델을 선택해야 할까요?

YOLOv10과 YOLO11은 모두 객체 감지의 경계를 넓히는 강력한 모델입니다.

YOLOv10은 NMS-free 아키텍처가 뚜렷한 이점을 제공하는 특수화된 지연 시간에 민감한 애플리케이션에 중점을 둔 연구원과 개발자에게 탁월한 선택입니다. 린(lean) 디자인으로 인해 제약이 심한 에지 장치에 배포하는 데 이상적입니다.

하지만 대다수의 개발자, 연구원 및 상업용 애플리케이션의 경우 Ultralytics YOLO11이(가) 권장되는 선택입니다. 정확도에서 약간의 우위와 뛰어난 추론 속도는 전반적으로 더 나은 성능 균형을 제공합니다. 더욱 중요한 것은 여러 비전 작업에서 YOLO11의 탁월한 다재다능성이 사용 편의성 및 강력하고 잘 관리되는 Ultralytics 생태계와 결합되어 개발을 크게 가속화하고 배포를 간소화한다는 것입니다. 활발한 커뮤니티, 광범위한 문서 및 Ultralytics HUB와 같은 도구와의 원활한 통합은 YOLO11을 단순한 모델이 아닌 고급 비전 AI 애플리케이션 구축을 위한 완벽한 솔루션으로 만듭니다.

다른 모델을 탐색하는 경우 YOLOv9 vs YOLO11 또는 YOLOv8 vs YOLO11 간의 비교를 통해 진화를 이해하고 프로젝트에 완벽하게 맞는 모델을 찾을 수 있습니다.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글