YOLO11 YOLOv8: 아키텍처의 진화 및 성능 분석
최적의 컴퓨터 비전 모델을 선택하는 것은 정확성, 속도, 리소스 효율성 사이에서 균형을 잡으려는 개발자와 연구자에게 매우 중요한 결정입니다. 이 페이지에서는 다음 간의 포괄적인 기술 비교를 제공합니다. Ultralytics YOLO11 와 Ultralytics YOLOv8은 물체 감지 및 고급 비전 작업을 위해 설계된 업계 최고의 아키텍처입니다. 이러한 아키텍처의 혁신, 벤치마크 지표, 이상적인 배포 시나리오를 분석하여 귀사의 인공 지능 애플리케이션에 가장 적합한 것을 결정하는 데 도움을 드립니다.
Ultralytics YOLO11
저자 저자: Glenn Jocher, Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11
YOLO11 특징 추출과 처리 효율을 크게 개선한 유명한 YOLO 시리즈의 최신 버전입니다. 백본과 넥 아키텍처를 개선함으로써 YOLO11 이전 버전보다 더 적은 수의 파라미터를 사용하면서도 더 높은 평균 정밀도(mAP) 를 달성합니다. 기본적으로 인스턴스 분할, 이미지 분류, 포즈 추정, 방향성 바운딩 박스(OBB) 등 광범위한 작업을 지원합니다.
아키텍처 및 주요 기능
YOLO11 아키텍처는 CSP(Cross Stage Partial) 병목현상의 최적화된 버전인 C3k2 블록과 C2PSA (공간적 주의가 포함된 크로스 스테이지 파트) 모듈을 도입했습니다. 이러한 구성 요소는 계산 오버헤드를 최소화하면서 복잡한 시각적 패턴과 공간 관계를 캡처하는 모델의 능력을 향상시킵니다. 이러한 설계 철학 덕분에 YOLO11 특히 컴퓨팅 리소스가 제한된 엣지 디바이스에서 실시간 추론 시나리오에서 탁월한 성능을 발휘합니다.
강점
- 최첨단 정확도: 모든 모델 규모에서 뛰어난 탐지 성능을 제공하며, COCO 데이터 세트에 대한 이전 반복 작업을 지속적으로 능가합니다.
- CPU 효율성: 최적화된 아키텍처 선택으로 CPU에서 추론 속도가 훨씬 빨라져 서버리스 또는 엣지 배포에 가장 적합한 선택입니다.
- 파라미터 효율성: 더 적은 수의 파라미터와 플롭으로 높은 정확도를 달성하여 모델 스토리지 요구 사항을 줄입니다.
- 통합 프레임워크: 사용하기 쉬운 단일 API 내에서 여러 비전 작업을 원활하게 처리합니다.
약점
- 생태계 성숙도: 최신 릴리스에서는 타사 튜토리얼과 커뮤니티 제작 콘텐츠의 양이 빠르게 증가하고 있지만, 기존 YOLOv8 비해서는 그 규모가 작을 수 있습니다.
- 대규모 모델을 위한 리소스 집약도: 효율적이기는 하지만, 가장 큰 변형(예: YOLO11x)은 여전히 훈련 및 고처리량 추론에 상당한 GPU 리소스를 필요로 합니다.
사용 사례
YOLO11 최고의 속도 대비 정확도가 요구되는 애플리케이션을 위한 최고의 선택입니다:
- 엣지 AI: NVIDIA Jetson 또는 라즈베리 파이 디바이스에 고성능 탐지 배포.
- 실시간 로보틱스: 지연 시간을 최소화하면서 자율 탐색 및 개체 상호 작용을 지원합니다.
- 의료 영상: 정확성이 가장 중요한 진단을 위한 정밀한 의료 이미지 분석을 지원합니다.
Ultralytics YOLOv8
저자 저자: 글렌 조처, 아유시 차우라시아, 징 치우
조직:Ultralytics
날짜: 2023-01-10
GitHubultralytics
Docsyolov8
2023년 초에 출시된 YOLOv8 실시간 물체 감지의 표준을 재정의했습니다. 앵커가 필요 없는 감지 헤드와 C2f 백본 모듈을 도입하여 앵커 기반 접근 방식에서 크게 벗어났습니다. YOLOv8 안정성과 다용도성, 이를 중심으로 발전한 대규모 에코시스템으로 유명하며 전 세계적으로 가장 널리 채택된 비전 모델 중 하나입니다.
아키텍처 및 주요 기능
YOLOv8 더 풍부한 그라데이션 흐름을 허용하는 C2f 모듈을 통합한 CSPDarknet53 백본의 수정된 버전을 사용합니다. 앵커가 없는 설계로 비최대 억제(NMS) 프로세스를 간소화하고 앵커 박스와 관련된 하이퍼파라미터 튜닝의 복잡성을 줄였습니다. 이 모델은 확장성이 뛰어나 다양한 계산 예산에 맞게 나노(n)에서 초대형(x)까지 다양한 변형을 제공합니다.
강점
- 검증된 안정성: 전 세계 프로덕션 환경에서 광범위하게 테스트되어 높은 안정성을 보장합니다.
- 풍부한 에코시스템: 수천 개의 튜토리얼, 통합 및 커뮤니티 프로젝트에서 지원됩니다.
- 다목적성: YOLO11 마찬가지로 감지, 세분화, 분류, 포즈 추정 기능을 지원합니다.
- 강력한 베이스라인: 많은 비 YOLO 아키텍처를 능가하는 경쟁력 있는 성능을 지속적으로 제공합니다.
약점
- 성능 격차: 일반적으로 정확도mAP와 추론 속도 모두에서, 특히 CPU 하드웨어에서 YOLO11 앞섰습니다.
- 더 높은 계산 비용: YOLO11 비슷한 정확도를 달성하려면 약간 더 많은 파라미터와 FLOP이 필요합니다.
사용 사례
YOLOv8 여전히 훌륭한 옵션입니다:
- 레거시 시스템: 최첨단 성능보다 안정성이 요구되는 YOLOv8 워크플로와 이미 통합된 프로젝트.
- 교육 도구: 방대한 문서와 커뮤니티 예제가 포함된 모델을 사용하여 컴퓨터 비전 개념을 학습합니다.
- 범용 탐지: 표준 보안 및 모니터링 애플리케이션을 위한 안정적인 성능.
정면 성능 비교
이 두 모델의 가장 큰 차이점은 효율성에 있습니다. YOLO11 YOLOv8비해 "파레토 개선"을 달성하여 더 낮은 계산 비용으로 더 높은 정확도를 YOLOv8.
효율성 및 속도 분석
YOLO11 아키텍처 최적화(C3k2, C2PSA)를 통해 보다 세분화된 기능을 유지하면서 이미지를 더 빠르게 처리할 수 있습니다. 이는 CPU 추론에서 가장 분명하게 드러나는데, YOLO11 모델은 상당한 속도 향상을 보여줍니다. 예를 들어, YOLO11n 모델은 YOLOv8n CPU 약 30% 더 빠르면서도 더 높은 mAP 달성합니다.
GPU 추론 측면에서도 YOLO11 모델은 대부분의 크기에서 지연 시간이 짧아 실시간 비디오 처리 파이프라인에 매우 효과적입니다.
메모리 효율성
Ultralytics YOLO11 YOLOv8 모두 다음과 같은 트랜스포머 기반 모델에 비해 훈련 및 추론 중 메모리 소비가 적도록 설계되었습니다. RT-DETR. 따라서 CUDA 메모리가 제한된 소비자급 하드웨어 또는 클라우드 환경을 사용하는 개발자가 훨씬 더 쉽게 액세스할 수 있습니다.
비교 메트릭
아래 표는 성능 향상을 보여줍니다. mAP 증가와 함께 YOLO11 파라미터와 FLOP이 감소한 것을 확인할 수 있습니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Ultralytics 에코시스템의 이점
Ultralytics 모델을 선택한다는 것은 전체 MLOps 수명 주기를 간소화하도록 설계된 포괄적인 에코시스템에 액세스할 수 있다는 의미입니다.
- 사용 편의성: 두 모델 모두 동일한 Python API 및 명령줄 인터페이스CLI. YOLOv8 YOLO11 전환하려면 코드 문자열에서 한 글자만 변경해야 하는 경우가 많습니다(예:,
"yolov8n.pt"에서"yolo11n.pt")입니다. - 훈련 효율성: Ultralytics 모델은 모자이크 증강 및 하이퍼파라미터 진화를 포함한 고급 훈련 루틴을 활용합니다. 사전 학습된 가중치를 쉽게 사용할 수 있으므로 사용자 지정 데이터 세트에 대한 효율적인 전이 학습이 가능합니다.
- 다목적성: 특정 작업에 국한된 많은 경쟁사와 달리, Ultralytics 모델은 통합 패키지 내에서 감지, 세분화, 분류, 포즈 및 OBB를 기본적으로 지원합니다.
- 배포: 다음과 같은 형식으로 모델을 쉽게 내보내기 ONNX, TensorRT, CoreML 및 OpenVINO 같은 형식으로 모델을 쉽게 내보내 다양한 하드웨어에 최적화하여 배포할 수 있습니다.
통합 사용 예시
공유 API 설계를 통해 손쉽게 실험할 수 있습니다. 두 모델을 사용하여 예측을 로드하고 실행하는 방법은 다음과 같습니다:
from ultralytics import YOLO
# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt") # or "yolov8n.pt"
# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
결론: 어떤 모델을 선택해야 할까요?
대부분의 신규 프로젝트에는 YOLO11 권장됩니다. 아키텍처의 발전으로 정확성과 속도 면에서 확실한 이점을 제공하며, 특히 효율성이 중요한 엣지 컴퓨팅 애플리케이션에 적합합니다. 또한 매개변수 수가 줄어들어 모바일 배포에 필요한 스토리지 요구 사항이 더 가벼워지고 다운로드 시간도 빨라집니다.
YOLOv8 은 특히 기존 파이프라인이 특정 YOLOv8 버전과 긴밀하게 통합된 팀이나 문서 생태계의 절대적인 성숙도에 의존하는 팀에게 여전히 강력하고 관련성이 높은 도구입니다. 하지만 YOLO11 마이그레이션하는 것은 일반적으로 간단하며 즉각적인 성능 이점을 얻을 수 있습니다.
두 모델 모두 AGPL-3.0 라이선스로 출시되어 오픈 소스 협업을 장려하며, 독점 기능이 필요한 상용 제품에는 엔터프라이즈 라이선스를 사용할 수 있습니다.
다른 모델 살펴보기
YOLO11 YOLOv8 탁월한 범용 감지기이지만, 특정 요구사항에는 Ultralytics 제품군의 다른 아키텍처가 도움이 될 수 있습니다:
- YOLOv10: 지연 시간을 줄이기 위해 NMS 교육에 중점을 둡니다.
- YOLOv9: 딥 모델 학습을 위해 프로그래밍 가능한 그라데이션 정보를 강조합니다.
- RT-DETR: 높은 정확도를 제공하는 변압기 기반 검출기이지만 메모리 및 컴퓨팅 요구 사항이 높습니다.
전체 모델 비교를 통해 프로젝트에 가장 적합한 모델을 찾아보세요.