YOLOv5 so với YOLO11 Kết nối giữa truyền thống và đổi mới trong phát hiện đối tượng
Sự tiến hóa của YOLO Kiến trúc (You Only Look Once) đã là một hành trình mang tính định hình trong lĩnh vực thị giác máy tính . Từ độ tin cậy nền tảng của YOLOv5 để nâng cao hiệu quả của YOLO11 Mỗi phiên bản đều đẩy mạnh giới hạn về tốc độ và độ chính xác. Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết để giúp các nhà phát triển, nhà nghiên cứu và kỹ sư lựa chọn mô hình phù hợp với nhu cầu triển khai cụ thể của họ.
Tổng quan mô hình
YOLOv5 Tiêu chuẩn ngành
Được phát hành vào năm 2020 bởi Glenn Jocher và Ultralytics , YOLOv5 nhanh chóng trở thành tiêu chuẩn vàng cho việc phát hiện đối tượng thực tế. Đây là phần mềm đầu tiên YOLO Mô hình được triển khai nguyên bản bằng PyTorch , giúp nó dễ tiếp cận hơn với cộng đồng AI rộng lớn. Sự cân bằng giữa tính dễ sử dụng, quy trình huấn luyện mạnh mẽ và tính linh hoạt trong triển khai đã củng cố vị trí của nó trong hàng ngàn ứng dụng học thuật và công nghiệp.
- Tác giả: Glenn Jocher
- Tổ chức:Ultralytics
- Ngày: 2020-06-26
- GitHub:ultralytics/yolov5
YOLO11 Người kế vị tinh tế
YOLO11 , ra mắt năm 2024, đánh dấu một bước tiến vượt bậc đáng kể trong lĩnh vực này. Ultralytics lộ trình. Xây dựng dựa trên những tiến bộ kiến trúc của YOLOv8 Nó giới thiệu một cấu trúc xương sống và đầu được tinh chỉnh, được thiết kế để trích xuất đặc điểm và hiệu quả vượt trội. YOLO11 Tập trung vào việc tối đa hóa tỷ lệ độ chính xác trên tính toán, mang lại Độ chính xác trung bình ( mAP ) cao hơn với ít tham số hơn so với các phiên bản trước đó.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2024-09-27
- GitHub:ultralytics/ultralytics
Đề xuất mới nhất
Trong khi YOLO11 mang lại những cải tiến đáng kể so với YOLOv5 Các nhà phát triển bắt đầu các dự án mới vào năm 2026 cũng nên đánh giá YOLO26 . Nó có thiết kế hoàn chỉnh từ đầu đến cuối (loại bỏ...) NMS ), một công cụ tối ưu hóa MuSGD tiên tiến, và nhanh hơn tới 43%. CPU suy luận, biến nó trở thành lựa chọn hàng đầu cho việc triển khai biên hiện đại.
So sánh Kiến trúc Kỹ thuật
Backbone và Trích xuất Đặc trưng
YOLOv5 sử dụng kiến trúc mạng CSPDarknet. Thiết kế mạng Cross-Stage Partial này mang tính cách mạng trong việc giảm thiểu sự dư thừa tính toán trong khi vẫn duy trì luồng gradient phong phú. Nó cân bằng hiệu quả giữa chiều sâu và chiều rộng, cho phép mô hình học các đặc trưng phức tạp mà không làm tăng đột biến số lượng tham số.
YOLO11 phát triển khái niệm này với kiến trúc CSP nâng cao (C3k2) và giới thiệu các cơ chế chú ý không gian được cải tiến. Kiến trúc này được tinh chỉnh đặc biệt để nắm bắt các chi tiết nhỏ, giúp tăng đáng kể hiệu suất trong việc phát hiện các vật thể nhỏ . Thiết kế được tinh chỉnh này cho phép YOLO11 Để đạt được độ chính xác cao hơn với kích thước mô hình nhỏ hơn.
Đầu dò tìm (Detection Head)
Cơ chế phát hiện đối tượng trong YOLOv5 dựa trên neo, sử dụng các hộp neo được xác định trước để dự đoán vị trí đối tượng. Mặc dù hiệu quả, phương pháp này đòi hỏi phải tinh chỉnh cẩn thận các siêu tham số về kích thước neo cho các tập dữ liệu tùy chỉnh.
YOLO11 sử dụng đầu phát hiện không cần neo. Phương pháp hiện đại này đơn giản hóa quá trình huấn luyện bằng cách dự đoán trực tiếp tâm và kích thước đối tượng, loại bỏ nhu cầu tính toán hộp neo. Điều này không chỉ giúp tinh giản quy trình huấn luyện mà còn cải thiện khả năng khái quát hóa trên nhiều hình dạng và tỷ lệ khung hình đối tượng khác nhau.
Các chỉ số hiệu suất
Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa các nhóm. YOLOv5 Và YOLO11 Một điểm quan trọng cần lưu ý là sự đánh đổi giữa tốc độ và độ chính xác . YOLO11 liên tục đạt được mức cao hơn mAP đạt điểm cao trong khi vẫn duy trì tốc độ suy luận cạnh tranh hoặc vượt trội, đặc biệt là trên GPU phần cứng.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 1.9 | 4.5 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 7.2 | 16.5 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 21.2 | 49.0 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 46.5 | 109.1 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 86.7 | 205.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Phân tích:
- Độ chính xác: YOLO11n (Nano) đạt được mAP ấn tượng 39,5% , vượt trội đáng kể so với 28,0% của YOLOv5n. Điều này làm cho YOLO11 Đây là sự lựa chọn vượt trội hơn hẳn cho các ứng dụng nhẹ đòi hỏi độ chính xác cao.
- Tốc độ: YOLO11 các mô hình chứng minh nhanh hơn CPU Tốc độ suy luận ở định dạng ONNX , rất quan trọng cho việc triển khai trên các hệ thống không phải ONNX. GPU thiết bị.
- Hiệu quả: YOLO11 Nó đạt được những lợi ích này với số lượng tham số tương đương hoặc thường thấp hơn (ví dụ: YOLO11x so với YOLOv5x), thể hiện hiệu quả của các tối ưu hóa kiến trúc của nó.
Đào tạo và Hệ sinh thái
Dễ sử dụng
Cả hai mẫu xe đều được hưởng lợi từ những ưu điểm nổi bật. Ultralytics Hệ sinh thái, ưu tiên trải nghiệm của nhà phát triển.
- YOLOv5 đã thiết lập tiêu chuẩn cho cụm từ "bắt đầu huấn luyện trong 5 phút" nhờ cấu trúc trực quan và việc dựa vào các trình tải dữ liệu PyTorch tiêu chuẩn.
- YOLO11 tích hợp liền mạch vào hệ thống thống nhất.
ultralyticsPython gói này cung cấp API nhất quán cho tất cả các tác vụ, nghĩa là việc chuyển đổi từ Phát hiện vật thể đến Phân đoạn thực thể hoặc Ước tính tư thế chỉ yêu cầu thay đổi một đối số chuỗi duy nhất.
Hiệu quả huấn luyện
YOLO11 Giới thiệu các quy trình huấn luyện được tối ưu hóa, thường dẫn đến sự hội tụ nhanh hơn. Các tính năng như tăng cường khảm được tinh chỉnh, và thiết kế không có neo loại bỏ bước tiền xử lý của quá trình tiến hóa neo tự động được tìm thấy trong YOLOv5 Hơn nữa, cả hai mô hình đều cho thấy mức sử dụng bộ nhớ thấp hơn đáng kể trong quá trình huấn luyện so với các bộ dò dựa trên Transformer như RT-DETR , cho phép sử dụng kích thước batch lớn hơn trên GPU dành cho người tiêu dùng.
Đào tạo cùng với Ultralytics API
Đào tạo YOLO11 việc sử dụng nó vô cùng đơn giản Python SDK. Cú pháp tương tự áp dụng cho YOLOv5 thông qua ultralytics gói.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Tính linh hoạt
Trong khi YOLOv5 Đã bổ sung hỗ trợ cho việc phân đoạn và phân loại ở giai đoạn sau của vòng đời sản phẩm. YOLO11 Được thiết kế từ đầu như một hệ thống học tập đa nhiệm. Nó hỗ trợ natively các tính năng sau:
- Phát Hiện Đối Tượng
- Phân đoạn thực thể
- Phân loại hình ảnh
- Ước tính tư thế
- Hộp giới hạn có hướng (OBB)
Điều này làm cho YOLO11 Một công cụ đa năng hơn, giống như "dao đa năng Thụy Sĩ", dành cho các quy trình xử lý hình ảnh máy tính phức tạp, nơi cần thực hiện nhiều loại phân tích đồng thời.
Các trường hợp sử dụng lý tưởng
Khi nào nên chọn YOLOv5
- Hệ thống cũ: Nếu bạn đã có sẵn quy trình sản xuất được xây dựng dựa trên yêu cầu cụ thể đó YOLOv5 định dạng đầu ra hoặc
requirements.txt, tiếp tục với YOLOv5 Đảm bảo tính ổn định. - Các ràng buộc phần cứng cụ thể: Trên phần cứng cực kỳ cũ hoặc các triển khai FPGA cụ thể, kiến trúc đơn giản hơn của YOLOv5 có thể đã có sẵn các luồng bit được tối ưu hóa.
- Sao chép nghiên cứu: Dùng để sao chép các bài báo học thuật từ năm 2020-2023 đã sử dụng YOLOv5 như một mức cơ bản.
Khi nào nên chọn YOLO11
- Triển khai AI tại biên: Tỷ lệ tốc độ trên độ chính xác vượt trội giúp YOLO11 Lý tưởng cho các thiết bị như NVIDIA Jetson hoặc Raspberry Pi, đặc biệt là để xử lý video thời gian thực.
- Yêu cầu độ chính xác cao: Ứng dụng trong chẩn đoán hình ảnh y tế hoặc phát hiện khuyết tật, nơi mà mỗi phần trăm điểm đều có ý nghĩa quan trọng. mAP vấn đề.
- Ứng dụng đa nhiệm: Các dự án yêu cầu ước tính tư thế (ví dụ: phân tích thể thao) hoặc hộp giới hạn xoay (ví dụ: khảo sát trên không) sẽ được hưởng lợi từ... YOLO11 Hỗ trợ gốc của 's.
- Đào tạo trên nền tảng đám mây: Sử dụng nền tảng Ultralytics để quản lý tập dữ liệu và đào tạo mô hình một cách hiệu quả.
Kết luận
Cả hai YOLOv5 Và YOLO11 là minh chứng cho Ultralytics 'cam kết hướng đến sự xuất sắc của mã nguồn mở. YOLOv5 vẫn là một công cụ đáng tin cậy, đã được kiểm chứng qua thực tế. Tuy nhiên, YOLO11 mang đến một lộ trình nâng cấp hấp dẫn với những cải tiến về kiến trúc, độ chính xác vượt trội và khả năng hỗ trợ nhiều tác vụ hơn.
Đối với các nhà phát triển hướng đến tương lai, sự lựa chọn rất rõ ràng: YOLO11 Cung cấp lợi thế về hiệu năng cần thiết cho các ứng dụng hiện đại. Đối với những ai tìm kiếm công nghệ tiên tiến nhất, chúng tôi cũng đặc biệt khuyên bạn nên tìm hiểu YOLO26 , giải pháp toàn diện từ đầu đến cuối. NMS - Phát hiện miễn phí giúp việc triển khai đơn giản hơn.
Các mô hình khác mà bạn có thể quan tâm bao gồm YOLOv10 để nghiên cứu hiệu năng thời gian thực hoặc YOLO -World để phát hiện từ vựng mở.