Chuyển đến nội dung

YOLOv5 so với YOLO11 : So sánh kỹ thuật toàn diện

Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng cho sự thành công của dự án. Hai trong số những cột mốc quan trọng nhất trong lĩnh vực này là YOLOv5YOLO11 mới ra mắt gần đây. Trong khi YOLOv5 đã thiết lập một tiêu chuẩn huyền thoại về tính dễ sử dụng và tốc độ, YOLO11 đẩy mạnh ranh giới về độ chính xác và hiệu quả, tận dụng nhiều năm nghiên cứu và phát triển.

Hướng dẫn này cung cấp phân tích kỹ thuật chi tiết về hai kiến trúc này, giúp các nhà phát triển, nhà nghiên cứu và kỹ sư đưa ra quyết định sáng suốt cho các ứng dụng AI của họ.

Ultralytics YOLOv5 : Con ngựa thồ đáng tin cậy

Phát hành năm 2020, YOLOv5 đã cách mạng hóa khả năng tiếp cận phát hiện đối tượng. Đây là mô hình "Bạn chỉ nhìn một lần" đầu tiên được triển khai gốc trong PyTorch , giúp các nhà phát triển dễ dàng đào tạo và triển khai. Sự cân bằng giữa tốc độ và độ chính xác đã khiến nó trở thành lựa chọn hàng đầu cho mọi thứ, từ kiểm tra công nghiệp đến xe tự hành .

Chi tiết kỹ thuật:

Các tính năng và kiến trúc chính

YOLOv5 sử dụng kiến trúc dựa trên neo. Nó giới thiệu xương sống CSPDarknet, giúp cải thiện đáng kể luồng gradient và giảm chi phí tính toán so với các phiên bản trước. Mô hình sử dụng một nút thắt Mạng Tổng hợp Đường dẫn (PANet) để tăng cường luồng thông tin và tích hợp tăng cường dữ liệu Mosaic trong quá trình huấn luyện, một kỹ thuật đã trở thành tiêu chuẩn để cải thiện độ bền của mô hình trước các đối tượng nhỏ hơn.

Điểm mạnh

YOLOv5 nổi tiếng về tính ổn định và độ hoàn thiện . Với nhiều năm thử nghiệm cộng đồng, hệ sinh thái hướng dẫn, tích hợp của bên thứ ba và hướng dẫn triển khai rất phong phú. Đây là lựa chọn tuyệt vời cho các hệ thống cũ hoặc thiết bị biên đã được tối ưu hóa phần cứng cụ thể cho kiến trúc của nó.

Tìm hiểu thêm về YOLOv5

Ultralytics YOLO11 : Sự tiến hóa hiện đại

Ra mắt vào cuối năm 2024, YOLO11 đại diện cho công nghệ AI tầm nhìn tiên tiến nhất. Nó được xây dựng dựa trên những bài học kinh nghiệm từ YOLOv5 và YOLOv8 để cung cấp một mô hình nhanh hơn, chính xác hơn và hiệu quả tính toán hơn.

Chi tiết kỹ thuật:

Kiến trúc và các tính năng chính

YOLO11 giới thiệu những cải tiến đáng kể về kiến trúc, bao gồm khối C3k2 và các mô-đun C2PSA (Phân đoạn chéo với Chú ý không gian). Không giống như YOLOv5 , YOLO11 sử dụng đầu phát hiện không có neo , giúp đơn giản hóa quá trình đào tạo bằng cách loại bỏ nhu cầu tính toán hộp neo thủ công. Sự thay đổi thiết kế này giúp tăng cường khả năng khái quát hóa và cho phép mô hình thích ứng tốt hơn với các tập dữ liệu đa dạng.

Tính linh hoạt vô song

Một trong những đặc điểm xác định của YOLO11 là hỗ trợ gốc của nó cho nhiều tác vụ thị giác máy tính trong một khuôn khổ duy nhất. Trong khi YOLOv5 chủ yếu tập trung vào phát hiện (sau này hỗ trợ phân đoạn), YOLO11 được xây dựng từ đầu để xử lý:

Tính linh hoạt này cho phép các nhà phát triển giải quyết các vấn đề phân tích và robot phức tạp mà không cần chuyển đổi khuôn khổ.

Tìm hiểu thêm về YOLO11

So sánh hiệu suất

Sự chuyển đổi từ YOLOv5 ĐẾN YOLO11 mang lại hiệu suất tăng đáng kể. Các số liệu chứng minh rằng YOLO11 mang lại sự cân bằng vượt trội giữa tốc độ và độ chính xác.

Độ chính xác so với Hiệu quả

YOLO11 luôn đạt được Độ chính xác trung bình ( mAP ) cao hơn trên COCO tập dữ liệu so với YOLOv5 các mô hình có kích thước tương tự. Ví dụ, mô hình YOLO11m vượt trội hơn nhiều so với YOLOv5x về độ chính xác (51,5 so với 50,7) mAP ) trong khi vận hành với một phần nhỏ các tham số (20,1M so với 97,2M). Việc giảm đáng kể kích thước mô hình này đồng nghĩa với việc giảm yêu cầu bộ nhớ trong cả quá trình đào tạo và suy luận, một yếu tố quan trọng để triển khai trên phần cứng AI biên có tài nguyên hạn chế.

Tốc độ suy luận

Nhờ vào những lựa chọn kiến trúc được tối ưu hóa, YOLO11 tỏa sáng trong CPU tốc độ suy luận. Mô hình YOLO11n tạo ra một chuẩn mực mới cho các ứng dụng thời gian thực, đạt tốc độ chỉ 56,1ms trên CPU với ONNX , nhanh hơn đáng kể so với phiên bản tiền nhiệm.

Hiệu quả bộ nhớ

Ultralytics YOLO11 Các mô hình được thiết kế để sử dụng bộ nhớ tối ưu. So với các máy dò dựa trên biến áp như RT-DETR , YOLO11 yêu cầu ít hơn đáng kể CUDA bộ nhớ trong quá trình đào tạo, giúp các nhà phát triển có thể sử dụng GPU tiêu dùng thông thường.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Kinh nghiệm đào tạo và phát triển

Cả hai mô hình đều được hưởng lợi từ hệ sinh thái Ultralytics toàn diện, nổi tiếng với tính năng "Dễ sử dụng".

Tích hợp liền mạch

YOLO11 được tích hợp vào hiện đại ultralytics Python Gói này hợp nhất tất cả các tác vụ trong một API đơn giản. Điều này cho phép đào tạo, xác thực và triển khai chỉ trong vài dòng mã.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Trong khi YOLOv5 PyTorch có kho lưu trữ chuyên dụng riêng, cũng có thể dễ dàng tải qua PyTorch Hub hoặc sử dụng trong hệ sinh thái mới hơn cho một số tác vụ nhất định. Tài liệu hướng dẫn chi tiết cho cả hai mô hình đảm bảo rằng dù bạn đang thực hiện tinh chỉnh siêu tham số hay xuất sang OpenVINO , quy trình đều được sắp xếp hợp lý.

Lợi ích của hệ sinh thái

Lựa chọn một Ultralytics Mô hình này đồng nghĩa với việc tiếp cận một bộ công cụ được bảo trì tốt. Từ tích hợp với Comet để theo dõi thử nghiệm đến quản lý dữ liệu liền mạch, hệ sinh thái hỗ trợ toàn bộ vòng đời MLOps . Sự phát triển tích cực này đảm bảo các bản vá bảo mật và cải tiến hiệu suất được cung cấp thường xuyên.

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn YOLOv5

  • Phần cứng cũ: Nếu bạn có các thiết bị biên hiện có (như Raspberry Pis cũ hơn) với các đường ống được tối ưu hóa cụ thể cho YOLOv5 ngành kiến trúc.
  • Quy trình làm việc đã thiết lập: Dành cho các dự án đang trong chế độ bảo trì sâu, trong đó việc cập nhật kiến trúc mô hình cốt lõi sẽ phải chịu chi phí tái cấu trúc đáng kể.
  • Tối ưu hóa GPU cụ thể: Trong những trường hợp hiếm hoi khi cụ thể TensorRT động cơ được điều chỉnh mạnh mẽ cho YOLOv5 cấu trúc lớp chính xác của.

Khi nào nên chọn YOLO11

  • Những phát triển mới: Đối với hầu hết các dự án mới, YOLO11 là điểm khởi đầu được khuyến nghị do tỷ lệ chính xác trên khả năng tính toán vượt trội của nó.
  • Ứng dụng CPU thời gian thực: Các ứng dụng chạy trên bộ xử lý tiêu chuẩn, chẳng hạn như máy tính xách tay hoặc phiên bản đám mây, được hưởng lợi rất nhiều từ YOLO11 'S CPU tối ưu hóa tốc độ.
  • Nhiệm vụ phức tạp: Các dự án yêu cầu phân đoạn trường hợp hoặc ước tính tư thế cùng với phát hiện.
  • Yêu cầu về độ chính xác cao: Các lĩnh vực như hình ảnh y tế hoặc phân tích hình ảnh vệ tinh , trong đó việc phát hiện các vật thể nhỏ với độ chính xác cao là tối quan trọng.

Kết luận

YOLOv5 vẫn là minh chứng cho thiết kế AI hiệu quả và dễ tiếp cận, đã thúc đẩy vô số cải tiến trong vài năm qua. Tuy nhiên, YOLO11 đại diện cho tương lai . Với kiến trúc không neo tiên tiến, vượt trội mAP Với điểm số cao và tính linh hoạt được cải thiện, nó cung cấp cho các nhà phát triển một bộ công cụ mạnh mẽ hơn để giải quyết các thách thức về thị giác máy tính hiện đại.

Bằng cách áp dụng YOLO11 , bạn không chỉ có được hiệu suất tốt hơn mà còn đảm bảo tương lai cho các ứng dụng của mình trong thời đại phát triển Ultralytics hệ sinh thái.

Khám phá các Mô hình Khác

Nếu bạn muốn so sánh các kiến trúc này với các mô hình hàng đầu khác, hãy khám phá các so sánh chi tiết của chúng tôi:


Bình luận