Chuyển đến nội dung

YOLOv8 so với YOLO11 : Sự phát triển của phát hiện đối tượng thời gian thực

Việc lựa chọn kiến trúc thị giác máy tính phù hợp là một quyết định quan trọng, ảnh hưởng đến tốc độ, độ chính xác và khả năng mở rộng của các dự án AI của bạn. Hướng dẫn này cung cấp so sánh kỹ thuật chuyên sâu giữa Ultralytics YOLOv8 , một tiêu chuẩn công nghiệp được áp dụng rộng rãi, phát hành năm 2023, và Ultralytics YOLO11 , phiên bản cải tiến mới nhất trong lĩnh vực này. YOLO Dòng sản phẩm được thiết kế để mang lại hiệu suất và hiệu quả vượt trội. Chúng tôi sẽ phân tích sự khác biệt về kiến trúc, các chỉ số chuẩn và trường hợp sử dụng lý tưởng để giúp bạn lựa chọn model phù hợp nhất với nhu cầu của mình.

Ultralytics YOLOv8

Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu: https://docs. ultralytics .com/models/ yolov8 /

Phát hành vào đầu năm 2023, YOLOv8 đánh dấu một cột mốc quan trọng trong lịch sử phát hiện đối tượng . Nó giới thiệu một khuôn khổ thống nhất hỗ trợ nhiều tác vụ thị giác máy tính—bao gồm phát hiện, phân đoạn thực thể , ước tính tư thếphân loại hình ảnh —trong một kho lưu trữ duy nhất. YOLOv8 chuyển từ phương pháp phát hiện dựa trên mỏ neo sang phương pháp không dựa trên mỏ neo , giúp đơn giản hóa thiết kế và cải thiện khả năng khái quát hóa trên nhiều hình dạng vật thể khác nhau.

Kiến trúc và các tính năng chính

YOLOv8 đã thay thế các mô-đun C3 có trong YOLOv5 bằng mô-đun C2f (Nút thắt từng phần xuyên giai đoạn với hai phép tích chập). Thay đổi này đã cải thiện luồng gradient và tích hợp tính năng trong khi vẫn duy trì được dung lượng nhẹ. Kiến trúc này cũng có một đầu tách rời, tách biệt các tác vụ đối tượng, phân loại và hồi quy để tăng độ chính xác.

Di sản của sự tin cậy

YOLOv8 đã được thử nghiệm trong hàng nghìn ứng dụng thương mại, từ tự động hóa sản xuất đến xe tự hành , tạo dựng danh tiếng về tính ổn định và dễ triển khai.

Điểm mạnh và Điểm yếu

  • Điểm mạnh:
    • Hệ sinh thái trưởng thành: Được hỗ trợ bởi nhiều hướng dẫn cộng đồng, tích hợp và triển khai.
    • Tính linh hoạt: Hỗ trợ OBB (Hộp giới hạn định hướng) và phân loại cùng với tính năng phát hiện tiêu chuẩn.
    • Độ ổn định đã được chứng minh: Một lựa chọn an toàn cho môi trường sản xuất yêu cầu một mô hình có thời gian dài track ghi.
  • Điểm yếu:
    • Hiệu quả về tốc độ: Mặc dù nhanh, nhưng nó vẫn bị vượt trội hơn YOLO11 TRONG CPU tốc độ suy luận và hiệu quả tham số.
    • Yêu cầu tính toán: Các biến thể lớn hơn (L, X) đòi hỏi nhiều VRAM và FLOP hơn so với các biến thể được tối ưu hóa YOLO11 tương đương.
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

Tìm hiểu thêm về YOLOv8

Ultralytics YOLO11

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 27-09-2024
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu: https://docs. ultralytics .com/models/ yolo11 /

YOLO11 đại diện cho sự tiên tiến của Ultralytics gia đình mô hình. Được thiết kế để định nghĩa lại suy luận thời gian thực , nó xây dựng dựa trên những thành công của YOLOv8 nhưng mang lại những cải tiến đáng kể về mặt kiến trúc. YOLO11 tập trung vào việc tối đa hóa độ chính xác đồng thời giảm thiểu chi phí tính toán, khiến nó trở thành lựa chọn hàng đầu cho các ứng dụng AI hiện đại, từ thiết bị biên đến máy chủ đám mây.

Kiến trúc và các tính năng chính

YOLO11 Giới thiệu khối C3k2 và mô-đun C2PSA (Phân đoạn chéo với Chú ý Không gian). Các thành phần này nâng cao khả năng trích xuất các đặc điểm phức tạp và xử lý che khuất hiệu quả hơn so với các phiên bản trước. Kiến trúc được tối ưu hóa về tốc độ, mang lại thời gian xử lý nhanh hơn đáng kể trên CPU—một yếu tố quan trọng cho việc triển khai AI biên, nơi GPU tài nguyên có thể không có sẵn.

Mô hình duy trì đặc điểm giao diện thống nhất của Ultralytics , đảm bảo rằng các nhà phát triển có thể chuyển đổi giữa các tác vụ như OBB hoặc phân đoạn mà không cần thay đổi quy trình làm việc của họ.

Điểm mạnh và Điểm yếu

  • Điểm mạnh:
    • Hiệu quả vượt trội: Đạt được hiệu quả cao hơn mAP với số lượng tham số ít hơn tới 22% YOLOv8 , giảm kích thước mô hình và nhu cầu lưu trữ.
    • Suy luận nhanh hơn: Được tối ưu hóa đặc biệt cho phần cứng hiện đại, cung cấp tốc độ nhanh hơn trên cả hai CPU Và GPU phần phụ trợ.
    • Trích xuất tính năng nâng cao: Xương sống mới cải thiện khả năng phát hiện các vật thể nhỏ và hiệu suất trong các cảnh lộn xộn.
    • Sử dụng bộ nhớ thấp hơn: Yêu cầu ít hơn CUDA bộ nhớ trong quá trình đào tạo so với các mô hình dựa trên máy biến áp như RT-DETR , cho phép đào tạo trên phần cứng dễ tiếp cận hơn.
  • Điểm yếu:
    • Phiên bản mới hơn: Là một mô hình gần đây, các công cụ của bên thứ ba chuyên biệt có thể mất thời gian để cập nhật hỗ trợ đầy đủ, mặc dù cốt lõi Ultralytics hệ sinh thái hỗ trợ nó ngay từ ngày đầu tiên.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Tìm hiểu thêm về YOLO11

So sánh trực tiếp hiệu năng

Sự so sánh dưới đây làm nổi bật hiệu quả tăng lên của YOLO11 . Trong khi YOLOv8 vẫn là một đối thủ mạnh mẽ, YOLO11 luôn mang lại độ chính xác cao hơn ( mAP ) với độ phức tạp tính toán giảm (FLOP) và tốc độ suy luận nhanh hơn. Điều này đặc biệt đáng chú ý ở các mô hình "Nano" và "Nhỏ", trong đó YOLO11n đạt 39,5 mAP so với YOLOv8n 37,3, trong khi chạy nhanh hơn đáng kể trên CPU .

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Phân tích số liệu

YOLO11 thể hiện một lợi thế rõ ràng trong sự đánh đổi giữa tốc độ và độ chính xác . Ví dụ, mô hình YOLO11l vượt trội hơn YOLOv8l độ chính xác (+0,5) mAP ) trong khi sử dụng ít hơn khoảng 42% tham số và chạy nhanh hơn 36% trên CPU .

Hệ sinh thái và tính dễ sử dụng

Cả hai mô hình đều được hưởng lợi từ hệ sinh thái Ultralytics mạnh mẽ, được thiết kế để dân chủ hóa AI bằng cách giúp mọi người có thể tiếp cận công nghệ tiên tiến nhất.

  • API hợp nhất: Chuyển đổi giữa YOLOv8 Và YOLO11 đơn giản như việc thay đổi chuỗi mô hình từ yolov8n.pt đến yolo11n.pt. Không cần phải cấu trúc lại mã.
  • Hiệu quả đào tạo: Ultralytics cung cấp các tập dữ liệu tự động tải xuống và trọng số được đào tạo trước, hợp lý hóa quy trình từ thu thập dữ liệu đến đào tạo mô hình.
  • Tính linh hoạt khi triển khai: Cả hai mô hình đều hỗ trợ xuất một cú nhấp chuột sang các định dạng như ONNX , TensorRT , CoreML , Và TFLite , tạo điều kiện triển khai trên nhiều phần cứng khác nhau bao gồm Raspberry Pis, điện thoại di động và các phiên bản đám mây.
  • Được bảo trì tốt: Các bản cập nhật thường xuyên đảm bảo khả năng tương thích với các phiên bản mới nhất của PyTorch Và CUDA , được hỗ trợ bởi cộng đồng tích cực trên Discord và GitHub.

Kết luận và Đề xuất

Trong khi YOLOv8 vẫn là một mô hình đáng tin cậy và có khả năng cao phù hợp để duy trì các hệ thống cũ, YOLO11 là khuyến nghị rõ ràng cho mọi hoạt động phát triển mới.

  • Chọn YOLO11 nếu: Bạn cần độ chính xác cao nhất có thể, tốc độ suy luận nhanh hơn (đặc biệt là trên CPU ), hoặc đang triển khai trên các thiết bị biên giới hạn về tài nguyên, nơi bộ nhớ và lưu trữ là quan trọng. Những cải tiến về kiến trúc của nó cung cấp một nền tảng bền vững cho các ứng dụng thương mại trong tương lai.
  • Chọn YOLOv8 nếu: Bạn có một đường ống hiện có được tinh chỉnh mạnh mẽ cho các hành vi cụ thể của v8 hoặc bị hạn chế bởi các yêu cầu nghiêm ngặt của dự án khiến không thể cập nhật lên kiến trúc mới nhất.

Đối với những người quan tâm đến việc khám phá các kiến trúc khác, Ultralytics docs cũng đề cập đến các mô hình như YOLOv9 , YOLOv10RT-DETR . Bạn có thể xem các so sánh chi tiết hơn trên trang so sánh mô hình của chúng tôi.


Bình luận