Chuyển đến nội dung

YOLO11 so với YOLOv8 So sánh kỹ thuật toàn diện các mô hình thị giác thời gian thực

Lĩnh vực thị giác máy tính đã chứng kiến ​​những tiến bộ vượt bậc với sự phát triển không ngừng của các kiến ​​trúc phát hiện đối tượng. Khi đánh giá các mô hình để triển khai thực tế, các nhà phát triển thường so sánh điểm mạnh của Ultralytics YOLO11 và người tiền nhiệm rất thành công của nó, Ultralytics YOLOv8 . Cả hai mô hình đều đã thiết lập các tiêu chuẩn ngành về tốc độ, độ chính xác và trải nghiệm của nhà phát triển, nhưng chúng phục vụ cho các vòng đời dự án và ngưỡng hiệu năng hơi khác nhau.

Hướng dẫn này cung cấp phân tích chuyên sâu về kiến ​​trúc, phương pháp đào tạo và các trường hợp sử dụng lý tưởng của chúng để giúp bạn lựa chọn giải pháp tốt nhất cho các sáng kiến ​​trí tuệ nhân tạo của mình.

Đổi mới Kiến trúc

Sự chuyển đổi từ YOLOv8 ĐẾN YOLO11 Đã giới thiệu một số cải tiến kiến ​​trúc quan trọng nhằm tối đa hóa hiệu quả trích xuất đặc trưng đồng thời giảm thiểu chi phí tính toán.

Kiến trúc YOLO11

YOLO11 Đây là một bước tiến đáng kể trong việc tối ưu hóa việc sử dụng tham số. Nó thay thế các mô-đun C2f truyền thống bằng các khối C3k2 tiên tiến, giúp tăng cường khả năng xử lý đặc trưng không gian mà không làm tăng số lượng tham số. Ngoài ra, YOLO11 Mô hình này giới thiệu module C2PSA (Cross-Stage Partial Spatial Attention) vào cấu trúc chính của nó. Cơ chế chú ý này cho phép mô hình tập trung vào các vùng quan trọng, cải thiện đáng kể khả năng phát hiện vật thể nhỏ và xử lý các trường hợp che khuất phức tạp.

Tìm hiểu thêm về YOLO11

Kiến trúc YOLOv8

Được ra mắt một năm trước đó, YOLOv8 Nó tiên phong trong việc chuyển đổi sang đầu phát hiện không cần neo, giúp loại bỏ nhu cầu điều chỉnh thủ công các hộp neo và đơn giản hóa công thức tính tổn thất. Kiến trúc của nó dựa nhiều vào khối C2f, một thiết kế đã cân bằng thành công độ sâu mạng và luồng gradient, làm cho nó cực kỳ mạnh mẽ trong nhiều ứng dụng thị giác máy tính .

Tìm hiểu thêm về YOLOv8

Triết lý thiết kế

Trong khi YOLOv8 đã đặt nền tảng cho việc phát hiện không cần neo trong Ultralytics hệ sinh thái, YOLO11 Phương pháp này đã được tinh chỉnh bằng các cơ chế chú ý không gian, đạt được độ chính xác cao hơn với ít tài nguyên tính toán hơn.

Hiệu năng và điểm chuẩn

Khi triển khai các mô hình lên các thiết bị biên như Raspberry Pi hoặc các máy chủ hiệu năng cao chạy NVIDIA TensorRT , việc hiểu rõ sự đánh đổi giữa tốc độ và độ chính xác là vô cùng quan trọng. Bảng dưới đây minh họa điều đó. YOLO11 luôn vượt trội YOLOv8 trên tất cả các biến thể kích thước.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Phân tích các chỉ số

YOLO11 đạt được độ chính xác trung bình cao hơn đáng kể ( mAP đồng thời giảm cả số lượng tham số và số phép toán dấu phẩy động (FLOPs). Ví dụ, mô hình YOLO11m yêu cầu ít hơn 22% tham số so với... YOLOv8m nhưng mang lại hiệu quả cao hơn 1,3% mAP trên tập dữ liệu COCO . Hơn nữa, CPU Tốc độ suy luận khi xuất sang định dạng ONNX cho thấy rằng YOLO11 Nó nhanh hơn đáng kể, khiến nó trở thành lựa chọn tuyệt vời cho các hệ thống thiếu khả năng tăng tốc GPU chuyên dụng.

Lợi thế Hệ sinh thái Ultralytics

Bất kể bạn lựa chọn điều gì. YOLO11 hoặc YOLOv8 Cả hai mô hình đều được hưởng lợi từ sự toàn diện Ultralytics hệ sinh thái này giúp đơn giản hóa đáng kể vòng đời của máy học.

Dễ sử dụng và API đơn giản

Hàm ultralytics Python Gói này cung cấp một API được đơn giản hóa, cho phép các kỹ sư và nhà nghiên cứu huấn luyện, xác thực và xuất mô hình chỉ với một vài dòng mã. Điều này giúp loại bỏ những phức tạp thường gặp khi thiết lập môi trường học sâu. PyTorch.

Hiệu quả đào tạo và yêu cầu về bộ nhớ

Không giống như các Vision Transformer hạng nặng (như RT-DETR ), Ultralytics YOLO Các mô hình này nổi tiếng với khả năng sử dụng bộ nhớ thấp trong quá trình huấn luyện. Hiệu quả bộ nhớ này cho phép các nhà phát triển huấn luyện các mạng lưới tiên tiến trên GPU cấp độ người tiêu dùng hoặc môi trường đám mây như Google Colab mà không gặp phải lỗi hết bộ nhớ.

Tính linh hoạt trong các nhiệm vụ thị giác

Cả hai YOLO11 Và YOLOv8 Chúng là những bộ xử lý đa nhiệm thực thụ. Ngoài khả năng phát hiện đối tượng bằng hộp giới hạn tiêu chuẩn, chúng còn hỗ trợ phân đoạn đối tượng , phân loại hình ảnh , ước tính tư thế người và hộp giới hạn định hướng (OBB) cho ảnh chụp từ trên không.

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLO11 Và YOLOv8 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn YOLO11

YOLO11 là một lựa chọn tốt cho:

  • Triển khai tại biên môi trường sản xuất: Các ứng dụng thương mại trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson , nơi độ tin cậy và bảo trì thường xuyên là yếu tố tối quan trọng.
  • Ứng dụng thị giác đa nhiệm: Các dự án yêu cầu phát hiện , phân đoạn , ước lượng tư thếOBB trong một khung thống nhất duy nhất.
  • Tạo mẫu và triển khai nhanh chóng: Các nhóm cần chuyển nhanh từ thu thập dữ liệu sang sản xuất bằng cách sử dụng API Python Ultralytics được tối ưu hóa.

Khi nào nên chọn YOLOv8

YOLOv8 được khuyến nghị cho:

  • Triển khai đa nhiệm linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh để phát hiện , phân đoạn , phân loạiước tính tư thế trong phạm vi... Ultralytics hệ sinh thái.
  • Hệ thống sản xuất hiện có: Môi trường sản xuất hiện tại đã được xây dựng trên hệ thống này. YOLOv8 kiến trúc với các quy trình triển khai ổn định, đã được kiểm thử kỹ lưỡng.
  • Hỗ trợ cộng đồng và hệ sinh thái rộng rãi: Các ứng dụng được hưởng lợi từ YOLOv8 Hệ thống này có các hướng dẫn chi tiết, tích hợp với bên thứ ba và nguồn lực cộng đồng năng động.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Ví dụ mã: Bắt đầu

Triển khai và huấn luyện một Ultralytics Mô hình này cực kỳ trực quan. Ví dụ sau đây minh họa cách tải một mô hình đã được huấn luyện trước. YOLO11 Xây dựng mô hình, tinh chỉnh nó trên tập dữ liệu tùy chỉnh và xuất ra để triển khai trên thiết bị biên bằng Apple CoreML :

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory requirements
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the validation performance
metrics = model.val()

# Run real-time inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to CoreML for fast mobile deployment
export_path = model.export(format="coreml")

Nâng cấp liền mạch

Bởi vì Ultralytics API được tiêu chuẩn hóa, nâng cấp quy trình cũ từ... YOLOv8 ĐẾN YOLO11 Thông thường chỉ cần thay đổi chuỗi trọng số từ "yolov8n.pt" đến "yolo11n.pt".

Hướng tới tương lai: Đỉnh cao của Trí tuệ nhân tạo biên với YOLO26

Trong khi YOLO11 Đại diện cho một kiến ​​trúc hoàn thiện và có khả năng cao, tốc độ đổi mới AI vẫn tiếp tục diễn ra nhanh chóng. Đối với các nhà phát triển bắt đầu các dự án mới và yêu cầu hiệu năng tiên tiến nhất, Ultralytics YOLO26 (phát hành tháng 1 năm 2026) là sự lựa chọn tối ưu.

YOLO26 vượt qua các giới hạn của thị giác máy tính với một số tính năng đột phá:

  • Thiết kế không cần NMS từ đầu đến cuối: Dựa trên các khái niệm đã được khám phá trong YOLOv10 , YOLO26 loại bỏ hoàn toàn hiện tượng Non-Maximum Suppression (NMS) một cách tự nhiên. NMS xử lý hậu kỳ, giúp giảm độ trễ và dễ dự đoán hơn trên tất cả các phần cứng triển khai.
  • Suy luận CPU nhanh hơn tới 43%: Bằng cách loại bỏ hoàn toàn nhánh Distribution Focal Loss (DFL), YOLO26 được tối ưu hóa đặc biệt cho các thiết bị điện toán biên thiếu GPU mạnh mẽ.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện mô hình ngôn ngữ lớn (LLM), YOLO26 sử dụng bộ tối ưu hóa lai MuSGD, đảm bảo quá trình huấn luyện hội tụ nhanh chóng và ổn định đáng kể.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận dạng các vật thể nhỏ và bị che khuất nhiều, điều cần thiết cho robot tự hành và phân tích dữ liệu dựa trên máy bay không người lái.

Cho dù bạn tin tưởng vào độ tin cậy đã được chứng minh của YOLOv8 , kiến ​​trúc tối ưu của YOLO11 Hoặc với các khả năng thế hệ tiếp theo của YOLO26, Nền tảng Ultralytics đảm bảo bạn có các công cụ cần thiết để đưa các ứng dụng AI xử lý hình ảnh của mình từ ý tưởng đến sản xuất một cách liền mạch. Hãy khám phá các tích hợp mở rộng có sẵn để kết nối các mô hình của bạn với quy trình làm việc doanh nghiệp và bảng điều khiển phân tích.


Bình luận