Ultralytics YOLOv8 so với YOLO11 Sự tiến hóa kiến trúc và phân tích hiệu năng

Sự phát triển của các kiến trúc phát hiện đối tượng diễn ra nhanh chóng, mỗi phiên bản đều mang lại những cải tiến đáng kể về độ chính xác, tốc độ và tính dễ sử dụng. Ultralytics YOLOv8 , được phát hành vào đầu năm 2023, đã thiết lập một tiêu chuẩn mới về tính linh hoạt và dễ sử dụng trong thị giác máy tính. Cuối năm 2024, Ultralytics YOLO11 ra đời, tinh chỉnh kiến trúc để đạt hiệu quả và hiệu suất cao hơn nữa trên nhiều tác vụ hơn.

Hướng dẫn toàn diện này so sánh hai mô hình mạnh mẽ này, phân tích sự khác biệt về kiến trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng để giúp bạn chọn công cụ phù hợp cho dự án thị giác máy tính tiếp theo của mình.

Tổng quan mô hình

Trước khi đi sâu vào các thông số kỹ thuật, điều cần thiết là phải hiểu bối cảnh và mục tiêu đằng sau sự phát triển của mỗi mô hình. Cả hai đều là sản phẩm của Ultralytics 'Cam kết tạo ra trí tuệ nhân tạo thị giác tiên tiến, dễ tiếp cận.

Ultralytics YOLOv8

Được phát hành vào tháng 1 năm 2023, YOLOv8 Đánh dấu một cột mốc quan trọng bằng cách hợp nhất nhiều tác vụ—phát hiện, phân đoạn, phân loại, ước tính tư thế và OBB—dưới một API duy nhất, thân thiện với người dùng. Nó giới thiệu một kiến trúc xương sống mới và đầu phát hiện không cần neo, làm cho nó trở nên rất linh hoạt cho nhiều ứng dụng khác nhau.

Thông tin chi tiết chính:

Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
Tổ chức:Ultralytics
Ngày: 10 tháng 1 năm 2023
Tài liệu:Tài liệu YOLOv8
GitHub:Kho lưu trữ Ultralytics

Tìm hiểu thêm về YOLOv8

Ultralytics YOLO11

Ra mắt vào tháng 9 năm 2024, YOLO11 xây dựng dựa trên nền tảng vững chắc của YOLOv8 Nó tập trung vào việc tinh chỉnh kiến trúc để nâng cao hiệu quả trích xuất đặc trưng và tốc độ xử lý. YOLO11 Được thiết kế để cung cấp độ chính xác cao hơn với ít tham số hơn, điều này làm cho nó đặc biệt hiệu quả cho các ứng dụng xử lý dữ liệu thời gian thực tại biên.

Thông tin chi tiết chính:

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức:Ultralytics
Ngày: 27 tháng 9 năm 2024
Tài liệu:Tài liệu YOLO11
GitHub:Kho lưu trữ Ultralytics

Tìm hiểu thêm về YOLO11

Đổi mới mới nhất: YOLO26

Trong khi YOLO11 đại diện cho một bước tiến vượt bậc so với YOLOv8 Các nhà phát triển đang tìm kiếm công nghệ tiên tiến nhất nên khám phá YOLO26 . Được phát hành vào năm 2026, nó giới thiệu một tính năng mới. NMS - Thiết kế hoàn chỉnh miễn phí, trình tối ưu hóa MuSGD và tốc độ nhanh hơn tới 43% CPU suy luận, thiết lập một chuẩn mực mới cho trí tuệ nhân tạo cấp độ sản xuất.

Sự khác biệt về kiến trúc

Sự chuyển đổi từ YOLOv8 ĐẾN YOLO11 Điều này bao gồm một số thay đổi kiến trúc quan trọng nhằm tối ưu hóa sự cân bằng giữa chi phí tính toán và độ chính xác.

Backbone và Trích xuất Đặc trưng

YOLOv8 Nó sử dụng kiến trúc xương sống CSPDarknet53 được sửa đổi với các mô-đun C2f, thay thế cho các mô-đun C3 từ các thế hệ trước. Thiết kế này đã cải thiện luồng chuyển đổi gradient và độ phong phú của các tính năng.

YOLO11 Mô hình được cải tiến hơn nữa bằng cách tinh chỉnh cấu trúc nút thắt cổ chai và cơ chế chú ý bên trong hệ thống xương sống. Những thay đổi này cho phép mô hình nắm bắt được các mẫu phức tạp hơn và hệ thống phân cấp không gian với chi phí tính toán giảm thiểu. Điều này đặc biệt có lợi cho các nhiệm vụ khó khăn như phát hiện vật thể nhỏ trong ảnh chụp từ trên không hoặc kiểm soát chất lượng sản xuất.

Kiến trúc đầu

Cả hai mô hình đều sử dụng đầu không có neo, giúp đơn giản hóa quá trình huấn luyện và cải thiện khả năng khái quát hóa trên các hình dạng đối tượng khác nhau. Tuy nhiên, YOLO11 Tích hợp các kỹ thuật kết hợp đặc trưng tiên tiến hơn ở vùng cổ và đầu, mang lại độ chính xác định vị và phân tách lớp tốt hơn so với các phương pháp khác. YOLOv8 .

Phân tích hiệu suất

Khi lựa chọn mô hình để sản xuất, các chỉ số như Độ chính xác trung bình (Mean Average Precision) mAP Tốc độ suy luận và kích thước mô hình là rất quan trọng. Bảng dưới đây cung cấp so sánh chi tiết về trọng số được huấn luyện trước trên... COCO tập dữ liệu.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

Những Điểm Chính Về Hiệu Suất

Hiệu quả: YOLO11 Các mô hình này luôn nhẹ hơn (ít tham số hơn) và nhanh hơn (độ trễ thấp hơn) so với các mô hình khác. YOLOv8 so sánh với các đối thủ cạnh tranh trong khi đạt được độ chính xác cao hơn. Ví dụ, YOLO11n nhanh hơn khoảng 22% trên CPU ONNX suy luận hơn YOLOv8n đồng thời sở hữu mức cao hơn mAP .
Tính toán: Số phép tính FLOP giảm trong YOLO11 Điều này khiến nó trở thành lựa chọn tuyệt vời cho các thiết bị chạy bằng pin hoặc có tài nguyên hạn chế, chẳng hạn như điện thoại di động hoặc cảm biến IoT nhúng.
Độ chính xác: Cái mAP những cải tiến trong YOLO11 Đặc biệt là ở các phiên bản nhỏ hơn (Nano và Small), chúng rất quan trọng đối với các ứng dụng yêu cầu độ tin cậy cao mà không cần phần cứng phức tạp.

Huấn luyện và Dễ sử dụng

Một trong những điểm mạnh nổi bật của... Ultralytics Hệ sinh thái là trải nghiệm người dùng thống nhất và đơn giản hóa. Cả hai YOLOv8 Và YOLO11 Chúng có cùng một API trực quan, cho phép các nhà phát triển chuyển đổi giữa các kiến trúc chỉ bằng một dòng mã thay đổi.

Lợi thế của Ultralytics

Không giống như các mô hình máy biến áp phức tạp thường yêu cầu lượng lớn vật liệu. GPU bộ nhớ và cấu hình phức tạp, Ultralytics Các mô hình được tối ưu hóa để đạt hiệu quả cao trong quá trình huấn luyện . Chúng có thể được huấn luyện hiệu quả trên các GPU dành cho người tiêu dùng, giúp phổ biến rộng rãi hơn khả năng tiếp cận trí tuệ nhân tạo hiệu năng cao.

Các tính năng chung của cả hai mẫu bao gồm:

API Python đơn giản: Tải, huấn luyện và triển khai mô hình chỉ trong vài phút.
Tài liệu đầy đủ và chi tiết: Hướng dẫn toàn diện về tinh chỉnh siêu tham số , tăng cường dữ liệu và triển khai.
Tích hợp hệ sinh thái: Khả năng tương thích liền mạch với Nền tảng Ultralytics để quản lý tập dữ liệu, huấn luyện từ xa và xuất mô hình chỉ với một cú nhấp chuột.

Ví dụ về huấn luyện:

Đoạn mã sau đây minh họa cách bạn có thể dễ dàng chuyển đổi giữa các chế độ huấn luyện. YOLOv8 Và YOLO11 .

from ultralytics import YOLO

# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Train YOLOv8
model_v8.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a YOLO11 model - Same API!
model_11 = YOLO("yolo11n.pt")
# Train YOLO11
model_11.train(data="coco8.yaml", epochs=100, imgsz=640)

Các trường hợp sử dụng lý tưởng

Mặc dù cả hai mẫu đều có khả năng vượt trội, nhưng những điểm mạnh riêng biệt của chúng khiến chúng phù hợp với các tình huống khác nhau.

Khi nào nên chọn YOLOv8

YOLOv8 vẫn là một lựa chọn mạnh mẽ và đáng tin cậy, đặc biệt là đối với:

Các dự án kế thừa: Các quy trình hiện có đã được tối ưu hóa cho YOLOv8 Những công trình đòi hỏi sự ổn định mà không cần nâng cấp kiến trúc ngay lập tức.
Nguồn lực cộng đồng rộng lớn: Do thời gian hoạt động trên thị trường lâu hơn, YOLOv8 Nền tảng này có một thư viện rộng lớn gồm các hướng dẫn, video và các triển khai từ cộng đồng bên thứ ba.
Tầm nhìn đa năng: Tuyệt vời cho các tác vụ phát hiện đối tượng tiêu chuẩn, nơi tối ưu hóa cạnh cực độ không phải là ràng buộc chính.

Khi nào nên chọn YOLO11

YOLO11 Đây là lựa chọn được khuyến nghị cho hầu hết các triển khai mới, đặc biệt là đối với:

Điện toán biên: Số lượng tham số ít hơn và tốc độ suy luận nhanh hơn khiến nó trở nên lý tưởng cho Raspberry Pi , Jetson Nano và các triển khai trên thiết bị di động.
Ứng dụng thời gian thực: Cực kỳ quan trọng đối với các tác vụ như lái xe tự hành hoặc dây chuyền sản xuất tốc độ cao, nơi mà từng mili giây độ trễ đều có ý nghĩa.
Các tác vụ phức tạp: Những cải tiến về kiến trúc giúp cải thiện hiệu suất trong các tình huống phức tạp, chẳng hạn như ước lượng tư thế cho phân tích thể thao hoặc phân đoạn đối tượng cho hình ảnh y tế.

Tính linh hoạt trên nhiều tác vụ

Cả hai YOLOv8 Và YOLO11 Nó hỗ trợ nhiều tác vụ khác nhau ngoài việc phát hiện hộp giới hạn đơn giản, bao gồm Phân đoạn đối tượng , Ước tính tư thế , Hộp giới hạn định hướng (OBB) và Phân loại . Tính linh hoạt này cho phép các nhà phát triển giải quyết các vấn đề đa diện bằng một khung phần mềm duy nhất.

Kết luận

Cả hai YOLOv8 Và YOLO11 Đại diện cho đỉnh cao của công nghệ thị giác máy tính hiệu quả. YOLOv8 đã thiết lập một tiêu chuẩn linh hoạt, thân thiện với người dùng, hỗ trợ vô số ứng dụng AI trên toàn cầu. YOLO11 tinh chỉnh di sản này, cung cấp một kiến trúc được tối ưu hóa, nhanh hơn và chính xác hơn, đẩy mạnh giới hạn của những gì có thể thực hiện được trên các thiết bị biên.

Đối với các nhà phát triển bắt đầu các dự án mới ngày nay, YOLO11 mang đến sự cân bằng vượt trội giữa tốc độ và độ chính xác. Tuy nhiên, đối với những người yêu cầu những cải tiến mới nhất, chẳng hạn như kiểm thử đầu cuối (end-to-end), thì YOLO11 không phải là lựa chọn phù hợp. NMS Với khả năng phát hiện không cần can thiệp và các hàm mất mát được tối ưu hóa, chúng tôi đặc biệt khuyến nghị bạn nên tìm hiểu YOLO26 mới ra mắt, đại diện cho tương lai của trí tuệ nhân tạo thị giác thời gian thực.

Đọc thêm

Các Mô hình Khác để Khám phá

YOLO26 : Mẫu đồng hồ hiện đại nhất từ... Ultralytics (Tháng 1 năm 2026) có sự góp mặt của... NMS - Thiết kế miễn phí.
RT-DETR: Một bộ detect dựa trên transformer cung cấp độ chính xác cao cho các kịch bản mà tốc độ ít quan trọng hơn.
SAM 2: Mô hình Segment Anything của Meta, lý tưởng cho các tác vụ segment zero-shot.

Ultralytics YOLOv8 so với YOLO11 Sự tiến hóa kiến ​​trúc và phân tích hiệu năng