YOLO11 so với YOLOv8 Sự tiến hóa của phát hiện đối tượng thời gian thực

Sự tiến triển của YOLO Kiến trúc (You Only Look Once - YOLO) đã liên tục định nghĩa lại ranh giới của thị giác máy tính. YOLO11 , được phát hành vào cuối năm 2024, xây dựng dựa trên nền tảng vững chắc của YOLOv8 để mang lại hiệu quả và độ chính xác được nâng cao. Bài phân tích này khám phá những thay đổi về kiến trúc, các chỉ số hiệu suất và các cân nhắc triển khai thực tế cho cả hai mô hình, hướng dẫn các nhà phát triển lựa chọn tối ưu cho các ứng dụng cụ thể của họ.

Tổng quan về các chỉ số hiệu suất

Bảng sau đây nêu bật những cải tiến về hiệu suất của YOLO11 qua YOLOv8 trên nhiều kích thước mô hình khác nhau. YOLO11 thường mang lại độ chính xác trung bình cao hơn ( mAP ) đồng thời duy trì tốc độ suy luận cạnh tranh, đặc biệt khi được tối ưu hóa cho CPU thi hành.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

Tổng quan kiến trúc

Cả hai mô hình đều bắt nguồn từ Ultralytics triết lý thiết kế lấy người dùng làm trung tâm, ưu tiên tính dễ sử dụng mà không làm giảm hiệu năng. Tuy nhiên, những cải tiến về kiến trúc trong YOLO11 Cho phép khả năng trích xuất tính năng tốt hơn với ít tham số hơn.

YOLO11 Hiệu quả được tinh chỉnh

Tác giả: Glenn Jocher, Jing Qiu
Tổ chức: Ultralytics
Ngày: 27/09/2024
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLO11

YOLO11 Giới thiệu kiến trúc xương sống và cổ được cập nhật nhằm tăng cường khả năng tích hợp tính năng. Bằng cách tối ưu hóa các khối Cross Stage Partial (CSP) , YOLO11 Đạt được sự giảm đáng kể về số phép toán dấu phẩy động mỗi giây (FLOPs) đồng thời tăng hiệu suất. mAP Hiệu quả này khiến nó đặc biệt phù hợp với các môi trường hạn chế tài nguyên như các thiết bị điện toán biên .

Tìm hiểu thêm về YOLO11

YOLOv8 Tiêu chuẩn đáng tin cậy

Tác giả: Glenn Jocher, Ayush Chaurasia, Jing Qiu
Tổ chức: Ultralytics
Ngày: 10/01/2023
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv8

YOLOv8 Đây vẫn là một mẫu máy mạnh mẽ và rất linh hoạt. Nó là mẫu máy tiên phong trong việc sử dụng đầu dò không cần neo. Ultralytics Sắp xếp đội hình, đơn giản hóa quy trình huấn luyện bằng cách loại bỏ nhu cầu tính toán hộp neo thủ công. Phương pháp này đã được chứng minh hiệu quả. track Kinh nghiệm dày dặn trong nhiều ngành công nghiệp khác nhau, từ nông nghiệp đến sản xuất, khiến nó trở thành lựa chọn an toàn và đáng tin cậy cho các hệ thống cũ.

Tìm hiểu thêm về YOLOv8

Khả năng tương thích kiến trúc

Cả hai YOLO11 Và YOLOv8 được hỗ trợ nguyên bản bởi ultralytics Python gói. Việc chuyển đổi giữa chúng thường đơn giản như thay đổi chuỗi tên mô hình (ví dụ: từ yolov8n.pt đến yolo11n.pt) trong mã của bạn, giữ nguyên mã hiện có của bạn cấu hình tập dữ liệu và các quy trình đào tạo.

Ưu điểm chính của Mô hình Ultralytics

Bất kể phiên bản cụ thể nào, việc lựa chọn một Ultralytics Mô hình này mang lại những lợi ích khác biệt so với các khuôn khổ khác.

Hệ sinh thái được duy trì tốt: Cả hai mô hình đều được hưởng lợi từ sự phát triển tích cực và hỗ trợ cộng đồng. Các bản cập nhật thường xuyên đảm bảo khả năng tương thích với các phiên bản PyTorch mới nhất và CUDA , giảm thiểu nợ kỹ thuật.
Yêu cầu bộ nhớ: Ultralytics Các kỹ sư thiết kế mô hình của họ sao cho tiết kiệm bộ nhớ. So với các bộ dò dựa trên máy biến áp khổng lồ, YOLO các mô hình yêu cầu ít hơn đáng kể GPU bộ nhớ ảo (VRAM) trong quá trình huấn luyện, giúp các nhà phát triển có thể truy cập chúng bằng phần cứng cấp người tiêu dùng.
Tính linh hoạt: Ngoài các hộp giới hạn đơn giản, cả hai kiến trúc đều hỗ trợ Phân đoạn đối tượng , Ước tính tư thế , OBB (Hộp giới hạn định hướng) và Phân loại.
Hiệu quả luyện tập: Tạ đã được huấn luyện sẵn có sẵn, cho phép chuyển giao kiến thức, giúp giảm đáng kể thời gian luyện tập và năng lượng tiêu hao.

Các trường hợp sử dụng thực tế

Sự lựa chọn giữa YOLO11 Và YOLOv8 Điều này thường phụ thuộc vào các ràng buộc cụ thể của môi trường triển khai.

Nơi YOLO11 vượt trội

YOLO11 Đây là lựa chọn tối ưu cho các ứng dụng biên nhạy cảm với độ trễ . Số lượng tham số giảm và số phép tính FLOP thấp hơn giúp suy luận nhanh hơn trên CPU và bộ xử lý di động.

Bán lẻ thông minh: Phân tích hành vi khách hàng theo thời gian thực trên máy chủ cửa hàng mà không cần GPU chuyên dụng.
Hình ảnh từ máy bay không người lái: Xử lý cảnh quay trên không độ phân giải cao, nơi mỗi mili giây thời lượng pin đều rất quan trọng. Khả năng phát hiện vật thể nhỏ được cải thiện là yếu tố then chốt ở đây.
Ứng dụng di động: Triển khai thông qua CoreML hoặc TFLite iOS Và Android Các thiết bị được hưởng lợi từ kiến trúc nhẹ hơn.

Ở đâu YOLOv8 Vẫn vững mạnh

YOLOv8 Đây là giải pháp lý tưởng cho các quy trình làm việc đã được thiết lập, nơi tính nhất quán là yếu tố tối quan trọng.

Tự động hóa công nghiệp: Trong các nhà máy đã được tiêu chuẩn hóa về YOLOv8 Để đảm bảo chất lượng , việc tiếp tục sử dụng phiên bản v8 giúp tránh việc phải xác nhận lại toàn bộ quy trình.
Nghiên cứu học thuật: Là cơ sở tham khảo được trích dẫn nhiều, YOLOv8 Nó đóng vai trò là điểm tham chiếu tuyệt vời để so sánh những cải tiến kiến trúc mới.

Dễ sử dụng và triển khai

Một trong những đặc điểm nổi bật của Ultralytics Hệ sinh thái là API thống nhất. Các nhà phát triển có thể huấn luyện, xác thực và triển khai một trong hai mô hình bằng cú pháp giống hệt nhau.

from ultralytics import YOLO

# Load a model (switch 'yolo11n.pt' to 'yolov8n.pt' to use v8)
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a local image
results = model("path/to/image.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

Sự đơn giản này cũng được thể hiện ở giao diện dòng lệnh ( CLI ) , cho phép tạo mẫu nhanh chóng mà không cần viết một dòng mã nào. Python .

# Train YOLO11n
yolo train model=yolo11n.pt data=coco8.yaml epochs=50 imgsz=640

# Train YOLOv8n
yolo train model=yolov8n.pt data=coco8.yaml epochs=50 imgsz=640

Kết luận

Cả YOLO11 và YOLOv8 đều đại diện cho đỉnh cao của công nghệ phát hiện đối tượng thời gian thực. YOLOv8 vẫn là một công cụ đáng tin cậy và linh hoạt, hoàn hảo cho các ứng dụng đa năng. Tuy nhiên, YOLO11 còn vượt trội hơn nữa với hiệu quả được tối ưu hóa, khiến nó trở thành điểm khởi đầu được khuyến nghị cho các dự án mới—đặc biệt là những dự án nhắm đến các thiết bị biên hoặc yêu cầu tỷ lệ độ chính xác trên hiệu năng cao nhất có thể.

Dành cho các nhà phát triển đang tìm kiếm hiệu năng tiên tiến nhất và NMS Ngoài kiến trúc không phụ thuộc vào module, chúng tôi cũng khuyên bạn nên tìm hiểu về YOLO26 mới ra mắt. Nó kết hợp những đặc điểm tốt nhất của các thế hệ trước với thiết kế đầu cuối giúp đơn giản hóa việc triển khai hơn nữa.

Khám phá các Mô hình Khác

YOLO26 : Mẫu sản phẩm mới nhất, hiện đại nhất với đầy đủ các tính năng từ đầu đến cuối. NMS - Phát hiện miễn phí và nhanh hơn 43% CPU suy luận.
RT-DETR : Một mô hình dựa trên biến áp cung cấp độ chính xác cao, lý tưởng khi tốc độ suy luận không quan trọng bằng độ chính xác.
SAM 2 : Mô hình phân đoạn mọi thứ của Meta, hoàn hảo cho các tác vụ phân đoạn không cần dữ liệu huấn luyện khi dữ liệu huấn luyện khan hiếm.