YOLO11 So với YOLO26: Sự tiến hóa của phát hiện đối tượng thời gian thực

Lĩnh vực thị giác máy tính liên tục thay đổi, với mỗi phiên bản mô hình mới đều đẩy mạnh giới hạn về tốc độ, độ chính xác và khả năng sử dụng. Hai cột mốc quan trọng trong hành trình này là YOLO11 và YOLO26 đột phá. Trong khi đó, YOLO11 Được thiết lập như một tiêu chuẩn mạnh mẽ cho việc triển khai trong doanh nghiệp vào cuối năm 2024, YOLO26 đại diện cho một sự thay đổi mang tính đột phá với kiến trúc đầu cuối tích hợp sẵn. CPU - Thiết kế tối ưu.

Hướng dẫn này cung cấp một bảng so sánh kỹ thuật toàn diện để giúp các nhà phát triển, nhà nghiên cứu và kỹ sư lựa chọn công cụ phù hợp cho các ứng dụng thị giác máy tính cụ thể của họ.

Tóm tắt: Những điểm khác biệt chính

Mặc dù cả hai mô hình đều được xây dựng dựa trên các nguyên tắc nền tảng của... YOLO (Bạn Chỉ Nhìn Một Lần) là một gia đình, nhưng triết lý kiến trúc của họ lại khác biệt đáng kể.

YOLO11 : Được xây dựng cho tính linh hoạt và khả năng tích hợp hệ sinh thái. Nó dựa trên các phương pháp xử lý hậu kỳ truyền thống như Non-Maximum Suppression (Suppression không tối đa) NMS ) nhưng lại cung cấp một khung làm việc ổn định và được hỗ trợ tốt cho nhiều loại nhiệm vụ khác nhau.
YOLO26: Được thiết kế cho điện toán biên và khả năng đáp ứng nhu cầu tương lai. Sản phẩm này giới thiệu thiết kế hoàn toàn không cần NMS , loại bỏ các bước xử lý hậu kỳ phức tạp. Nó cũng tích hợp trình tối ưu hóa MuSGD tiên tiến và được thiết kế đặc biệt cho... CPU quá trình suy luận giúp tăng tốc độ lên tới 43% trên các thiết bị như Raspberry Pi.

Phân tích hiệu năng chi tiết

Khoảng cách hiệu năng giữa các thế hệ thường được đo bằng mili giây và phần trăm điểm của Độ chính xác trung bình ( mAP ) . Bảng dưới đây nêu bật những cải tiến về tốc độ và độ chính xác. Lưu ý sự giảm đáng kể về CPU Thời gian suy luận của YOLO26, một chỉ số quan trọng cho việc triển khai AI tại biên .

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLO11 Tiêu chuẩn đa năng

YOLO11
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 27/09/2024
GitHub: Kho lưu trữ Ultralytics

YOLO11 đại diện cho một sự cải tiến lớn trong YOLO Phiên bản này tập trung vào hiệu quả trích xuất đặc trưng. Nó đã cải tiến YOLOv8 bằng cách tối ưu hóa khối C3k2 và giới thiệu các cải tiến SPPF.

Điểm mạnh:

Độ bền đã được chứng minh: Được sử dụng rộng rãi trong ngành, với cộng đồng người dùng đóng góp và hỗ trợ mạnh mẽ.
Tối ưu hóa GPU : Hiệu quả cao trên NVIDIA GPU (T4, A100) sử dụng TensorRT , rất phù hợp cho suy luận dựa trên đám mây.
Tính linh hoạt trong tác vụ: Hiệu năng mạnh mẽ trong phát hiện, phân đoạn và ước lượng tư thế .

Điểm yếu:

Sự phụ thuộc vào NMS : Yêu cầu xử lý hậu kỳ Non-Maximum Suppression, điều này có thể gây ra sự biến động về độ trễ và làm phức tạp quy trình triển khai.
Số phép tính FLOP cao hơn: Tốn kém hơn một chút về mặt tính toán so với các kiến trúc mới nhất.

Tìm hiểu thêm về YOLO11

YOLO26: Nhà đổi mới tiên phong

YOLO26
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 14/01/2026
GitHub: Kho lưu trữ Ultralytics

YOLO26 là một kiến trúc hướng tới tương lai, ưu tiên hiệu quả trên phần cứng thông thường. Bằng cách loại bỏ nhu cầu về... NMS và tối ưu hóa cho CPU Với các bộ lệnh hướng dẫn, nó mở khóa khả năng hoạt động theo thời gian thực trên các thiết bị trước đây được coi là quá chậm đối với trí tuệ nhân tạo hiện đại.

Những cải tiến chính:

NMS từ đầu đến cuối - Miễn phí: Bằng cách dự đoán trực tiếp các trận đấu một đối một, YOLO26 loại bỏ... NMS nút thắt cổ chai. Điều này giúp đơn giản hóa việc xuất sang ONNX hoặc CoreML đáng kể.
Loại bỏ DFL: Việc loại bỏ hiện tượng suy hao tiêu điểm phân phối giúp tối ưu hóa đầu ra, tăng cường khả năng tương thích với các thiết bị biên công suất thấp.
Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Mô hình Ngôn ngữ Lớn (LLM) (cụ thể là Kimi K2 của Moonshot AI), bộ tối ưu hóa lai này kết hợp SGD với Muon để hội tụ nhanh hơn và ổn định hơn.
ProgLoss + STAL: Các hàm mất mát mới cải thiện khả năng phát hiện vật thể nhỏ , một yêu cầu quan trọng đối với ảnh chụp từ trên không và robot.

Tìm hiểu thêm về YOLO26

Tìm hiểu sâu về kiến trúc

Sự chuyển đổi từ YOLO11 Việc chuyển sang YOLO26 không chỉ đơn thuần là vấn đề số lượng tham số; đó là một sự thay đổi cơ bản trong cách mô hình học hỏi và dự đoán.

Phương pháp đào tạo và hiệu quả

Một trong những tính năng nổi bật của Ultralytics Hiệu quả đào tạo của cả hai mô hình đều được cải thiện nhờ nền tảng Ultralytics tích hợp, cho phép quản lý tập dữ liệu và đào tạo trên đám mây một cách liền mạch.

Tuy nhiên, YOLO26 giới thiệu trình tối ưu hóa MuSGD , giúp điều chỉnh các cập nhật động lượng để xử lý hiệu quả hơn các cấu trúc hàm mất mát phức tạp của các mô hình thị giác so với các phương pháp tiêu chuẩn. AdamW hoặc SGD Điều này giúp các mô hình hội tụ nhanh hơn, tiết kiệm được thời gian và công sức quý báu. GPU tính toán số giờ làm việc và giảm lượng khí thải carbon trong quá trình đào tạo.

Ngoài ra, YOLO26 sử dụng các hàm mất mát được cải tiến dành riêng cho từng nhiệm vụ:

Phân đoạn: Tổn thất phân đoạn ngữ nghĩa được nâng cao và các mô-đun nguyên mẫu đa tỷ lệ.
Tư thế: Ước lượng logarit xác suất dư (RLE) để định vị điểm mấu chốt chính xác hơn.
OBB: Phương pháp tính toán góc mất mát chuyên biệt để giải quyết các điểm gián đoạn ranh giới trong các tác vụ hộp giới hạn định hướng (Oriented Bounding Box ).

Yêu cầu bộ nhớ

Ultralytics YOLO Các mô hình này nổi tiếng với mức tiêu thụ bộ nhớ thấp so với các kiến trúc dựa trên bộ chuyển đổi như RT-DETR hoặc SAM 2 .

Tối ưu hóa bộ nhớ

Cả hai YOLO11 và YOLO26 được thiết kế để huấn luyện trên GPU cấp độ người tiêu dùng (ví dụ: NVIDIA RTX 3060 hoặc 4070). Không giống như các mô hình Transformer khổng lồ đòi hỏi VRAM từ 24GB trở lên, các mô hình hiệu quả YOLO Kiến trúc thường có thể được tinh chỉnh trên các thiết bị chỉ có 8GB VRAM bằng cách sử dụng kích thước lô phù hợp.

Các trường hợp sử dụng thực tế

Lựa chọn giữa YOLO11 Và YOLO26 thường phụ thuộc vào phần cứng triển khai và nhu cầu ứng dụng cụ thể của bạn.

Các kịch bản lý tưởng cho YOLO11

Dịch vụ API đám mây: Nơi có sẵn các GPU mạnh mẽ và thông lượng cao (xử lý theo lô) quan trọng hơn độ trễ của từng hình ảnh riêng lẻ.
Tích hợp hệ thống cũ: Các hệ thống đã được xây dựng dựa trên... NMS các quy trình dựa trên đó việc thay đổi logic xử lý hậu kỳ là không khả thi.
Phân tích đa năng: Lập bản đồ nhiệt bán lẻ hoặc đếm số lượng khách hàng theo tiêu chuẩn thông thường. GPU Các máy chủ đang được sử dụng.

Các kịch bản lý tưởng cho YOLO26

IoT và các thiết bị biên: Thực hiện phát hiện đối tượng trên Raspberry Pi . NVIDIA Jetson Nano, hay điện thoại di động. 43% CPU Việc tăng tốc độ là yếu tố thay đổi cuộc chơi ở đây.
Robot học: Sự biến thiên độ trễ là yếu tố gây hại nghiêm trọng cho các vòng điều khiển. NMS - Thiết kế không phụ thuộc vào ngôn ngữ lập trình đảm bảo thời gian suy luận chính xác, điều rất quan trọng đối với khả năng điều hướng tự động .
Khảo sát trên không: Chức năng ProgLoss giúp tăng cường đáng kể khả năng nhận diện vật thể nhỏ, làm cho YOLO26 trở nên vượt trội trong việc phân tích cảnh quay từ máy bay không người lái.
Hệ thống nhúng: Các thiết bị có khả năng tính toán hạn chế, không thể đáp ứng được chi phí xử lý hàng nghìn hộp ứng cử viên trong quá trình phân loại. NMS .

Triển khai Mã nguồn

Cả hai mẫu đều có chung đặc điểm dễ sử dụng , điều này định nghĩa nên... Ultralytics hệ sinh thái. Chuyển đổi từ YOLO11 Để chuyển sang YOLO26, chỉ cần thay đổi chuỗi model.

from ultralytics import YOLO

# Load the latest YOLO26 model (NMS-free, CPU optimized)
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Process results
for result in results:
    result.show()  # Display to screen
    result.save(filename="result.jpg")  # Save to disk

API thống nhất này đảm bảo các nhà phát triển có thể thử nghiệm với các kiến trúc khác nhau mà không cần viết lại toàn bộ mã nguồn.

Kết luận

Cả hai kiến trúc đều chứng minh lý do tại sao Ultralytics YOLO11 vẫn là đơn vị dẫn đầu trong lĩnh vực thị giác máy tính mã nguồn mở. YOLO11 cung cấp một nền tảng hoàn thiện, linh hoạt và... GPU -Giải pháp tối ưu hóa hoàn hảo cho các trung tâm dữ liệu doanh nghiệp. Tuy nhiên, YOLO26 đại diện cho tương lai của AI biên, mang lại tốc độ cực nhanh. CPU hiệu suất và quy trình đầu cuối được đơn giản hóa, loại bỏ các điểm nghẽn truyền thống.

Đối với hầu hết các dự án mới—đặc biệt là những dự án liên quan đến triển khai tại biên, ứng dụng di động hoặc robot —YOLO26 là lựa chọn được khuyến nghị nhờ tỷ lệ tốc độ trên độ chính xác vượt trội và thiết kế kiến trúc hiện đại.

Các Mô hình Khác để Khám phá

YOLOv10 : Người tiên phong của NMS - cách tiếp cận miễn phí trong YOLO gia đình.
RT-DETR : Một thiết bị dò dựa trên biến áp, cung cấp độ chính xác cao cho các trường hợp tốc độ không phải là yếu tố quan trọng.
YOLOv8 : Một hệ điều hành kinh điển có độ tin cậy cao, vẫn được sử dụng rộng rãi nhờ thư viện tài nguyên khổng lồ.