YOLO11 vs YOLO26: Sự tiến hóa của trí tuệ nhân tạo thị giác thế hệ tiếp theo
Sự phát triển nhanh chóng của thị giác máy tính liên tục đẩy giới hạn về tốc độ, độ chính xác và hiệu quả triển khai. Trong lĩnh vực phát hiện đối tượng thời gian thực, Ultralytics luôn thiết lập tiêu chuẩn. Bài so sánh kỹ thuật này khám phá quá trình chuyển đổi từ YOLO11 rất thành công sang YOLO26 tiên tiến, phân tích kiến trúc, các chỉ số hiệu suất và các kịch bản triển khai lý tưởng của chúng.
Cho dù bạn đang xây dựng hệ thống giao hàng bằng máy bay không người lái hay tối ưu hóa quy trình sản xuất thông minh toàn cầu, việc hiểu rõ những khác biệt tinh tế giữa hai mô hình này sẽ giúp bạn xây dựng các giải pháp AI mạnh mẽ, có khả năng đáp ứng nhu cầu trong tương lai.
Dòng dõi và hệ sinh thái mẫu
Cả hai mô hình đều được hưởng lợi từ hệ sinh thái toàn diện Ultralytics , đặc trưng bởi API đơn giản, bảo trì liên tục và cộng đồng năng động. Chúng cung cấp tính linh hoạt vượt trội, hỗ trợ tự nhiên các tác vụ phát hiện đối tượng , phân đoạn thể hiện , phân loại hình ảnh , ước tính tư thế và hộp giới hạn định hướng (OBB) ngay từ đầu.
YOLO11 Tiêu chuẩn đã được thiết lập
Ra mắt vào cuối năm 2024, YOLO11 Nó đã tinh chỉnh những tiến bộ của các thế hệ trước, củng cố vị thế của mình như một công cụ đáng tin cậy cho môi trường sản xuất.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Tài liệu:Tài liệu YOLO11
YOLO26: Biên giới mới
Được giới thiệu vào đầu năm 2026, YOLO26 đại diện cho một sự thay đổi mang tính đột phá trong điện toán biên và kiến trúc đầu cuối, mang lại những cải tiến đáng kể về tốc độ xử lý và tính dễ dàng tích hợp.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Tài liệu:Tài liệu YOLO26
Quản lý dữ liệu và triển khai
Cả hai YOLO11 và YOLO26 được tích hợp hoàn toàn với Nền tảng Ultralytics , cung cấp quy trình làm việc liền mạch, không cần lập trình cho việc chú thích dữ liệu, huấn luyện trên đám mây và giám sát đội xe.
Đổi mới Kiến trúc
Trong khi YOLO11 Dựa trên các phương pháp xử lý hậu kỳ truyền thống đã được sử dụng trong lĩnh vực thị giác máy tính nhiều năm, YOLO26 giới thiệu một số đột phá về cấu trúc được thiết kế để loại bỏ các điểm nghẽn.
Thiết kế không NMS đầu cuối
Một trong những nâng cấp quan trọng nhất trong YOLO26 là kiến trúc end-to-end nguyên bản của nó. Nó loại bỏ hiện tượng Non-Maximum Suppression (bỏ qua các giá trị tối đa không cần thiết). NMS ) xử lý hậu kỳ, một khái niệm lần đầu tiên được tiên phong trong YOLOv10 . Bỏ qua NMS Nó đơn giản hóa đáng kể quy trình triển khai và đảm bảo độ trễ ổn định, điều này rất cần thiết cho các ứng dụng thời gian thực như thuật toán lái xe tự động .
Loại bỏ DFL để tối ưu hóa cạnh
YOLO26 loại bỏ hiện tượng mất tiêu điểm phân bố (Distribution Focal Loss - DFL). Mặc dù DFL hữu ích trong... YOLO11 Đối với việc định vị chính xác hơn, việc loại bỏ nó sẽ đơn giản hóa biểu đồ xuất của mạng. Sự điều chỉnh này đảm bảo khả năng tương thích nâng cao với phần cứng công suất thấp, biến YOLO26 thành một công cụ mạnh mẽ tuyệt đối trên các thiết bị biên như Raspberry Pi hoặc NVIDIA Jetson .
Trình tối ưu hóa MuSGD
Lấy cảm hứng từ các cơ chế huấn luyện Mô hình Ngôn ngữ Lớn (LLM), đặc biệt là Kimi K2 của Moonshot AI , YOLO26 sử dụng Trình tối ưu hóa MuSGD mang tính cách mạng. Sự kết hợp này giữa Thuật toán Giảm độ dốc ngẫu nhiên (Stochastic Gradient Descent) ( SGD (và Muon) cung cấp các lần chạy huấn luyện cực kỳ ổn định, hội tụ nhanh hơn nhiều so với phương pháp tiêu chuẩn. AdamW Các công cụ tối ưu hóa được sử dụng trong các kiến trúc cũ hơn.
Các hàm tổn thất nâng cao
YOLO26 tích hợp ProgLoss + STAL (Progressive Loss and Scale-Aware Task Alignment Learning). Sự kết hợp này cải thiện đáng kể khả năng phát hiện các đối tượng nhỏ và có mật độ cao. Hơn nữa, YOLO26 giới thiệu các cải tiến dành riêng cho từng nhiệm vụ: một nguyên mẫu đa tỷ lệ chuyên dụng cho phân đoạn ngữ nghĩa, ước lượng logarit xác suất dư (Residual Log-Likelihood Estimation - RLE) cho ước lượng tư thế người phức tạp và một hàm mất mát góc chuyên dụng để giảm thiểu các vấn đề về ranh giới trong các nhiệm vụ phát hiện OBB.
So sánh hiệu suất
Khi đánh giá các mô hình này, sự cân bằng giữa số lượng tham số, độ phức tạp tính toán (FLOPs) và tốc độ sẽ quyết định việc lựa chọn phần cứng. YOLO26 đặc biệt nhắm đến mục tiêu này. CPU Tốc độ suy luận được cải thiện, đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với thế hệ tiền nhiệm.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Như đã chứng minh, độ chính xác của YOLO26 Nano (YOLO26n) tăng lên đáng kể trong quá trình cắt lát. CPU Thời gian suy luận giảm từ 56,1ms xuống 38,9ms khi sử dụng ONNX Runtime .
Xuất dữ liệu để đạt tốc độ tối đa
Để tận dụng tối đa hiệu năng của các mô hình này, hãy xuất chúng bằng TensorRT . NVIDIA phần cứng hoặc OpenVINO cho Intel CPU. Các NMS - Thiết kế miễn phí của YOLO26 giúp quá trình xuất dữ liệu trở nên mượt mà hơn bao giờ hết.
Các trường hợp sử dụng và Ứng dụng thực tế
Lựa chọn giữa YOLO11 Và YOLO26 phần lớn phụ thuộc vào cơ sở hạ tầng cụ thể và mục tiêu dự án của bạn.
Điện toán biên và IoT
Đối với các ứng dụng bị hạn chế về nguồn điện và phần cứng, chẳng hạn như giám sát nông nghiệp thông minh bằng máy bay không người lái hoặc hệ thống báo động an ninh cục bộ, YOLO26 là lựa chọn không thể tranh cãi. Việc loại bỏ DFL và mức tăng 43% CPU Tốc độ này cho phép bạn chạy các mô hình xử lý hình ảnh phức tạp trên các thiết bị không có GPU chuyên dụng mà vẫn duy trì tốc độ khung hình cao.
Điện toán đám mây và quy mô doanh nghiệp
YOLO11 vẫn là lựa chọn tuyệt vời cho các giải pháp doanh nghiệp, nơi mà các trung tâm máy chủ khổng lồ đã được tối ưu hóa cho nó. tensor Nó có cấu trúc phù hợp. Nó hoạt động hoàn hảo cho việc phân tích video dựa trên đám mây và các quy trình xử lý phương tiện truyền thông quy mô lớn đã được tích hợp sâu với các định dạng đầu ra cụ thể của nó.
Đa nhiệm phức tạp
Nếu dự án của bạn yêu cầu độ chính xác tuyệt đối trên các vật thể nhỏ - chẳng hạn như phát hiện lỗi trên bảng mạch hoặc theo dõi các phương tiện ở xa trong ảnh chụp từ trên không - thì việc triển khai ProgLoss + STAL trong YOLO26 sẽ mang lại sự cải thiện đáng kể về khả năng thu hồi và độ chính xác cho những trường hợp khó xử lý này.
Hiệu quả đào tạo và yêu cầu về bộ nhớ
Một lợi thế lớn của Ultralytics Điểm mạnh của framework này là mức tiêu thụ bộ nhớ cực thấp trong quá trình huấn luyện. Không giống như các bộ chuyển đổi hình ảnh khổng lồ như RT-DETR hoặc YOLOv8 cũ hơn, vốn có thể tiêu tốn một lượng bộ nhớ khổng lồ... CUDA bộ nhớ, cả hai YOLO11 và YOLO26 được tối ưu hóa để huấn luyện hiệu quả trên phần cứng dành cho người tiêu dùng.
Việc tích hợp trình tối ưu hóa MuSGD vào YOLO26 càng làm tăng thêm hiệu quả này bằng cách đảm bảo mô hình tìm ra trọng số tối ưu nhanh hơn, giảm tổng thời gian xử lý. GPU Số giờ tính toán và chi phí điện toán đám mây .
Dưới đây là một ví dụ đơn giản minh họa việc huấn luyện mô hình YOLO26 mới nhất dễ dàng như thế nào bằng cách sử dụng mã gốc. Python API:
from ultralytics import YOLO
# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Run a quick validation to verify the mAP metrics
metrics = model.val()
# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")
Khám phá các kiến trúc thay thế
Mặc dù YOLO26 đại diện cho đỉnh cao của khả năng phát hiện thời gian thực, việc khám phá các mô hình khác trong lĩnh vực này cũng rất đáng quan tâm. Ultralytics Tài liệu hướng dẫn có thể rất hữu ích. Đối với người dùng đang sử dụng môi trường cũ, các kiến trúc đời đầu như YOLOv5 vẫn cung cấp hiệu năng mạnh mẽ. Đối với các khả năng không cần huấn luyện trước, khi việc định nghĩa các lớp không khả thi, YOLO -World cung cấp khả năng phát hiện từ vựng mở dựa trên lời nhắc văn bản.
Kết luận
Bước nhảy từ YOLO11 Việc nâng cấp lên YOLO26 không chỉ đơn thuần là một bản cập nhật nhỏ; đó là sự tái cấu trúc toàn diện về cách thức hoạt động của các mô hình phát hiện đối tượng thời gian thực trong môi trường sản xuất. Bằng cách loại bỏ các bước xử lý hậu kỳ phức tạp và tối ưu hóa cho việc thực thi ưu tiên trên thiết bị biên, YOLO26 nổi bật như một lựa chọn hàng đầu dành cho các nhà phát triển hiện đại. Được hỗ trợ bởi hệ sinh thái Ultralytics mạnh mẽ và tài liệu toàn diện, việc nâng cấp lên YOLO26 đảm bảo triển khai nhanh hơn, huấn luyện ổn định và độ chính xác hàng đầu cho hầu hết mọi tác vụ thị giác máy tính.