YOLO26 vs YOLO11 Bước tiến vượt bậc về trí tuệ nhân tạo thị giác
Khi xây dựng các hệ thống thị giác máy tính hiện đại, việc lựa chọn mô hình phù hợp là rất quan trọng để cân bằng độ chính xác, độ trễ và hiệu quả tài nguyên. Trong bối cảnh trí tuệ nhân tạo đang phát triển nhanh chóng, Ultralytics tiếp tục vượt qua những giới hạn của những điều có thể. Bản so sánh kỹ thuật chi tiết này khám phá quá trình chuyển đổi từ YOLO11 rất thành công sang YOLO26 mới mang tính cách mạng, cung cấp cho các kỹ sư và nhà nghiên cứu AI những hiểu biết cần thiết để đưa ra các quyết định kiến trúc sáng suốt.
Nguồn gốc và siêu dữ liệu của mô hình
Cả hai mô hình đều được phát triển bởi Ultralytics, nhưng chúng đại diện cho các mô hình khác nhau trong dòng thời gian của phát hiện đối tượng và các mô hình thị giác đa nhiệm.
Chi tiết YOLO26:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2026-01-14
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu chính thức của YOLO26
YOLO11 Chi tiết:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2024-09-27
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu chính thức của YOLO11
Các kiến trúc khác
Mặc dù YOLO26 là mô hình thời gian thực tiên tiến nhất của chúng tôi, nhưng người dùng sử dụng phần cứng chuyên dụng cao hoặc dung lượng bộ nhớ lớn cũng có thể tìm hiểu các kiến trúc dựa trên Transformer như RT-DETR hoặc các công nghệ đột phá khác. NMS - Phiên bản tiên phong miễn phí, YOLOv10 .
Sự khác biệt và Đổi mới kiến trúc
Bước nhảy vọt từ YOLO11 Việc chuyển sang YOLO26 đòi hỏi những thay đổi cơ bản cả về kiến trúc mô hình và chế độ huấn luyện cơ bản. Trong khi đó, YOLO11 Được thiết lập trên nền tảng vững chắc cho việc phát hiện đối tượng và học đa nhiệm, YOLO26 đã hoàn toàn cải tiến quy trình triển khai cho điện toán biên.
Thiết kế không NMS đầu cuối
Một trong những nâng cấp quan trọng nhất trong YOLO26 là kiến trúc đầu cuối hoàn chỉnh của nó. Không giống như... YOLO11 Trong khi YOLO26 dựa vào xử lý hậu kỳ Non-Maximum Suppression ( NMS ) để lọc các hộp giới hạn chồng chéo, YOLO26 loại bỏ hoàn toàn bước này. Khái niệm này, lần đầu tiên được tiên phong trong YOLOv10 , giúp giảm đáng kể sự biến động về độ trễ và đơn giản hóa logic triển khai trên nhiều thiết bị biên khác nhau.
Loại bỏ DFL để Tăng Hiệu quả trên Thiết bị Biên
YOLO11 YOLO26 sử dụng Distribution Focal Loss (DFL) để tinh chỉnh ước tính hộp giới hạn. Tuy nhiên, DFL dựa trên các phép toán softmax phức tạp, thường không được hỗ trợ tốt bởi các bộ tăng tốc biên công suất thấp. YOLO26 đã loại bỏ thành công DFL mà không làm giảm độ chính xác. Việc đơn giản hóa kiến trúc này giúp cải thiện đáng kể khả năng tương thích với các hệ thống nhúng và cho phép YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với phiên bản tiền nhiệm.
Trình tối ưu hóa MuSGD
Tính ổn định và tốc độ huấn luyện là tối quan trọng. YOLO26 giới thiệu Trình tối ưu hóa MuSGD , một sự kết hợp giữa Thuật toán Gradient Descent ngẫu nhiên (Stochastic Gradient Descent) SGD ) và Muon, lấy cảm hứng mạnh mẽ từ những cải tiến trong huấn luyện LLM của Kimi K2 thuộc Moonshot AI. Trình tối ưu hóa này mang lại sự ổn định cho việc huấn luyện mô hình ngôn ngữ trong thị giác máy tính, đảm bảo sự hội tụ nhanh hơn và giảm thiểu lượng bộ nhớ sử dụng trong quá trình huấn luyện so với các giải pháp thay thế transformer nặng nề hơn.
ProgLoss và STAL
Đối với các nhà nghiên cứu làm việc với ảnh chụp từ trên không hoặc các ứng dụng máy bay không người lái, việc phát hiện các chi tiết nhỏ là một thách thức lớn. YOLO26 giới thiệu ProgLoss kết hợp với STAL (Scale-Targeted Attention Loss), mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ so với trước đây. YOLO11 .
So sánh hiệu năng và số liệu
Khi so sánh trực tiếp các mô hình, YOLO26 thể hiện sự vượt trội rõ rệt về độ chính xác và hiệu quả thiết bị biên, đồng thời vẫn duy trì yêu cầu bộ nhớ cực thấp đặc trưng của dòng sản phẩm này. Ultralytics hệ sinh thái.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Lưu ý: Mẫu YOLO26 nano (YOLO26n) cho thấy sự cải thiện khoảng 31% về CPU Tốc độ được so sánh với YOLO11n (38,9ms so với 56,1ms), làm nổi bật triết lý thiết kế ưu tiên cạnh của nó.
Tính linh hoạt trong các tác vụ thị giác máy tính
Cả hai mô hình đều hưởng lợi từ hệ sinh thái Ultralytics được bảo trì tốt, mang lại sự dễ sử dụng vượt trội thông qua một API Python thống nhất. Chúng không chỉ là các bộ detect vật thể; chúng là những cỗ máy đa tác vụ mạnh mẽ. Tuy nhiên, YOLO26 tích hợp một số cải tiến dành riêng cho từng tác vụ:
- Phân đoạn đối tượng: YOLO26 sử dụng hàm mất mát phân đoạn ngữ nghĩa tinh chỉnh và tạo mẫu đa tỷ lệ, tạo ra các đường biên mặt nạ sắc nét hơn so với YOLO11. Tìm hiểu thêm về quy trình làm việc phân đoạn.
- Ước tính Tư thế: Bằng cách tích hợp Ước tính Log-Likelihood Phần dư (RLE), YOLO26 cải thiện đáng kể độ chính xác của điểm khóa trong các tư thế người phức tạp. Khám phá khả năng ước tính tư thế.
- Hộp giới hạn định hướng (OBB): Một hàm mất mát góc chuyên biệt giải quyết các vấn đề gián đoạn ranh giới lịch sử, giúp YOLO26 cực kỳ đáng tin cậy trong việc detect các vật thể xoay trong ảnh vệ tinh. Đọc về các tác vụ OBB.
- Phân loại hình ảnh: Cả hai mô hình đều xử lý phân loại tốc độ cao một cách hiệu quả, với YOLO26 mang lại những cải thiện nhỏ về độ chính xác top-1 trên ImageNet.
Ví dụ mã huấn luyện và suy luận
Ultralytics Nền tảng này nổi tiếng về trải nghiệm dành cho nhà phát triển. Việc huấn luyện một mô hình SOTA hoặc chạy một kịch bản suy luận chỉ cần một vài dòng mã, giảm thiểu mã lặp lại và tối đa hóa năng suất. Hơn nữa, việc huấn luyện YOLO Các mô hình này yêu cầu lượng bộ nhớ CUDA ít hơn đáng kể so với các mạng biến áp lớn.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()
Các trường hợp sử dụng lý tưởng và chiến lược triển khai
Việc lựa chọn giữa YOLO26 và YOLO11 phụ thuộc hoàn toàn vào các ràng buộc của môi trường sản xuất của bạn.
Khi nào nên triển khai YOLO26
YOLO26 là sự lựa chọn tối ưu cho các dự án hiện đại, xây dựng mới. Nó được thiết kế đặc biệt cho:
- Điện toán biên và IoT: Hiệu suất CPU đáng kinh ngạc và việc loại bỏ DFL khiến nó trở thành lựa chọn hàng đầu cho các thiết bị như Raspberry Pi, Coral NPUs và bộ xử lý di động.
- Phân tích từ Drone và Trên không: Việc tích hợp ProgLoss + STAL giúp nó có khả năng độc đáo trong việc track các vật thể nhỏ, di chuyển nhanh trên các cảnh quan rộng lớn.
- Các ứng dụng quan trọng về độ trễ: Trong robot tự hành hoặc kiểm soát chất lượng sản xuất, thiết kế không NMS đảm bảo độ trễ xác định mà không có các đột biến hậu xử lý không mong muốn.
Khi nào nên giữ lại YOLO11
Mặc dù YOLO26 vượt trội hơn, YOLO11 vẫn là một mẫu xe cực kỳ mạnh mẽ. Bạn có thể tiếp tục sử dụng. YOLO11 nếu như:
- Các pipeline cũ: Cơ sở hạ tầng triển khai C++ hiện có của bạn được kết nối chặt chẽ với các đầu ra dựa trên neo và logic NMS cụ thể của các kiến trúc cũ hơn.
- Academic Baselines: Bạn đang công bố nghiên cứu và cần một tiêu chuẩn năm 2024 được công nhận rộng rãi để so sánh các thuật toán mới của mình.
Sức mạnh của Ultralytics Hệ sinh thái
Bất kể bạn có triển khai hay không YOLO11 hoặc YOLO26, sử dụng Ultralytics Việc sử dụng mô hình này đồng nghĩa với việc tận dụng một hệ sinh thái được duy trì tốt , thường xuyên cập nhật và nhận được sự hỗ trợ rộng rãi từ cộng đồng.
Đối với các nhóm doanh nghiệp, Nền tảng Ultralytics cung cấp giải pháp toàn diện từ chú thích dữ liệu , huấn luyện mô hình đến triển khai đám mây liền mạch. Từ việc xuất trọng số đã huấn luyện sang CoreML hoặc TensorRT , đến việc cấu hình tinh chỉnh siêu tham số nâng cao, các công cụ được cung cấp đảm bảo vòng đời AI của bạn được tối ưu hóa nhất có thể.