Chuyển đến nội dung

YOLO26 vs YOLO11 Bước tiến vượt bậc về trí tuệ nhân tạo thị giác

Khi xây dựng các hệ thống thị giác máy tính hiện đại, việc lựa chọn mô hình phù hợp là rất quan trọng để cân bằng độ chính xác, độ trễ và hiệu quả tài nguyên. Trong bối cảnh trí tuệ nhân tạo đang phát triển nhanh chóng, Ultralytics tiếp tục vượt qua những giới hạn của những điều có thể. Bản so sánh kỹ thuật chi tiết này khám phá quá trình chuyển đổi từ YOLO11 rất thành công sang YOLO26 mới mang tính cách mạng, cung cấp cho các kỹ sư và nhà nghiên cứu AI những hiểu biết cần thiết để đưa ra các quyết định kiến ​​trúc sáng suốt.

Nguồn gốc và siêu dữ liệu của mô hình

Cả hai mô hình đều được phát triển bởi Ultralytics nhưng chúng đại diện cho các mô hình khác nhau trong dòng thời gian của phát hiện đối tượng và mô hình thị giác đa nhiệm.

Chi tiết YOLO26:

Tìm hiểu thêm về YOLO26

YOLO11 Chi tiết:

Tìm hiểu thêm về YOLO11

Các kiến ​​trúc khác

Mặc dù YOLO26 là mô hình thời gian thực tiên tiến nhất của chúng tôi, nhưng người dùng sử dụng phần cứng chuyên dụng cao hoặc dung lượng bộ nhớ lớn cũng có thể tìm hiểu các kiến ​​trúc dựa trên Transformer như RT-DETR hoặc các công nghệ đột phá khác. NMS - Phiên bản tiên phong miễn phí, YOLOv10 .

Những khác biệt và đổi mới trong kiến ​​trúc

Bước nhảy vọt từ YOLO11 Việc chuyển sang YOLO26 đòi hỏi những thay đổi cơ bản cả về kiến ​​trúc mô hình và chế độ huấn luyện cơ bản. Trong khi đó, YOLO11 Được thiết lập trên nền tảng vững chắc cho việc phát hiện đối tượng và học đa nhiệm, YOLO26 đã hoàn toàn cải tiến quy trình triển khai cho điện toán biên.

Thiết kế không NMS đầu cuối

Một trong những nâng cấp quan trọng nhất trong YOLO26 là kiến ​​trúc đầu cuối hoàn chỉnh của nó. Không giống như... YOLO11 Trong khi YOLO26 dựa vào xử lý hậu kỳ Non-Maximum Suppression ( NMS ) để lọc các hộp giới hạn chồng chéo, YOLO26 loại bỏ hoàn toàn bước này. Khái niệm này, lần đầu tiên được tiên phong trong YOLOv10 , giúp giảm đáng kể sự biến động về độ trễ và đơn giản hóa logic triển khai trên nhiều thiết bị biên khác nhau.

Loại bỏ DFL để tăng hiệu quả cạnh

YOLO11 YOLO26 sử dụng Distribution Focal Loss (DFL) để tinh chỉnh ước tính hộp giới hạn. Tuy nhiên, DFL dựa trên các phép toán softmax phức tạp, thường không được hỗ trợ tốt bởi các bộ tăng tốc biên công suất thấp. YOLO26 đã loại bỏ thành công DFL mà không làm giảm độ chính xác. Việc đơn giản hóa kiến ​​trúc này giúp cải thiện đáng kể khả năng tương thích với các hệ thống nhúng và cho phép YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với phiên bản tiền nhiệm.

Trình tối ưu hóa MuSGD

Tính ổn định và tốc độ huấn luyện là tối quan trọng. YOLO26 giới thiệu Trình tối ưu hóa MuSGD , một sự kết hợp giữa Thuật toán Gradient Descent ngẫu nhiên (Stochastic Gradient Descent) SGD ) và Muon, lấy cảm hứng mạnh mẽ từ những cải tiến trong huấn luyện LLM của Kimi K2 thuộc Moonshot AI. Trình tối ưu hóa này mang lại sự ổn định cho việc huấn luyện mô hình ngôn ngữ trong thị giác máy tính, đảm bảo sự hội tụ nhanh hơn và giảm thiểu lượng bộ nhớ sử dụng trong quá trình huấn luyện so với các giải pháp thay thế transformer nặng nề hơn.

ProgLoss và STAL

Đối với các nhà nghiên cứu làm việc với ảnh chụp từ trên không hoặc các ứng dụng máy bay không người lái, việc phát hiện các chi tiết nhỏ là một thách thức lớn. YOLO26 giới thiệu ProgLoss kết hợp với STAL (Scale-Targeted Attention Loss), mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ so với trước đây. YOLO11 .

So sánh hiệu năng và số liệu

Khi so sánh trực tiếp các mô hình, YOLO26 thể hiện sự vượt trội rõ rệt về độ chính xác và hiệu quả thiết bị biên, đồng thời vẫn duy trì yêu cầu bộ nhớ cực thấp đặc trưng của dòng sản phẩm này. Ultralytics hệ sinh thái.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Lưu ý: Mẫu YOLO26 nano (YOLO26n) cho thấy sự cải thiện khoảng 31% về CPU Tốc độ được so sánh với YOLO11n (38,9ms so với 56,1ms), làm nổi bật triết lý thiết kế ưu tiên cạnh của nó.

Tính linh hoạt trong các tác vụ thị giác máy tính

Cả hai mẫu xe đều được hưởng lợi từ việc bảo trì kỹ lưỡng. Ultralytics hệ sinh thái, mang đến sự dễ sử dụng chưa từng có thông qua một hệ thống thống nhất. Python API. Chúng không chỉ là các công cụ phát hiện đối tượng; chúng là những cỗ máy đa nhiệm mạnh mẽ. Tuy nhiên, YOLO26 tích hợp một số cải tiến chuyên biệt cho từng tác vụ:

  • Phân đoạn đối tượng: YOLO26 sử dụng hàm mất mát phân đoạn ngữ nghĩa được tinh chỉnh và tạo mẫu đa tỷ lệ, tạo ra các đường viền mặt nạ sắc nét hơn so với các phương pháp khác. YOLO11 Tìm hiểu thêm về quy trình phân đoạn .
  • Ước lượng tư thế: Bằng cách tích hợp ước lượng logarit xác suất dư (RLE), YOLO26 cải thiện đáng kể độ chính xác của các điểm mấu chốt trong các tư thế phức tạp của con người. Khám phá khả năng ước lượng tư thế của YOLO26.
  • Hộp giới hạn định hướng (OBB): Một hàm mất mát góc chuyên dụng giải quyết các vấn đề gián đoạn ranh giới trong quá khứ, giúp YOLO26 đặc biệt đáng tin cậy trong việc phát hiện các vật thể xoay trong ảnh vệ tinh. Tìm hiểu thêm về các tác vụ của OBB .
  • Phân loại hình ảnh: Cả hai mô hình đều xử lý phân loại tốc độ cao một cách hiệu quả, với YOLO26 mang lại sự cải thiện nhỏ về độ chính xác top-1. ImageNet .

Ví dụ mã huấn luyện và suy luận

Ultralytics Nền tảng này nổi tiếng về trải nghiệm dành cho nhà phát triển. Việc huấn luyện một mô hình SOTA hoặc chạy một kịch bản suy luận chỉ cần một vài dòng mã, giảm thiểu mã lặp lại và tối đa hóa năng suất. Hơn nữa, việc huấn luyện YOLO Các mô hình này yêu cầu lượng bộ nhớ CUDA ít hơn đáng kể so với các mạng biến áp lớn.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Các trường hợp sử dụng lý tưởng và chiến lược triển khai

Lựa chọn giữa YOLO26 và YOLO11 Điều này hoàn toàn phụ thuộc vào các ràng buộc của môi trường sản xuất của bạn.

Khi nào nên triển khai YOLO26

YOLO26 là sự lựa chọn tối ưu cho các dự án hiện đại, xây dựng mới. Nó được thiết kế đặc biệt cho:

  • Điện toán biên và IoT: Sự đáng kinh ngạc của nó CPU Hiệu năng và khả năng loại bỏ DFL (Distributable Flow Function) khiến nó trở thành "vua" của các thiết bị như Raspberry Pi, Coral NPU và bộ xử lý di động.
  • Phân tích dữ liệu từ máy bay không người lái: Sự tích hợp giữa ProgLoss và STAL giúp phần mềm có khả năng theo dõi các vật thể nhỏ, di chuyển nhanh trên các khu vực rộng lớn một cách độc đáo.
  • Các ứng dụng đòi hỏi độ trễ thấp: Trong robot tự hành hoặc kiểm soát chất lượng sản xuất , NMS Thiết kế không phụ thuộc vào bộ nhớ đảm bảo độ trễ xác định mà không gây ra các xung đột xử lý hậu kỳ không mong muốn.

Khi nào nên giữ lại YOLO11

Mặc dù YOLO26 vượt trội hơn, YOLO11 vẫn là một mẫu xe cực kỳ mạnh mẽ. Bạn có thể tiếp tục sử dụng. YOLO11 nếu như:

  • Các quy trình kế thừa: Cơ sở hạ tầng triển khai C++ hiện có của bạn liên kết chặt chẽ với các đầu ra dựa trên điểm neo cụ thể và NMS logic của các kiến ​​trúc cũ hơn.
  • Tiêu chuẩn học thuật: Bạn đang công bố nghiên cứu và cần một tiêu chuẩn năm 2024 được công nhận rộng rãi để so sánh các thuật toán mới của mình.

Sức mạnh của Ultralytics Hệ sinh thái

Bất kể bạn có triển khai hay không YOLO11 hoặc YOLO26, sử dụng Ultralytics Việc sử dụng mô hình này đồng nghĩa với việc tận dụng một hệ sinh thái được duy trì tốt , thường xuyên cập nhật và nhận được sự hỗ trợ rộng rãi từ cộng đồng.

Đối với các nhóm doanh nghiệp, Nền tảng Ultralytics cung cấp giải pháp toàn diện từ chú thích dữ liệu , huấn luyện mô hình đến triển khai đám mây liền mạch. Từ việc xuất trọng số đã huấn luyện sang CoreML hoặc TensorRT , đến việc cấu hình tinh chỉnh siêu tham số nâng cao, các công cụ được cung cấp đảm bảo vòng đời AI của bạn được tối ưu hóa nhất có thể.


Bình luận