YOLOv10 So với YOLO26: Một kỷ nguyên mới của phát hiện đối tượng từ đầu đến cuối

Sự phát triển của công nghệ phát hiện đối tượng thời gian thực đã chứng kiến những bước tiến nhanh chóng trong những năm gần đây, với trọng tâm mạnh mẽ vào việc cân bằng tốc độ, độ chính xác và tính dễ triển khai. Bài so sánh này khám phá hai cột mốc quan trọng trong hành trình này: YOLOv10 , một bước đột phá trong giới học thuật đã phổ biến... NMS - phát hiện miễn phí, và YOLO26 , công cụ mạnh mẽ sẵn sàng cho sản xuất mới nhất từ Ultralytics Điều này giúp tinh chỉnh các khái niệm đó cho các ứng dụng cấp doanh nghiệp.

Tổng quan mô hình

YOLOv10 Người tiên phong trong học thuật

Được các nhà nghiên cứu từ Đại học Thanh Hoa công bố vào tháng 5 năm 2024. YOLOv10 đã giới thiệu một sự thay đổi mô hình bằng cách loại bỏ nhu cầu về sự ức chế không tối đa (Non-Maximum Suppression) NMS ) trong quá trình suy luận. Cách tiếp cận "từ đầu đến cuối" này đã giải quyết được một nút thắt cổ chai lâu nay trong các quy trình triển khai, nơi độ trễ xử lý hậu kỳ thường thay đổi khó lường tùy thuộc vào mật độ cảnh.

Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức:Đại học Thanh Hoa
Ngày: 2024-05-23
Arxiv:arXiv:2405.14458
GitHub:THU-MIG/yolov10

Tìm hiểu thêm về YOLOv10

YOLO26: Tiêu chuẩn công nghiệp

Được xây dựng dựa trên nền tảng của các phiên bản tiền nhiệm, YOLO26 (phát hành tháng 1 năm 2026) là... Ultralytics 'Giải pháp tiên tiến được thiết kế để tạo ra tác động thực tế. Nó áp dụng thiết kế NMS -Free từ đầu đến cuối tiên phong bởi YOLOv10 nhưng được cải tiến với các hàm mất mát đơn giản hơn, một thuật toán tối ưu hóa mới và những cải tiến tốc độ đáng kể trên phần cứng biên.

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức:Ultralytics
Ngày: 2026-01-14
GitHub:ultralytics/ultralytics

Tìm hiểu thêm về YOLO26

So sánh kỹ thuật

Cả hai mô hình đều nhằm mục đích giải quyết các vấn đề về độ trễ do gây ra. NMS nhưng họ lại đi theo những con đường khác nhau để tối ưu hóa. YOLOv10 Tập trung mạnh vào tìm kiếm kiến trúc và các bài tập kép để đào tạo, trong khi YOLO26 ưu tiên sự đơn giản trong triển khai. CPU hiệu quả và sự ổn định trong đào tạo.

Kiến trúc và Thiết kế

YOLOv10 đã giới thiệu tính năng Gán nhiệm vụ kép nhất quán cho NMS - huấn luyện không cần dữ liệu bổ sung. Phương pháp này kết hợp một đầu phân loại một-nhiều (để giám sát chi tiết trong quá trình huấn luyện) với một đầu phân loại một-một (để suy luận), đảm bảo mô hình học cách xuất ra một hộp tốt nhất duy nhất cho mỗi đối tượng. Nó cũng sử dụng thiết kế mô hình toàn diện hướng đến hiệu quả-độ chính xác, bao gồm các đầu phân loại nhẹ và lấy mẫu giảm kích thước tách rời kênh không gian.

YOLO26 cải tiến điều này bằng cách loại bỏ hoàn toàn hiện tượng mất tiêu điểm phân tán (Distribution Focal Loss - DFL) . Mặc dù DFL đã giúp cải thiện độ chính xác của hộp trong các phiên bản trước, việc loại bỏ nó giúp đơn giản hóa đáng kể đồ thị xuất, làm cho các mô hình YOLO26 dễ dàng chạy hơn trên các thiết bị biên hạn chế và bộ vi điều khiển công suất thấp. Hơn nữa, YOLO26 tích hợp Trình tối ưu hóa MuSGD , một sự kết hợp của... SGD và bộ tối ưu hóa Muon (lấy cảm hứng từ quá trình huấn luyện LLM), lần đầu tiên cung cấp tính ổn định của quá trình huấn luyện theo lô lớn cho các tác vụ thị giác máy tính.

Các chỉ số hiệu suất

Bảng sau đây nêu bật sự khác biệt về hiệu năng. YOLO26 thể hiện tốc độ vượt trội trên CPU và độ chính xác cao hơn trên tất cả các tỷ lệ mô hình, đặc biệt là ở các biến thể lớn hơn.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

CPU Đột phá suy luận

YOLO26 được tối ưu hóa đặc biệt cho các môi trường không có GPU chuyên dụng. Nó đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước, tạo nên bước đột phá cho Raspberry Pi và các ứng dụng di động.

Các trường hợp sử dụng và Ứng dụng thực tế

Khi nào nên chọn YOLOv10

YOLOv10 Đây vẫn là lựa chọn tuyệt vời cho các nhà nghiên cứu và các tình huống cụ thể chỉ cần phát hiện.

Nghiên cứu học thuật: Chiến lược phân bổ kép của nó là một chủ đề hấp dẫn để nghiên cứu sâu hơn trong thiết kế hàm mất mát .
Hệ thống quản lý mạng NMS cũ - Các đường dẫn xử lý dữ liệu miễn phí: Nếu một dự án đã được xây dựng dựa trên... YOLOv10 ONNX Nhờ cấu trúc này, nó tiếp tục cung cấp khả năng phát hiện đáng tin cậy với độ trễ thấp.

Vì sao YOLO26 là lựa chọn vượt trội cho sản xuất

Đối với hầu hết các nhà phát triển, YOLO26 cung cấp một giải pháp mạnh mẽ và linh hoạt hơn.

Điện toán biên và IoT: Các hàm mất mát được đơn giản hóa và việc loại bỏ DFL làm cho YOLO26 trở nên lý tưởng để triển khai trên các thiết bị biên, nơi bộ nhớ và khả năng tính toán hạn chế.
Phát hiện vật thể nhỏ: Nhờ ProgLoss + STAL (Soft-Target Anchor Loss), YOLO26 vượt trội trong việc phát hiện các vật thể nhỏ, một yêu cầu quan trọng đối với hình ảnh trên không và kiểm tra bằng máy bay không người lái.
Đa nhiệm phức tạp: Không giống như YOLOv10 YOLO26, chủ yếu là một mô hình phát hiện, hỗ trợ các tác vụ phân đoạn đối tượng , ước lượng tư thế và hộp giới hạn định hướng (OBB) trong cùng một khung phần mềm.

Lợi thế của Ultralytics

Lựa chọn Ultralytics Mô hình như YOLO26 mang lại những lợi ích vượt xa các số liệu thô. Hệ sinh thái tích hợp đảm bảo dự án của bạn được hỗ trợ từ khâu thu thập dữ liệu đến triển khai cuối cùng.

Trải nghiệm người dùng được tối ưu hóa

Sự dễ sử dụng được cung cấp bởi Ultralytics Python API này không có đối thủ. Trong khi các kho lưu trữ khác có thể yêu cầu các tập lệnh thiết lập phức tạp, Ultralytics Các mô hình có thể được tải, huấn luyện và triển khai với lượng mã tối thiểu.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

Hỗ trợ hệ sinh thái toàn diện

YOLO26 được tích hợp hoàn toàn vào Nền tảng Ultralytics , cho phép quản lý tập dữ liệu liền mạch, đào tạo từ xa và xuất dữ liệu chỉ với một cú nhấp chuột sang các định dạng như... TensorRT , CoreML , Và OpenVINO Hệ sinh thái được duy trì tốt này đảm bảo bạn có quyền truy cập vào các bản cập nhật thường xuyên, một diễn đàn cộng đồng sôi nổi và tài liệu đầy đủ để khắc phục mọi sự cố.

Hiệu quả huấn luyện và Bộ nhớ

Ultralytics Các mô hình này nổi tiếng về hiệu quả huấn luyện . Việc YOLO26 sử dụng trình tối ưu hóa MuSGD cho phép huấn luyện ổn định với yêu cầu bộ nhớ thấp hơn so với các mô hình dựa trên Transformer như RT-DETR . Điều này có nghĩa là bạn có thể huấn luyện các mô hình có độ chính xác cao trên GPU cấp độ người tiêu dùng mà không lo hết VRAM, giúp mọi người dễ dàng tiếp cận các khả năng AI cao cấp.

Kết luận

Cả hai kiến trúc đều đại diện cho những thành tựu đáng kể trong lĩnh vực thị giác máy tính. YOLOv10 xứng đáng được ghi nhận vì đã phổ biến... NMS - một phương pháp tiếp cận miễn phí, chứng minh rằng việc phát hiện từ đầu đến cuối là khả thi đối với các ứng dụng thời gian thực.

Tuy nhiên, YOLO26 đã lấy ý tưởng này và tinh chỉnh nó cho phù hợp với nhu cầu thực tế của năm 2026. Với những ưu điểm vượt trội của mình, YOLO26 đã vượt qua mọi rào cản. CPU tốc độ, hỗ trợ chuyên biệt cho các đối tượng nhỏ thông qua ProgLoss, và sự hậu thuẫn của... Ultralytics Trong hệ sinh thái này, YOLO26 là lựa chọn được khuyến nghị cho các nhà phát triển muốn xây dựng các giải pháp AI có khả năng mở rộng và bền vững trong tương lai. Cho dù bạn đang làm việc với phân tích bán lẻ thông minh , robot tự hành hay sản xuất tốc độ cao, YOLO26 đều mang lại sự cân bằng hiệu năng cần thiết để thành công.

Các Mô hình Khác để Khám phá

YOLO11 : Phiên bản tiền nhiệm mạnh mẽ của YOLO26, vẫn được sử dụng rộng rãi trong môi trường sản xuất.
RT-DETR : Một giải pháp thay thế dựa trên bộ biến đổi, cung cấp độ chính xác cao cho các trường hợp mà... GPU Nguồn tài nguyên dồi dào.
YOLO -World : Lý tưởng cho các tác vụ phát hiện từ vựng mở, trong đó các lớp được xác định bởi các gợi ý văn bản.