YOLO26 so với... YOLOv9 Bước tiến tiếp theo trong phát hiện đối tượng thời gian thực

Sự phát triển của các kiến trúc phát hiện đối tượng được đánh dấu bằng sự thúc đẩy không ngừng về tốc độ, độ chính xác và hiệu quả. Việc so sánh YOLO26 với YOLOv9 làm nổi bật sự tiến bộ nhanh chóng này. Trong khi đó, YOLOv9 Đã vượt qua giới hạn về khả năng lưu giữ thông tin với các gradient có thể lập trình, YOLO26 thế hệ mới định nghĩa lại lĩnh vực này với giải pháp toàn diện từ đầu đến cuối. NMS - Kiến trúc không cần cấu trúc đặc biệt tối ưu hóa cho hiệu năng biên và khối lượng lớn CPU Tăng tốc.

Tổng quan mô hình

YOLO26

YOLO26 đại diện cho công nghệ AI thị giác tiên tiến nhất tính đến đầu năm 2026. Được phát triển bởi Ultralytics , nó giới thiệu thiết kế đầu cuối nguyên bản giúp loại bỏ nhu cầu sử dụng phương pháp loại bỏ điểm không tối đa (Non-Maximum Suppression). NMS ), giúp tinh giản quy trình triển khai. Bằng cách loại bỏ hiện tượng mất tiêu điểm phân phối (Distribution Focal Loss - DFL) và tích hợp trình tối ưu hóa MuSGD mới — một sự kết hợp của... SGD Lấy cảm hứng từ quá trình huấn luyện LLM và Muon, YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% trong khi vẫn duy trì độ chính xác hàng đầu.

Tác giả: Glenn Jocher, Jing Qiu
Tổ chức:Ultralytics
Ngày: 14 tháng 1 năm 2026
Tính năng chính: NMS - Phát hiện lỗi từ đầu đến cuối miễn phí, Trình tối ưu hóa MuSGD, ProgLoss + STAL
GitHub:Kho lưu trữ Ultralytics

Tìm hiểu thêm về YOLO26

YOLOv9

Ra mắt vào đầu năm 2024, YOLOv9 đã giới thiệu khái niệm Thông tin Gradient có thể lập trình (Programmable Gradient Information - PGI) và kiến trúc GELAN. Những cải tiến này đã giải quyết vấn đề "nút thắt cổ chai thông tin" trong các mạng nơ-ron sâu, đảm bảo rằng dữ liệu quan trọng không bị mất trong quá trình truyền tiến. Nó vẫn là một mô hình mạnh mẽ, đặc biệt là đối với các ứng dụng nghiên cứu yêu cầu hiệu quả tham số cao.

Tác giả: Chien-Yao Wang, Hong-Yuan Mark Liao
Tổ chức: Viện Khoa học Thông tin, Academia Sinica
Ngày: 21 tháng 2, 2024
Tính năng chính: Thông tin độ dốc có thể lập trình (PGI), Kiến trúc GELAN
Arxiv: Bài báo YOLOv9
GitHub:Kho lưu trữ YOLOv9

Tìm hiểu thêm về YOLOv9

So sánh Kiến trúc Kỹ thuật

Sự khác biệt về kiến trúc giữa hai mô hình này thể hiện sự chuyển dịch từ tối ưu hóa luồng thông tin lý thuyết sang hiệu quả triển khai thực tiễn.

YOLO26: Hiệu quả và thiết kế ưu tiên cạnh

YOLO26 tập trung vào việc giảm thiểu chi phí tính toán của quá trình xử lý hậu kỳ và tính toán tổn thất.

NMS từ đầu đến cuối - Miễn phí: Không giống như các bộ dò truyền thống tạo ra các hộp giới hạn dư thừa, yêu cầu NMS YOLO26 dự đoán trực tiếp chính xác tập hợp các đối tượng. Điều này giúp giảm sự biến đổi độ trễ và đơn giản hóa việc xuất sang các định dạng như ONNX và TensorRT , vì các định dạng tùy chỉnh phức tạp hơn NMS Không cần dùng thêm plugin nữa.
ProgLoss + STAL: Việc giới thiệu Progressive Loss và Soft-Target Anchor Labeling giúp cải thiện đáng kể khả năng phát hiện vật thể nhỏ, một yêu cầu quan trọng đối với hình ảnh từ máy bay không người lái và quá trình kiểm tra bằng robot .
Bộ tối ưu hóa MuSGD: Mang những cải tiến từ huấn luyện Mô hình Ngôn ngữ Lớn (Large Language Model) vào lĩnh vực thị giác máy tính, bộ tối ưu hóa lai này ổn định đà huấn luyện, cho phép hội tụ nhanh hơn với ít thao tác điều chỉnh siêu tham số hơn.

YOLOv9 Lưu giữ thông tin

YOLOv9 Kiến trúc của nó được xây dựng dựa trên việc giải quyết vấn đề thông tin biến mất trong mạng nơ-ron sâu.

PGI (Programmable Gradient Information): Một nhánh giám sát phụ trợ tạo ra các gradient đáng tin cậy để cập nhật trọng số mạng, đảm bảo rằng các lớp sâu vẫn giữ được thông tin ngữ nghĩa.
GELAN (Mạng tổng hợp lớp hiệu quả tổng quát): Mạng trục này tối ưu hóa việc sử dụng tham số, cho phép YOLOv9 Để đạt được độ chính xác cao với ít tham số hơn so với một số phiên bản tiền nhiệm, mặc dù thường phải trả giá bằng độ phức tạp tính toán cao hơn (FLOPs) so với YOLO26 được tối ưu hóa.

Đơn giản hóa triển khai

Việc loại bỏ NMS Trong YOLO26, tính năng này là một bước đột phá cho việc triển khai ở biên. Trong các mô hình cũ hơn như... YOLOv9 , cái NMS bước chạy trên CPU ngay cả khi mô hình chạy trên một GPU /NPU, tạo ra nút thắt cổ chai. Kết quả đầu ra của YOLO26 sẵn sàng sử dụng ngay lập tức, giúp nó nhanh hơn đáng kể trên Raspberry Pi và các thiết bị di động.

Các chỉ số hiệu suất

Bảng sau so sánh các mô hình trên các bài kiểm tra hiệu năng tiêu chuẩn. Lưu ý lợi thế tốc độ vượt trội của YOLO26 trên... CPU phần cứng, là kết quả trực tiếp của việc tối ưu hóa kiến trúc của nó.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Ưu điểm của hệ sinh thái Ultralytics

Trong khi YOLOv9 Cung cấp nền tảng lý thuyết vững chắc, sử dụng YOLO26 trong... Ultralytics Hệ sinh thái này mang lại những lợi thế riêng biệt cho các nhà phát triển và doanh nghiệp.

Dễ sử dụng vượt trội

Cái Ultralytics Python API này chuyển đổi các quy trình đào tạo phức tạp thành một vài dòng mã. Trải nghiệm "từ con số không đến chuyên gia" này trái ngược với cách tiếp cận tập trung vào nghiên cứu của nhiều kho lưu trữ khác.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Tính linh hoạt trên nhiều tác vụ

Không giống như YOLOv9 , chủ yếu tập trung vào việc phát hiện, Ultralytics Framework và YOLO26 hỗ trợ một loạt các tác vụ thị giác máy tính đa dạng hơn. Điều này cho phép bạn sử dụng một API thống nhất duy nhất cho:

Phân đoạn đối tượng : Che phủ đối tượng chính xác ở cấp độ pixel.
Ước lượng tư thế : Phát hiện điểm mấu chốt để phân tích hoạt động của con người.
OBB (Oriented Bounding Box) : Phát hiện các đối tượng xoay như tàu thuyền trong ảnh vệ tinh.
Phân loại : Phân loại toàn bộ hình ảnh.

Hiệu quả huấn luyện và trí nhớ

Ultralytics Các mô hình được thiết kế để tiết kiệm tài nguyên. YOLO26 thường yêu cầu ít bộ nhớ GPU (VRAM) hơn trong quá trình huấn luyện so với các mô hình thay thế sử dụng nhiều transformer. Hiệu quả này cho phép:

Kích thước lô sản xuất lớn hơn đối với phần cứng dành cho người tiêu dùng.
Giảm chi phí điện toán đám mây.
Chu kỳ thử nghiệm nhanh hơn với các trọng số đã được huấn luyện sẵn có.

Các ứng dụng thực tế

Việc lựa chọn mô hình phù hợp phụ thuộc vào các ràng buộc triển khai cụ thể của bạn.

Điện toán biên và IoT

YOLO26 là nhà vô địch không thể tranh cãi dành cho các thiết bị biên. Khả năng suy luận CPU nhanh hơn 43% giúp nó trở nên khả thi cho việc giám sát thời gian thực trên các thiết bị như Raspberry Pi hoặc... NVIDIA Jetson Nano mà không cần lượng tử hóa phức tạp. Ví dụ, một hệ thống đỗ xe thông minh chạy trên phần cứng cục bộ được hưởng lợi rất nhiều từ điều này. NMS - Thiết kế không cần cấu hình đặc biệt, giảm thiểu hiện tượng giật lag.

Kiểm tra độ cao

Đối với việc giám sát nông nghiệp hoặc kiểm tra cơ sở hạ tầng bằng máy bay không người lái, YOLO26 nổi bật nhờ các chức năng ProgLoss + STAL . Các chức năng này được tinh chỉnh đặc biệt để xử lý các vật thể nhỏ và tỷ lệ khung hình khó tốt hơn so với các thế hệ trước, đảm bảo phát hiện các vết nứt trong đường ống hoặc sâu bệnh trên cây trồng với độ chính xác cao hơn.

Nghiên cứu học thuật

YOLOv9 vẫn là một ứng cử viên sáng giá cho nghiên cứu học thuật, đặc biệt là các nghiên cứu tập trung vào lý thuyết dòng gradient và kiến trúc mạng. Khái niệm PGI của nó cung cấp một hướng đi hấp dẫn để khám phá cách mạng nơ-ron duy trì độ sâu thông tin.

Kết luận

Cả hai kiến trúc này đều đánh dấu những cột mốc quan trọng trong lĩnh vực thị giác máy tính. YOLOv9 đã chứng minh tầm quan trọng của thông tin gradient trong mạng nơ-ron sâu. Tuy nhiên, YOLO26 đã chuyển những bài học đó thành một công cụ mạnh mẽ sẵn sàng cho sản xuất. Với khả năng xử lý từ đầu đến cuối... NMS - Thiết kế miễn phí, chất lượng vượt trội CPU Với tốc độ vượt trội và khả năng tích hợp liền mạch vào Nền tảng Ultralytics , YOLO26 mang đến sự cân bằng tốt nhất giữa tốc độ, độ chính xác và tính dễ sử dụng cho các ứng dụng AI hiện đại.

Đối với các nhà phát triển muốn luôn cập nhật những công nghệ tiên tiến nhất, chúng tôi khuyên bạn nên chuyển sang YOLO26 để tận dụng những cải tiến mới nhất về độ ổn định của trình tối ưu hóa và hiệu năng trên thiết bị biên.

Đọc thêm

Nếu bạn quan tâm đến các mẫu xe hiệu năng cao khác trong dòng sản phẩm này... Ultralytics Gia đình, hãy xem xét YOLO11 cho các tác vụ đa năng hoặc RT-DETR để phát hiện thời gian thực dựa trên bộ chuyển đổi.