YOLOv9 So với YOLO26: Sự tiến hóa của phát hiện đối tượng thời gian thực

Trong lĩnh vực thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn kiến trúc mô hình phù hợp là rất quan trọng để cân bằng hiệu suất, hiệu quả và tính dễ triển khai. Bài so sánh này khám phá những khác biệt kỹ thuật giữa YOLOv9 , một mô hình mạnh mẽ được giới thiệu vào đầu năm 2024, và YOLO26 , phiên bản tiên tiến nhất hiện nay. Ultralytics Được phát hành vào tháng 1 năm 2026. Mặc dù cả hai mẫu đều đại diện cho những cột mốc quan trọng trong dòng sản phẩm YOLO , nhưng chúng phục vụ các nhu cầu khác nhau về tốc độ, độ ổn định khi huấn luyện và độ phức tạp khi triển khai.

Tổng quan về mô hình và tác giả

Việc hiểu rõ nguồn gốc của những công trình kiến trúc này sẽ giúp ta hiểu được triết lý thiết kế của chúng.

YOLOv9: Thông tin Gradient có thể lập trình

Tác giả: Chien-Yao Wang, Hong-Yuan Mark Liao
Tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Trung Quốc
Ngày: 21/02/2024
Liên kết: Bài báo trên Arxiv | Kho lưu trữ GitHub

YOLOv9 Đã giới thiệu khái niệm Thông tin Gradient có thể lập trình (Programmable Gradient Information - PGI) và Mạng tổng hợp lớp hiệu quả tổng quát (Generalized Efficient Layer Aggregation Network - GELAN) . Những cải tiến này giải quyết vấn đề "nút thắt cổ chai thông tin" trong mạng nơ-ron sâu, nơi dữ liệu bị mất khi truyền qua các lớp liên tiếp. PGI đảm bảo rằng thông tin đặc trưng quan trọng được bảo toàn trong toàn bộ mạng sâu, cho phép phát hiện với độ chính xác cao, đặc biệt là trong các cảnh phức tạp.

YOLO26: Chuyên gia về giải pháp điện toán biên toàn diện

Tác giả: Glenn Jocher, Jing Qiu
Tổ chức: Ultralytics
Ngày: 14/01/2026
Liên kết: Tài liệu chính thức | Kho lưu trữ GitHub

Tiếp nối di sản của YOLOv8 và YOLO11 , YOLO26 đại diện cho một bước chuyển hướng sang triển khai đơn giản và tốc độ cao. Nó hoàn toàn không cần NMS từ đầu đến cuối , loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression. Lựa chọn thiết kế này, kết hợp với việc loại bỏ Distribution Focal Loss (DFL), giúp YOLO26 hoạt động cực kỳ nhanh chóng. CPU và các thiết bị biên. Nó cũng tiên phong trong việc sử dụng trình tối ưu hóa MuSGD , một sự kết hợp giữa... SGD và Muon (lấy cảm hứng từ quá trình huấn luyện LLM), để đảm bảo sự hội tụ ổn định.

Tìm hiểu thêm về YOLO26

So sánh hiệu năng và số liệu

Bảng sau đây so sánh hiệu năng của các mô hình tiêu chuẩn trên... COCO tập dữ liệu xác thực. Lưu ý lợi thế tốc độ đáng kể của YOLO26 trên CPU phần cứng, là kết quả của việc tối ưu hóa kiến trúc của nó.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Phân tích hiệu suất

YOLO26 thể hiện ưu thế rõ rệt về độ trễ và hiệu quả tính toán . Ví dụ, YOLO26n đạt được hiệu suất cao hơn. mAP (40,9%) so với YOLOv9t (38,3%) trong khi sử dụng ít FLOPs hơn đáng kể (5,4 tỷ so với 7,7 tỷ). Hiệu quả này rất quan trọng đối với các ứng dụng chạy trên các thiết bị biên chạy bằng pin.

Tìm hiểu sâu về kiến trúc

Kiến trúc YOLOv9

YOLOv9 Mô hình tập trung vào việc duy trì luồng thông tin. Kiến trúc GELAN kết hợp thế mạnh của CSPNet (lập kế hoạch đường dẫn gradient) và ELAN (tốc độ suy luận) để tạo ra một bộ trích xuất đặc trưng nhẹ nhưng mạnh mẽ. Nhánh phụ PGI cung cấp thông tin gradient đáng tin cậy trong quá trình huấn luyện cho các lớp sâu hơn, sau đó được loại bỏ trong quá trình suy luận để giữ cho mô hình nhẹ.

Ưu điểm: Độ chính xác vượt trội trên các bài kiểm tra khó; khả năng lưu giữ thông tin xuất sắc đối với các tình huống phức tạp.
Nhược điểm: Yêu cầu NMS Xử lý hậu kỳ; kiến trúc có thể phức tạp để sửa đổi cho các tác vụ không chuẩn; tải tính toán nặng hơn để đạt được hiệu suất tương đương so với các thế hệ mới hơn.

Kiến trúc YOLO26

YOLO26 ưu tiên tốc độ suy luận và sự đơn giản trong triển khai .

NMS - Thiết kế không cần thủ thuật: Bằng cách huấn luyện mô hình để dự đoán các cặp đối sánh một-một một cách tự nhiên, YOLO26 loại bỏ thủ thuật phỏng đoán. NMS bước này giúp giảm sự biến động về độ trễ và đơn giản hóa việc xuất dữ liệu TensorRT , đồng thời hiệu quả hơn. NMS Các plugin không còn là một phần phụ thuộc nữa.
Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ Kimi K2 của Moonshot AI, bộ tối ưu hóa này kết hợp động lực của SGD Nhờ các đặc tính thích ứng của bộ tối ưu hóa Muon, điều này mang lại sự ổn định cho quá trình huấn luyện mô hình ngôn ngữ lớn (LLM) trong lĩnh vực thị giác máy tính.
ProgLoss + STAL: Việc giới thiệu Progressive Loss và Soft-Target Assignment Loss (STAL) giúp cải thiện đáng kể khả năng phát hiện vật thể nhỏ , một điểm yếu thường gặp trong các bộ phát hiện không sử dụng anchor.

Đào tạo và Hệ sinh thái

Trải nghiệm của nhà phát triển khác biệt đáng kể giữa hai mô hình, chủ yếu là do hệ sinh thái phần mềm mà chúng hoạt động.

Dễ sử dụng với Ultralytics

Trong khi YOLOv9 đã được tích hợp vào Ultralytics YOLO26 là một thành viên tích hợp sẵn của framework này. Điều này đảm bảo hỗ trợ ngay từ ngày đầu tiên cho tất cả các tính năng, bao gồm:

API hợp nhất: Chuyển đổi giữa các tác vụ như Ước tính tư thế hoặc Hộp giới hạn xoay (Oriented Bounding Boxes - OBB) bằng cách đơn giản thay đổi tệp trọng lượng mô hình (ví dụ: yolo26n-pose.pt).
Nền tảng Ultralytics : Dễ dàng tải lên các tập dữ liệu, chú thích bằng trợ lý AI và huấn luyện trên đám mây bằng Nền tảng Ultralytics .
Tính linh hoạt khi xuất dữ liệu: Hỗ trợ xuất dữ liệu chỉ với một cú nhấp chuột sang các định dạng như CoreML . iOS , TFLite vì Android , Và OpenVINO vì Intel phần cứng.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")

Hiệu quả bộ nhớ và tài nguyên

YOLO26 thường yêu cầu ít bộ nhớ GPU hơn trong quá trình huấn luyện so với các công cụ khác. YOLOv9 Kiến trúc hai nhánh (PGI) của nó cho phép các nhà nghiên cứu sử dụng kích thước lô lớn hơn trên phần cứng cấp người tiêu dùng như... NVIDIA RTX 3060 hoặc 4090, giúp đẩy nhanh chu kỳ thử nghiệm.

Các trường hợp sử dụng thực tế

Khi nào nên chọn YOLOv9

YOLOv9 Nó vẫn là một ứng cử viên sáng giá trong những trường hợp mà độ chính xác tối đa trên các bộ dữ liệu chuẩn tĩnh là ưu tiên hàng đầu và nguồn lực tính toán dồi dào.

Nghiên cứu học thuật: Nghiên cứu lý thuyết tắc nghẽn thông tin và dòng gradient trong mạng nơ-ron tích chập (CNN).
Xử lý phía máy chủ: Công suất cao GPU các cụm máy chủ phân tích đoạn video lưu trữ, nơi độ trễ thời gian thực không quá quan trọng.

Khi nào nên chọn YOLO26

YOLO26 là lựa chọn được khuyến nghị cho môi trường sản xuất và điện toán biên .

Hệ thống nhúng: Tốc độ xử lý CPU nhanh hơn tới 43% khiến nó trở nên lý tưởng cho Raspberry Pi hoặc NVIDIA Ứng dụng Jetson trong lĩnh vực robot.
Phân tích thời gian thực: NMS Thiết kế không phụ thuộc vào bộ nhớ đảm bảo độ trễ xác định, điều cực kỳ quan trọng đối với hệ thống lái tự động và an toàn.
Ứng dụng đa phương thức: Với hỗ trợ gốc cho Phân đoạn đối tượng và Tư thế, nó đóng vai trò là nền tảng linh hoạt cho các quy trình phức tạp như phân tích hành vi con người trong lĩnh vực bán lẻ hoặc thể thao.

Kết luận

Trong khi YOLOv9 Được giới thiệu bởi PGI, YOLO26 đã tinh chỉnh những khái niệm lý thuyết đột phá thành một gói phần mềm hiệu năng cao và thực tiễn. Kiến trúc toàn diện , loại bỏ các điểm nghẽn trong quá trình xử lý hậu kỳ và tích hợp với hệ sinh thái Ultralytics mạnh mẽ khiến nó trở thành lựa chọn tối ưu cho các nhà phát triển xây dựng thế hệ ứng dụng AI tiếp theo.

Khám phá các Mô hình Khác

Nếu bạn muốn tìm hiểu thêm các lựa chọn khác, hãy xem xét YOLO11 , phiên bản tiền nhiệm của YOLO26, hoặc YOLOv10 , phiên bản tiên phong trong lĩnh vực này. NMS - cách tiếp cận miễn phí.