YOLO26 vs YOLOv9 Bước tiến tiếp theo trong phát hiện đối tượng thời gian thực
Lĩnh vực thị giác máy tính đang phát triển nhanh chóng, với các kiến trúc mới liên tục đẩy mạnh giới hạn về tốc độ và độ chính xác. Trong bài so sánh kỹ thuật này, chúng ta sẽ xem xét sự khác biệt giữa YOLO26 và YOLOv9 , hai mô hình có ảnh hưởng lớn trong lĩnh vực phát hiện đối tượng thời gian thực. Mặc dù cả hai mô hình đều cung cấp những cải tiến kiến trúc riêng biệt, nhưng việc hiểu rõ sự đánh đổi về hiệu năng, khả năng triển khai và yêu cầu phần cứng của chúng là rất quan trọng để lựa chọn công cụ phù hợp cho dự án thị giác máy tính tiếp theo của bạn.
YOLO26: Bộ xử lý mạnh mẽ được tối ưu hóa cho thiết bị biên.
Ra mắt vào đầu năm 2026, Ultralytics YOLO26 đại diện cho một bước tiến vượt bậc về hiệu quả triển khai và tính ổn định của quá trình huấn luyện mô hình. Được thiết kế như một khung phần mềm hoàn chỉnh từ đầu đến cuối, nó trực tiếp giải quyết các nút thắt cổ chai trong quá trình triển khai vốn là vấn đề nan giải đối với các ứng dụng AI biên.
Thông tin chi tiết về mẫu sản phẩm:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2026-01-14
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu YOLO26
Kiến trúc và các cải tiến
YOLO26 thiết kế lại hoàn toàn quy trình xử lý hậu kỳ bằng cách giới thiệu thiết kế không có NMS từ đầu đến cuối . Bằng cách loại bỏ nhu cầu về Non-Maximum Suppression ( NMS Nhờ đó, mô hình đạt được độ biến thiên độ trễ thấp hơn đáng kể. Điều này giúp việc triển khai lên các nền tảng di động và biên trở nên dễ dàng hơn nhiều, đặc biệt là khi xuất sang các framework như ONNX và Apple CoreML .
Ngoài ra, việc loại bỏ Distribution Focal Loss (DFL) giúp đơn giản hóa quá trình xuất khẩu và tăng cường khả năng tương thích với các bộ vi điều khiển công suất thấp. Để cải thiện tính ổn định của quá trình huấn luyện, YOLO26 tích hợp bộ tối ưu hóa MuSGD mới, một sự kết hợp giữa Stochastic Gradient Descent ( SGD ) và Muon (lấy cảm hứng từ những cải tiến trong huấn luyện Mô hình Ngôn ngữ Lớn). Điều này giúp hội tụ nhanh hơn và trích xuất đặc trưng mạnh mẽ hơn trên các tập dữ liệu khó.
Suy luận thiết bị biên
Nhờ việc đơn giản hóa kiến trúc và loại bỏ DFL, YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% , trở thành lựa chọn lý tưởng cho các thiết bị biên có tài nguyên hạn chế như Raspberry Pi hoặc NVIDIA Jetson Nano .
Để phát hiện các đối tượng có độ phân giải cao trong các cảnh như ảnh chụp từ máy bay không người lái , YOLO26 sử dụng các hàm mất mát ProgLoss + STAL được cập nhật. Điều này mang lại những cải tiến đáng kể về độ chính xác nhận dạng đối tượng nhỏ. Hơn nữa, nó còn có các cải tiến dành riêng cho từng nhiệm vụ, bao gồm proto đa tỷ lệ để phân đoạn đối tượng , ước lượng logarit khả năng dư (RLE) để ước lượng tư thế và hàm mất mát góc chuyên dụng để phát hiện các hộp giới hạn định hướng (OBB) .
YOLOv9: Thông tin Gradient có thể lập trình
Được giới thiệu vào đầu năm 2024, YOLOv9 Đã mang lại những tiến bộ lý thuyết cho cách mạng nơ-ron xử lý dòng gradient trong giai đoạn huấn luyện, tập trung vào hiệu quả tham số và khả năng lưu giữ đặc trưng sâu.
Thông tin chi tiết về mẫu sản phẩm:
- Tác giả: Chien-Yao Wang và Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
- Ngày: 2024-02-21
- Arxiv: Bài báo YOLOv9
- GitHub:Kho lưu trữ YOLOv9
- Tài liệu:Tài liệu YOLOv9
Kiến trúc và Điểm mạnh
YOLOv9 Kiến trúc này được xây dựng dựa trên khái niệm Thông tin Gradient có thể lập trình (Programmable Gradient Information - PGI) và Mạng tổng hợp lớp hiệu quả tổng quát (Generalized Efficient Layer Aggregation Network - GELAN). Các khái niệm này giải quyết vấn đề tắc nghẽn thông tin thường gặp trong các mạng nơ-ron sâu. Bằng cách bảo toàn thông tin thiết yếu thông qua quá trình truyền tiến, GELAN đảm bảo rằng các gradient được sử dụng để cập nhật trọng số vẫn đáng tin cậy. Kiến trúc này mang lại độ chính xác cao và giúp... YOLOv9 Một ứng viên sáng giá cho nghiên cứu học thuật về lý thuyết mạng nơ-ron và tối ưu hóa đường dẫn gradient sử dụng framework PyTorch .
Hạn chế
Mặc dù có hiệu quả tham số tuyệt vời, YOLOv9 phụ thuộc rất nhiều vào truyền thống NMS Đối với quá trình xử lý hậu kỳ hộp giới hạn, điều này có thể tạo ra các nút thắt cổ chai về mặt tính toán trong quá trình suy luận trên các thiết bị biên. Hơn nữa, kho lưu trữ chính thức chủ yếu tập trung vào phát hiện đối tượng, đòi hỏi phải tùy chỉnh đáng kể để điều chỉnh nó cho các tác vụ chuyên biệt như theo dõi hoặc ước tính tư thế.
So sánh hiệu suất
Khi đánh giá các mô hình này để triển khai trong thực tế, cần cân bằng giữa độ chính xác ( mAP Tốc độ suy luận và mức sử dụng bộ nhớ là rất quan trọng. Ultralytics Các mô hình này nổi tiếng với yêu cầu bộ nhớ thấp trong cả quá trình huấn luyện và suy luận, đòi hỏi ít bộ nhớ CUDA hơn nhiều so với các giải pháp thay thế dựa trên transformer như RT-DETR .
Dưới đây là bảng so sánh trực tiếp giữa YOLO26 và... YOLOv9 Hiệu năng trên tập dữ liệu COCO . Các giá trị tốt nhất trong mỗi cột được in đậm .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Ghi chú: CPU tốc độ cho YOLOv9 Chúng bị lược bỏ vì chúng thay đổi rất nhiều tùy thuộc vào... NMS và nhìn chung chậm hơn so với tính năng cấu hình gốc của YOLO26. NMS - Triển khai miễn phí.
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa YOLO26 và YOLOv9 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn YOLO26
YOLO26 là một lựa chọn tốt cho:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Khi nào nên chọn YOLOv9
YOLOv9 được khuyến nghị cho:
- Nghiên cứu về tắc nghẽn thông tin: Các dự án học thuật nghiên cứu kiến trúc Thông tin Gradient có thể lập trình (PGI) và Mạng tổng hợp lớp hiệu quả tổng quát (GELAN).
- Nghiên cứu tối ưu hóa dòng gradient: Nghiên cứu tập trung vào việc hiểu và giảm thiểu sự mất mát thông tin trong các lớp mạng sâu trong quá trình huấn luyện.
- Đánh giá hiệu năng phát hiện độ chính xác cao: Các kịch bản trong đó YOLOv9 mạnh mẽ COCO Hiệu năng chuẩn là cần thiết để làm điểm tham chiếu cho việc so sánh kiến trúc.
Lợi thế của Ultralytics
Việc lựa chọn mô hình không chỉ đơn thuần là đọc các chỉ số đánh giá độ chính xác; hệ sinh thái phần mềm xung quanh sẽ quyết định tốc độ chuyển đổi từ thu thập dữ liệu sang sản xuất.
Dễ sử dụng và hệ sinh thái
Hàm Ultralytics Python API Cung cấp trải nghiệm "từ con số không đến chuyên gia" liền mạch. Thay vì sao chép các kho lưu trữ phức tạp hoặc cấu hình thủ công các tập lệnh đào tạo phân tán, các nhà phát triển có thể cài đặt gói thông qua pip và bắt đầu huấn luyện ngay lập tức. Việc duy trì tích cực được thực hiện. Hệ sinh thái Ultralytics đảm bảo cập nhật thường xuyên, tích hợp tự động với các nền tảng học máy như... Weights & Biases, và tài liệu mở rộng.
Khác Ultralytics Mô hình
Nếu bạn quan tâm đến việc tìm hiểu các mô hình khác trong phạm vi này Ultralytics Trong hệ sinh thái này, bạn cũng có thể cân nhắc so sánh với YOLO11 hoặc YOLOv8 cổ điển, cả hai đều cung cấp tính linh hoạt vượt trội cho các ứng dụng tùy chỉnh.
Tính linh hoạt trong các nhiệm vụ thị giác
Trong khi YOLOv9 YOLO26 chủ yếu là một công cụ phát hiện đối tượng, nhưng cũng là một công cụ thị giác máy tính đa năng. Sử dụng một cú pháp thống nhất duy nhất, bạn có thể dễ dàng chuyển đổi từ phát hiện đối tượng sang phân đoạn ảnh chính xác đến từng pixel hoặc phân loại toàn bộ ảnh. Tính linh hoạt này giúp giảm thiểu gánh nặng kỹ thuật khi phải duy trì nhiều mã nguồn riêng biệt cho các tính năng thị giác máy tính khác nhau.
Đào tạo và triển khai hiệu quả
Hiệu quả đào tạo là nền tảng của... Ultralytics Về mặt triết lý, YOLO26 sử dụng các trọng số đã được huấn luyện sẵn và có mức sử dụng bộ nhớ thấp hơn đáng kể so với các mô hình chuyển đổi hình ảnh cồng kềnh. Sau khi được huấn luyện, các quy trình xuất tích hợp cho phép chuyển đổi chỉ bằng một cú nhấp chuột sang các định dạng được tối ưu hóa như TensorRT hoặc TensorFlow Lite , giúp quá trình đưa sản phẩm vào sản xuất diễn ra suôn sẻ hơn.
Ví dụ mã: Bắt đầu với YOLO26
Việc triển khai YOLO26 vô cùng đơn giản. Các bước tiếp theo như sau: Python Đoạn mã này minh họa cách tải một mô hình đã được huấn luyện trước, huấn luyện nó trên dữ liệu tùy chỉnh và chạy suy luận bằng cách sử dụng... Ultralytics API.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()
Bằng cách tận dụng tốc độ, kiến trúc đơn giản và hệ sinh thái mạnh mẽ của YOLO26, các nhóm có thể đưa các ứng dụng AI thị giác tiên tiến ra thị trường nhanh hơn và với ít rào cản kỹ thuật hơn bao giờ hết.