YOLO26 đấu với DAMO- YOLO Sự tiến hóa của phát hiện đối tượng thời gian thực
Lĩnh vực thị giác máy tính đang phát triển nhanh chóng, với các kiến trúc mới liên tục đẩy giới hạn về tốc độ và độ chính xác. Hai cột mốc quan trọng trong quá trình này là DAMO- YOLO , được phát triển bởi Tập đoàn Alibaba vào cuối năm 2022, và YOLO26 , mô hình tiên tiến nhất được phát hành bởi... Ultralytics vào năm 2026.
Trong khi DAMO- YOLO đã giới thiệu các khái niệm đột phá như Tìm kiếm Kiến trúc Thần kinh (NAS) cho YOLO Trong dòng sản phẩm YOLO26, có thể thấy đây là một bước chuyển đổi mang tính đột phá hướng tới xử lý đầu cuối nguyên bản và thiết kế ưu tiên biên. Bài so sánh chi tiết này sẽ khám phá những khác biệt về kiến trúc, các chỉ số hiệu năng và thực tế triển khai của hai mô hình mạnh mẽ này, giúp các nhà phát triển lựa chọn công cụ phù hợp với nhu cầu phát hiện đối tượng của họ.
So sánh Các chỉ số Hiệu suất
Bảng sau đây so sánh hiệu năng của YOLO26 với DAMO- YOLO Hãy lưu ý những cải tiến đáng kể về tốc độ suy luận, đặc biệt là đối với... CPU các hoạt động dựa trên -, đây là đặc điểm nổi bật của kiến trúc YOLO26.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Ultralytics YOLO26: Tiêu chuẩn mới
Phát hành vào tháng 1 năm 2026 bởi Ultralytics YOLO26 được xây dựng dựa trên nền tảng của YOLO11 và YOLOv8 , mang đến những thay đổi mang tính đột phá cho quy trình phát hiện. Triết lý thiết kế chính của nó tập trung vào việc loại bỏ các điểm nghẽn trong quá trình triển khai và huấn luyện, biến nó trở thành mô hình hiệu quả nhất cho cả GPU cao cấp và các thiết bị biên có tài nguyên hạn chế.
Những đổi mới quan trọng
- Hệ NMS toàn diện - Thiết kế miễn phí: Không giống như các thế hệ trước và các đối thủ cạnh tranh như DAMO- YOLO YOLO26 là hệ thống end-to-end hoàn chỉnh. Nó loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression ( NMS ) . Điều này giúp giảm sự biến động độ trễ và đơn giản hóa quy trình triển khai, một phương pháp đột phá lần đầu tiên được tiên phong trong YOLOv10 .
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ những tiến bộ gần đây trong huấn luyện Mô hình Ngôn ngữ Lớn (LLM), YOLO26 sử dụng sự kết hợp của... SGD và Muon. Trình tối ưu hóa này cung cấp độ ổn định cao hơn trong quá trình huấn luyện và tốc độ hội tụ nhanh hơn, giảm chi phí tính toán cần thiết để đạt được độ chính xác tối ưu.
- Tối ưu hóa ưu tiên cạnh: Bằng cách loại bỏ tổn thất tiêu điểm phân phối (DFL), kiến trúc mô hình được đơn giản hóa để dễ dàng xuất sang các định dạng như... ONNX Và CoreML Điều này góp phần tăng tốc độ suy luận CPU lên tới 43% so với các phiên bản trước, lý tưởng cho các thiết bị như Raspberry Pi hoặc điện thoại di động.
- Phát hiện vật thể nhỏ được cải tiến: Việc tích hợp ProgLoss và STAL (Scale-Aware Training Adaptive Loss) cải thiện đáng kể hiệu suất đối với các vật thể nhỏ, khắc phục điểm yếu thường gặp trong các bộ phát hiện một giai đoạn.
Triển khai tinh gọn
Vì YOLO26 loại bỏ NMS Bước này, các mô hình được xuất ra là các mạng nơ-ron thuần túy mà không có mã xử lý hậu kỳ phức tạp. Điều này giúp việc tích hợp vào môi trường C++ hoặc di động dễ dàng hơn đáng kể và ít xảy ra lỗi logic hơn.
Ví dụ mã
Trải nghiệm người dùng với YOLO26 vẫn nhất quán với bộ SDK Python được tối giản hóa Ultralytics .
from ultralytics import YOLO
# Load the nano model
model = YOLO("yolo26n.pt")
# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)
# Export to ONNX for edge deployment
path = model.export(format="onnx")
DAMO- YOLO : Chiếc Challenger được trang bị hệ thống NAS
DAMO- YOLO , được phát triển bởi Học viện DAMO của Alibaba, đã gây tiếng vang vào năm 2022 bằng cách tận dụng Tìm kiếm Kiến trúc Mạng thần kinh (NAS) để thiết kế xương sống của nó. Thay vì tự tay thiết kế cấu trúc mạng, các tác giả đã sử dụng MAE-NAS (Phương pháp các cạnh phụ trợ) để tự động tìm ra các kiến trúc hiệu quả trong các ràng buộc độ trễ cụ thể.
Các tính năng chính
- Hệ thống xương sống MAE-NAS: Cấu trúc mạng được tối ưu hóa về mặt toán học để tối đa hóa luồng thông tin đồng thời giảm thiểu chi phí tính toán.
- RepGFPN: Một mạng lưới kim tự tháp đặc trưng hiệu quả sử dụng việc tái tham số hóa để cải thiện sự kết hợp đặc trưng trên các thang đo khác nhau.
- ZeroHead: Thiết kế đầu dò trọng lượng nhẹ nhằm giảm số lượng tham số ở cuối mạng.
- AlignedOTA: Một chiến lược gán nhãn giúp mô hình hiểu rõ hơn hộp neo nào tương ứng với các đối tượng thực tế trong quá trình huấn luyện.
Trong khi DAMO- YOLO Mặc dù mang lại hiệu suất tuyệt vời vào thời điểm đó, nhưng việc phụ thuộc vào một quy trình đào tạo chưng cất phức tạp—trong đó mô hình giáo viên lớn hơn hướng dẫn mô hình học sinh nhỏ hơn—làm cho việc đào tạo tùy chỉnh tốn nhiều tài nguyên hơn so với khả năng "đào tạo từ đầu" của các hệ thống khác. Ultralytics mô hình.
So sánh chi tiết
Kiến trúc và sự ổn định trong đào tạo
Sự khác biệt rõ rệt nhất nằm ở phương pháp tối ưu hóa. DAMO- YOLO Nó dựa vào NAS để tìm ra cấu trúc tối ưu, có thể mang lại hiệu suất FLOPs lý thuyết rất cao nhưng thường dẫn đến các kiến trúc khó sửa đổi hoặc gỡ lỗi.
Ngược lại, YOLO26 sử dụng các cải tiến kiến trúc được thực hiện thủ công, dựa trên trực giác (như việc loại bỏ DFL và...) NMS (đầu tự do) được củng cố bởi Trình tối ưu hóa MuSGD . Trình tối ưu hóa này mang lại sự ổn định thường thấy trong các mô hình tuyến tính hỗn hợp (LLM) cho thị giác máy tính. Đối với các nhà phát triển, điều này có nghĩa là YOLO26 ít nhạy cảm hơn với việc điều chỉnh siêu tham số và hội tụ đáng tin cậy trên các tập dữ liệu tùy chỉnh.
Tốc độ suy luận và hiệu quả tài nguyên
Trong khi DAMO- YOLO được tối ưu hóa cho GPU độ trễ sử dụng TensorRT YOLO26 áp dụng cách tiếp cận rộng hơn. Việc loại bỏ DFL và NMS Điều này cho phép YOLO26 hoạt động hiệu quả trên CPU , đạt tốc độ nhanh hơn tới 43% so với các thế hệ trước. Điều này rất quan trọng đối với các ứng dụng trong phân tích bán lẻ hoặc thành phố thông minh, nơi các thiết bị biên có thể không có GPU chuyên dụng.
Hơn nữa, yêu cầu về bộ nhớ của YOLO26 trong quá trình huấn luyện thường thấp hơn. Trong khi đó, DAMO- YOLO Thông thường, việc đào tạo một mô hình giáo viên phức tạp để chưng cất nhằm đạt được kết quả tối ưu là điều cần thiết, trong khi YOLO26 đạt được kết quả SOTA trực tiếp, tiết kiệm đáng kể thời gian. GPU giờ và điện.
Tính linh hoạt và Hệ sinh thái
Một lợi thế lớn của Ultralytics Hệ sinh thái rất đa dạng. DAMO- YOLO Chủ yếu là một bộ phát hiện đối tượng. Ngược lại, kiến trúc YOLO26 hỗ trợ một loạt các tác vụ thị giác máy tính , bao gồm:
- Phân đoạn đối tượng (với các tổn thất ngữ nghĩa chuyên biệt)
- Ước lượng tư thế (sử dụng RLE để đạt độ chính xác cao hơn)
- Hộp giới hạn định hướng (OBB) (quan trọng đối với hình ảnh trên không)
- Phân loại hình ảnh
Điều này cho phép một nhóm phát triển duy nhất sử dụng một API và một framework để giải quyết nhiều vấn đề khác nhau, giúp giảm đáng kể nợ kỹ thuật.
Bảng so sánh: Các tính năng
| Tính năng | YOLO26 | DAMO-YOLO |
|---|---|---|
| Ngày phát hành | Tháng 1 năm 2026 | Tháng 11 năm 2022 |
| Kiến trúc | Từ đầu đến cuối, NMS -Miễn phí | Dựa trên NAS, không cần Anchor |
| Xử lý hậu kỳ | Không có (Kết quả đầu ra của mô hình = Cuối cùng) | Non-Maximum Suppression (NMS) |
| Trình tối ưu hóa | MuSGD ( SGD + Muon) | SGD / AdamW |
| Quy trình đào tạo | Đào tạo một giai đoạn, từ đầu. | Quá trình chưng cất phức hợp (Thầy - Trò) |
| Các Tác Vụ Được Hỗ Trợ | detect, segment, Pose, obb, classify | Phát hiện vật thể |
| Tối ưu hóa biên | Cao (Không có DFL, được tối ưu hóa cho) CPU ) | Vừa phải ( TensorRT tập trung) |
Kết luận
Cả hai kiến trúc đều đại diện cho những đỉnh cao trong lịch sử phát hiện đối tượng. DAMO- YOLO Nó đã chứng minh sức mạnh của việc tìm kiếm kiến trúc tự động và tái tham số hóa. Tuy nhiên, YOLO26 đại diện cho tương lai của việc triển khai AI thực tiễn.
Bằng cách loại bỏ NMS Với khả năng khắc phục điểm nghẽn, giới thiệu các công cụ tối ưu hóa cấp LLM như MuSGD, và cung cấp giải pháp thống nhất cho phân đoạn, tư thế và phát hiện, Ultralytics YOLO26 mang đến sự cân bằng vượt trội giữa hiệu năng và tính dễ sử dụng. Đối với các nhà phát triển xây dựng ứng dụng thực tế—từ tự động hóa công nghiệp đến ứng dụng di động—hệ sinh thái mạnh mẽ, tài liệu đầy đủ và Nền tảng Ultralytics khiến YOLO26 trở thành lựa chọn được khuyến nghị hàng đầu.
Đối với những ai quan tâm đến các so sánh khác, bạn có thể tìm hiểu về YOLO11 so với DAMO- YOLO hoặc xem xét các giải pháp thay thế dựa trên transformer như RT-DETR .
Tác giả và tài liệu tham khảo
YOLO26
- Tác giả: Glenn Jocher, Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2026-01-14
- Tài liệu:Tài liệu YOLO26
DAMO-YOLO
- Tác giả: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- Tổ chức: Alibaba Group
- Ngày: 2022-11-23
- Bài báo: arXiv:2211.15444