YOLO26 vs YOLOv10 So sánh các mô hình phát hiện đối tượng từ đầu đến cuối
Lĩnh vực thị giác máy tính đang không ngừng phát triển, được thúc đẩy bởi nhu cầu về các mô hình nhanh hơn, chính xác hơn và hiệu quả hơn. Hướng dẫn này cung cấp một so sánh kỹ thuật toàn diện giữa hai kiến trúc đột phá trong lĩnh vực phát hiện đối tượng thời gian thực: YOLO26 và YOLOv10 . Bằng cách phân tích kiến trúc, các chỉ số hiệu suất và khả năng triển khai của chúng, chúng tôi mong muốn giúp các nhà phát triển và nhà nghiên cứu lựa chọn mô hình tối ưu cho các ứng dụng thị giác của họ.
Sự tiến hóa của NMS - Kiến trúc miễn phí
Trong nhiều năm, YOLO Bộ phim (You Only Look Once) dựa rất nhiều vào kỹ thuật Non-Maximum Suppression ( NMS ) để lọc bỏ các hộp giới hạn dư thừa trong quá trình xử lý hậu kỳ. Mặc dù hiệu quả, NMS Điều này gây ra độ trễ suy luận và làm phức tạp việc triển khai trên các thiết bị biên như Raspberry Pi hoặc các bộ xử lý thần kinh chuyên dụng (NPU).
Sự ra mắt của YOLOv10 đại diện cho một sự thay đổi mô hình bằng cách tiên phong trong một quy trình từ đầu đến cuối. NMS - Thiết kế miễn phí. Dựa trên bước đột phá nền tảng này, Ultralytics YOLO26 đã tinh chỉnh kiến trúc cho môi trường sản xuất, đạt được hiệu quả và tính dễ sử dụng chưa từng có trên nhiều loại tác vụ khác nhau.
Nút thắt cổ chai trong quá trình xử lý hậu kỳ
Loại bỏ NMS Loại bỏ bước xử lý hậu kỳ động, phụ thuộc vào dữ liệu, vốn thường cản trở việc tối ưu hóa các mô hình thị giác máy tính trên các bộ tăng tốc phần cứng như TensorRT và OpenVINO .
YOLOv10: Tiên phong trong detect không NMS
Ngày: 23/05/2024
Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Nguồn tham khảo: Bài báo trên ArXiv | Kho lưu trữ GitHub
Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 đã giới thiệu một chiến lược phân công kép nhất quán để loại bỏ sự cần thiết phải NMS Bằng cách sử dụng thiết kế mô hình toàn diện hướng đến hiệu quả và độ chính xác, nó đã giảm thiểu sự dư thừa trong tính toán đồng thời duy trì độ chính xác trung bình ( mAP ) cao.
Điểm mạnh:
- NMS - Free Architecture: Người tiên phong đầu tiên của dòng game này. NMS - Thiết kế miễn phí trong YOLO chuỗi này giúp giảm đáng kể độ trễ cho các ứng dụng thời gian thực.
- Hiệu quả: Cung cấp sự cân bằng tốt giữa số lượng tham số và tốc độ suy luận so với các mô hình thế hệ trước.
Điểm yếu:
- Hỗ trợ tác vụ hạn chế: Chủ yếu tập trung vào phát hiện đối tượng tiêu chuẩn, thiếu hỗ trợ sẵn có cho các tác vụ nâng cao như phân đoạn hoặc ước lượng tư thế.
- Định hướng học thuật: Mã nguồn, dù mạnh mẽ, nhưng nghiêng về nghiên cứu hơn là triển khai sản phẩm cấp doanh nghiệp một cách hiệu quả.
YOLO26: Tiêu chuẩn mới cho điện toán biên và đám mây
Ngày: 14/01/2026
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Nguồn tài liệu: Kho lưu trữ GitHub | Nền tảng Ultralytics
Được phát hành như là phiên bản kế nhiệm của YOLO11 , YOLO26 kế thừa... NMS Từ ý tưởng ban đầu đến hiện thực hóa tối ưu. Nó tích hợp liền mạch khả năng phát hiện từ đầu đến cuối vào Nền tảng Ultralytics được tối ưu hóa cao, cung cấp một bộ công cụ hoàn chỉnh cho quy trình học máy hiện đại.
YOLO26 giới thiệu một số đột phá về kiến trúc:
- Loại bỏ DFL: Suy hao tiêu điểm phân bố (Distribution Focal Loss - DFL) đã được loại bỏ hoàn toàn. Điều này giúp đơn giản hóa đáng kể quy trình xuất mô hình và cải thiện khả năng tương thích với các thiết bị biên và thiết bị công suất thấp.
- Tốc độ suy luận CPU nhanh hơn tới 43%: Nhờ loại bỏ DFL và tối ưu hóa cấu trúc, YOLO26 hoạt động nhanh hơn đáng kể trên CPU, lý tưởng cho các triển khai IoT và di động.
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Mô hình Ngôn ngữ Lớn (LLM) (như Kimi K2 của Moonshot AI), YOLO26 sử dụng sự kết hợp của... SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn cho thị giác máy tính.
- ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận dạng vật thể nhỏ, điều rất quan trọng đối với ảnh chụp từ trên không và giám sát an ninh bằng máy bay không người lái.
- Cải tiến chuyên biệt cho từng nhiệm vụ: YOLO26 không chỉ là một bộ phát hiện đối tượng. Nó tích hợp hàm mất mát Phân đoạn ngữ nghĩa và proto đa tỷ lệ cho Phân đoạn , Ước lượng logarit xác suất dư (RLE) cho Ước lượng tư thế và hàm mất mát góc chuyên dụng cho Hộp giới hạn định hướng (OBB) .
Phân tích hiệu suất và các chỉ số đo lường
Bảng sau đây so sánh COCO hiệu suất phát hiện của YOLO26 và YOLOv10 các mô hình. Hãy chú ý cách YOLO26 đạt được độ chính xác vượt trội trong khi vẫn duy trì hiệu quả tham số đặc biệt.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Cái Ultralytics Ưu điểm: Hiệu quả đào tạo và ghi nhớ
Khi triển khai các mô hình vào môi trường sản xuất, yêu cầu về bộ nhớ và hiệu quả huấn luyện cũng quan trọng không kém tốc độ suy luận. Ultralytics các mô hình, đặc biệt là YOLO26, được tối ưu hóa cao để giảm thiểu CUDA Việc này giúp giảm thiểu mức sử dụng bộ nhớ trong quá trình huấn luyện. Điều này cho phép các nhà phát triển sử dụng kích thước batch lớn hơn trên các GPU thông thường, từ đó giảm đáng kể thời gian huấn luyện và chi phí tính toán. Ngược lại, các kiến trúc phức tạp hoặc các mô hình transformer nặng như RT-DETR thường yêu cầu phần cứng cao cấp, đắt tiền để huấn luyện hiệu quả.
Tích hợp liên tục và hệ sinh thái
Một trong những lợi ích lớn nhất khi chọn YOLO26 là khả năng tích hợp với hệ thống được bảo trì tốt. Ultralytics Hệ sinh thái. Từ chú thích dữ liệu đến theo dõi thử nghiệm , nền tảng này cung cấp mọi thứ mà một kỹ sư máy học cần trong một hệ sinh thái thống nhất.
Ứng dụng thực tế: Ví dụ mã nguồn
Đặc điểm nổi bật của Ultralytics Điểm nổi bật của nó là tính dễ sử dụng hàng đầu trong ngành. Với giao diện trực quan Python Việc chuyển đổi từ mô hình cũ như YOLOv8 sang YOLO26 tiên tiến chỉ cần cập nhật một dòng mã duy nhất.
Dưới đây là một ví dụ hoàn chỉnh có thể chạy được, minh họa cách huấn luyện và suy luận bằng YOLO26:
from ultralytics import YOLO
# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="cpu", # Easily switch to 0 for GPU
)
# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# 4. Display the results to screen
predictions[0].show()
# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa YOLO26 và YOLOv10 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn YOLO26
YOLO26 là một lựa chọn tốt cho:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Khi nào nên chọn YOLOv10
YOLOv10 được khuyến nghị cho:
- NMS - Phát hiện thời gian thực không cần hệ thống quản lý truy cập (NMS): Các ứng dụng được hưởng lợi từ khả năng phát hiện toàn diện mà không cần hệ thống loại bỏ truy cập không tối đa (Non-Maximum Suppression), giúp giảm độ phức tạp khi triển khai.
- Cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng tốt giữa tốc độ suy luận và độ chính xác phát hiện trên nhiều quy mô mô hình khác nhau.
- Ứng dụng độ trễ ổn định: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như robot hoặc hệ thống tự hành.
Kết luận
Trong khi YOLOv10 đã có những đóng góp đáng kể cho cộng đồng học thuật bằng cách giới thiệu... NMS - Với mô hình không phụ thuộc vào ngôn ngữ, YOLO26 nâng tầm công nghệ này lên mức độ sẵn sàng cho doanh nghiệp. Với mức tăng đáng kể 43%, CPU Với tốc độ xử lý nhanh, công cụ tối ưu hóa MuSGD tiên tiến và tính linh hoạt vượt trội trong các tác vụ xử lý hình ảnh, YOLO26 nổi bật như một lựa chọn tối ưu cho cả điện toán biên và triển khai đám mây quy mô lớn.
Đối với các nhóm ưu tiên cộng đồng năng động, tài liệu đầy đủ và trải nghiệm phát triển liền mạch, thì... Ultralytics Hệ sinh thái của YOLO là vô song. Nếu bạn đang tìm kiếm các mô hình cho các kịch bản chuyên biệt, bạn cũng có thể muốn nghiên cứu YOLO -World để phát hiện từ vựng mở không cần huấn luyện. Tuy nhiên, đối với phần lớn các trường hợp sử dụng thực tế, YOLO26 là lựa chọn được khuyến nghị nhất.