Chuyển đến nội dung

YOLO26 vs YOLOv10 So sánh các mô hình phát hiện đối tượng từ đầu đến cuối

Lĩnh vực thị giác máy tính đang không ngừng phát triển, được thúc đẩy bởi nhu cầu về các mô hình nhanh hơn, chính xác hơn và hiệu quả hơn. Hướng dẫn này cung cấp một so sánh kỹ thuật toàn diện giữa hai kiến ​​trúc đột phá trong lĩnh vực phát hiện đối tượng thời gian thực: YOLO26YOLOv10 . Bằng cách phân tích kiến ​​trúc, các chỉ số hiệu suất và khả năng triển khai của chúng, chúng tôi mong muốn giúp các nhà phát triển và nhà nghiên cứu lựa chọn mô hình tối ưu cho các ứng dụng thị giác của họ.

Sự tiến hóa của NMS - Kiến trúc miễn phí

Trong nhiều năm, YOLO Bộ phim (You Only Look Once) dựa rất nhiều vào kỹ thuật Non-Maximum Suppression ( NMS ) để lọc bỏ các hộp giới hạn dư thừa trong quá trình xử lý hậu kỳ. Mặc dù hiệu quả, NMS Điều này gây ra độ trễ suy luận và làm phức tạp việc triển khai trên các thiết bị biên như Raspberry Pi hoặc các bộ xử lý thần kinh chuyên dụng (NPU).

Sự ra mắt của YOLOv10 đại diện cho một sự thay đổi mô hình bằng cách tiên phong trong một quy trình từ đầu đến cuối. NMS - Thiết kế miễn phí. Dựa trên bước đột phá nền tảng này, Ultralytics YOLO26 đã tinh chỉnh kiến ​​trúc cho môi trường sản xuất, đạt được hiệu quả và tính dễ sử dụng chưa từng có trên nhiều loại tác vụ khác nhau.

Nút thắt cổ chai trong quá trình xử lý hậu kỳ

Loại bỏ NMS Loại bỏ bước xử lý hậu kỳ động, phụ thuộc vào dữ liệu, vốn thường cản trở việc tối ưu hóa các mô hình thị giác máy tính trên các bộ tăng tốc phần cứng như TensorRTOpenVINO .

YOLOv10: Tiên phong trong detect không NMS

Ngày: 2024-05-23
Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức:Đại học Thanh Hoa
Tài nguyên:Bài báo ArXiv | Kho lưu trữ GitHub

Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 đã giới thiệu một chiến lược gán kép nhất quán để loại bỏ nhu cầu về NMS. Bằng cách áp dụng thiết kế mô hình toàn diện dựa trên hiệu quả-độ chính xác, nó đã giảm sự dư thừa tính toán trong khi vẫn duy trì mAP (mean Average Precision) mạnh mẽ.

Điểm mạnh:

  • Kiến trúc không NMS: Tiên phong trong thiết kế không NMS trong dòng YOLO, giảm đáng kể độ trễ cho các ứng dụng thời gian thực.
  • Hiệu quả: Cung cấp sự đánh đổi mạnh mẽ giữa số lượng tham số và tốc độ suy luận so với các mô hình thế hệ trước.

Điểm yếu:

  • Hỗ trợ tác vụ hạn chế: Chủ yếu tập trung vào phát hiện đối tượng tiêu chuẩn, thiếu hỗ trợ gốc sẵn có cho các tác vụ nâng cao như segment hoặc ước tính tư thế.
  • Academic Focus: Cơ sở mã, mặc dù mạnh mẽ, nghiêng về nghiên cứu nhiều hơn là triển khai sản xuất cấp doanh nghiệp, tinh gọn.

Tìm hiểu thêm về YOLOv10

YOLO26: Tiêu chuẩn mới cho điện toán biên và đám mây

Ngày: 2026-01-14
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức:Ultralytics
Tài nguyên:Kho lưu trữ GitHub | Nền tảng Ultralytics

Được phát hành như là phiên bản kế nhiệm của YOLO11 , YOLO26 kế thừa... NMS Từ ý tưởng ban đầu đến hiện thực hóa tối ưu. Nó tích hợp liền mạch khả năng phát hiện từ đầu đến cuối vào Nền tảng Ultralytics được tối ưu hóa cao, cung cấp một bộ công cụ hoàn chỉnh cho quy trình học máy hiện đại.

YOLO26 giới thiệu một số đột phá về kiến ​​trúc:

  • Loại bỏ DFL: Distribution Focal Loss đã được loại bỏ hoàn toàn. Điều này đơn giản hóa đáng kể quy trình xuất mô hình và cải thiện khả năng tương thích với các thiết bị biên và công suất thấp.
  • Tăng tốc suy luận trên CPU lên đến 43%: Nhờ việc loại bỏ DFL và các tối ưu hóa cấu trúc, YOLO26 nhanh hơn đáng kể trên CPU, lý tưởng cho các triển khai IoT và di động.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Mô hình Ngôn ngữ Lớn (LLM) (chẳng hạn như Kimi K2 của Moonshot AI), YOLO26 sử dụng một sự kết hợp giữa SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và hội tụ nhanh hơn cho thị giác máy tính.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận diện vật thể nhỏ, điều này rất quan trọng cho ảnh chụp từ trên khônggiám sát an ninh bằng drone.
  • Cải tiến chuyên biệt theo tác vụ: YOLO26 không chỉ là một bộ detect. Nó nổi bật với hàm mất mát segment ngữ nghĩa và proto đa tỷ lệ cho segment, Ước tính Log-Likelihood Dư (RLE) cho ước tính tư thế và hàm mất mát góc chuyên biệt cho Hộp giới hạn định hướng (OBB).

Tìm hiểu thêm về YOLO26

Phân tích hiệu suất và các chỉ số đo lường

Bảng sau đây so sánh COCO hiệu suất phát hiện của YOLO26 và YOLOv10 các mô hình. Hãy chú ý cách YOLO26 đạt được độ chính xác vượt trội trong khi vẫn duy trì hiệu quả tham số đặc biệt.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Cái Ultralytics Ưu điểm: Hiệu quả đào tạo và ghi nhớ

Khi triển khai các mô hình vào môi trường sản xuất, yêu cầu về bộ nhớ và hiệu quả huấn luyện cũng quan trọng không kém tốc độ suy luận. Ultralytics các mô hình, đặc biệt là YOLO26, được tối ưu hóa cao để giảm thiểu CUDA Việc này giúp giảm thiểu mức sử dụng bộ nhớ trong quá trình huấn luyện. Điều này cho phép các nhà phát triển sử dụng kích thước batch lớn hơn trên các GPU thông thường, từ đó giảm đáng kể thời gian huấn luyện và chi phí tính toán. Ngược lại, các kiến ​​trúc phức tạp hoặc các mô hình transformer nặng như RT-DETR thường yêu cầu phần cứng cao cấp, đắt tiền để huấn luyện hiệu quả.

Tích hợp liên tục và Hệ sinh thái

Một trong những lợi ích lớn nhất khi chọn YOLO26 là khả năng tích hợp với hệ thống được bảo trì tốt. Ultralytics Hệ sinh thái. Từ chú thích dữ liệu đến theo dõi thử nghiệm , nền tảng này cung cấp mọi thứ mà một kỹ sư máy học cần trong một hệ sinh thái thống nhất.

Ứng dụng thực tế: Ví dụ mã nguồn

Đặc điểm nổi bật của Ultralytics Điểm nổi bật của nó là tính dễ sử dụng hàng đầu trong ngành. Với giao diện trực quan Python Việc chuyển đổi từ mô hình cũ như YOLOv8 sang YOLO26 tiên tiến chỉ cần cập nhật một dòng mã duy nhất.

Dưới đây là một ví dụ hoàn chỉnh có thể chạy được, minh họa cách huấn luyện và suy luận bằng YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa YOLO26 và YOLOv10 phụ thuộc vào các yêu cầu dự án cụ thể, ràng buộc triển khai và ưu tiên hệ sinh thái của bạn.

Khi nào nên chọn YOLO26

YOLO26 là một lựa chọn tốt cho:

  • Triển khai biên không NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của xử lý hậu kỳ Non-Maximum Suppression.
  • Môi trường chỉ có CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi khả năng suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Detect đối tượng nhỏ: Các kịch bản đầy thách thức như hình ảnh từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các đối tượng rất nhỏ.

Khi nào nên chọn YOLOv10

YOLOv10 được khuyến nghị cho:

  • detect thời gian thực không NMS: Các ứng dụng hưởng lợi từ detect end-to-end mà không cần Non-Maximum Suppression, giảm độ phức tạp khi triển khai.
  • Đánh đổi cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng mạnh mẽ giữa tốc độ suy luận và độ chính xác detect trên các quy mô mô hình khác nhau.
  • Ứng dụng có độ trễ nhất quán: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như trong robot học hoặc các hệ thống tự hành.

Kết luận

Trong khi YOLOv10 đã có những đóng góp đáng kể cho cộng đồng học thuật bằng cách giới thiệu... NMS - Với mô hình không phụ thuộc vào ngôn ngữ, YOLO26 nâng tầm công nghệ này lên mức độ sẵn sàng cho doanh nghiệp. Với mức tăng đáng kể 43%, CPU Với tốc độ xử lý nhanh, công cụ tối ưu hóa MuSGD tiên tiến và tính linh hoạt vượt trội trong các tác vụ xử lý hình ảnh, YOLO26 nổi bật như một lựa chọn tối ưu cho cả điện toán biên và triển khai đám mây quy mô lớn.

Đối với các nhóm ưu tiên cộng đồng năng động, tài liệu đầy đủ và trải nghiệm phát triển liền mạch, thì... Ultralytics Hệ sinh thái của YOLO là vô song. Nếu bạn đang tìm kiếm các mô hình cho các kịch bản chuyên biệt, bạn cũng có thể muốn nghiên cứu YOLO -World để phát hiện từ vựng mở không cần huấn luyện. Tuy nhiên, đối với phần lớn các trường hợp sử dụng thực tế, YOLO26 là lựa chọn được khuyến nghị nhất.


Bình luận