Chuyển đến nội dung

YOLOv10 so với YOLO11 Kết nối đổi mới học thuật với quy mô thực tiễn

Sự phát triển của việc phát hiện đối tượng theo thời gian thực đã được đánh dấu bằng những tiến bộ nhanh chóng về tốc độ, độ chính xác và hiệu quả kiến ​​trúc. Hai nhân tố chính trong lịch sử gần đây là YOLOv10YOLO11 . Mặc dù cả hai mô hình đều đẩy giới hạn của những gì có thể đạt được với thị giác máy tính, nhưng chúng xuất phát từ các triết lý thiết kế khác nhau và nhắm đến các nhu cầu riêng biệt trong cộng đồng AI. Bài so sánh này sẽ khám phá các thông số kỹ thuật, sự khác biệt về kiến ​​trúc và các ứng dụng thực tiễn của cả hai mô hình để giúp các nhà phát triển lựa chọn công cụ phù hợp với yêu cầu cụ thể của họ.

YOLOv10 Người tiên phong trong lĩnh vực học thuật về phát hiện từ đầu đến cuối

Được các nhà nghiên cứu từ Đại học Thanh Hoa công bố vào tháng 5 năm 2024, YOLOv10 đã tạo ra một sự thay đổi mang tính đột phá trong lĩnh vực này. YOLO gia đình bằng cách tập trung vào chiến lược huấn luyện không có NMS . Trong lịch sử, YOLO Các mô hình dựa vào phương pháp loại bỏ cực đại không trùng lặp (Non-Maximum Suppression - NMS ) để lọc ra các hộp giới hạn chồng chéo trong quá trình suy luận. Mặc dù hiệu quả, NMS tạo ra nút thắt cổ chai về độ trễ triển khai và làm phức tạp quá trình xuất sang các định dạng như TensorRT hoặc ONNX .

Các Đổi Mới Kiến Trúc Chính

YOLOv10 Mô hình giải quyết những thách thức này thông qua chiến lược phân công kép trong quá trình huấn luyện. Nó sử dụng một đầu thu thập dữ liệu từ nhiều nguồn để giám sát chi tiết trong quá trình học và một đầu thu thập dữ liệu từ một nguồn để suy luận, cho phép mô hình dự đoán trực tiếp một hộp tối ưu nhất cho mỗi đối tượng. Điều này loại bỏ sự cần thiết phải... NMS Xử lý hậu kỳ, giúp giảm đáng kể độ trễ trên các thiết bị biên.

Ngoài ra, YOLOv10 Giới thiệu một thiết kế mô hình toàn diện hướng đến hiệu quả và độ chính xác . Điều này bao gồm các đầu phân loại nhẹ, lấy mẫu giảm không gian-kênh và thiết kế khối hướng dẫn theo thứ hạng, giúp giảm thiểu sự dư thừa tính toán.

Siêu dữ liệu kỹ thuật:

Tìm hiểu thêm về YOLOv10

Ultralytics YOLO11 Được tinh chỉnh cho quy mô doanh nghiệp

Được phát hành vào tháng 9 năm 2024, Ultralytics YOLO11 được xây dựng dựa trên nền tảng mạnh mẽ của YOLOv8YOLOv9 . Mặc dù vẫn giữ nguyên giao diện truyền thống, nó vẫn mang nét đặc trưng riêng. NMS -phương pháp dựa trên (không giống như phương pháp đầu cuối nguyên bản) YOLOv10 ), YOLO11 Nó tập trung mạnh vào hiệu quả trích xuất đặc trưngtối ưu hóa tham số . Nó được thiết kế để trở thành "dao đa năng" của thị giác máy tính, không chỉ xuất sắc trong việc phát hiện mà còn trên nhiều nhiệm vụ khác nhau bao gồm phân đoạn đối tượng , ước lượng tư thế , phân loại và phát hiện hộp giới hạn định hướng (OBB) .

Những tiến bộ trong YOLO11

YOLO11 Mô hình này giới thiệu kiến ​​trúc xương sống được tinh chỉnh (C3k2) giúp cải thiện khả năng tích hợp tính năng trên nhiều quy mô. Điều này cho phép mô hình thu thập các chi tiết phức tạp trong các cảnh phức tạp—chẳng hạn như các vật thể nhỏ trong ảnh chụp từ trên không—hiệu quả hơn so với các phiên bản trước đó. Hơn nữa, việc tích hợp vào hệ sinh thái Ultralytics đảm bảo hỗ trợ liền mạch cho việc huấn luyện , xác thực và triển khai trên nhiều nền tảng phần cứng khác nhau, từ NVIDIA Jetson đến CPU cơ bản.

Siêu dữ liệu kỹ thuật:

Tìm hiểu thêm về YOLO11

So sánh hiệu suất

Khi so sánh hiệu năng, điều quan trọng là phải nhìn xa hơn những giá trị thô. mAP Hãy xem xét các con số và sự đánh đổi giữa tốc độ, kích thước mô hình (tham số) và chi phí tính toán (FLOPs).

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Phân tích dữ liệu

Mặc dù YOLOv10 có số lượng tham số thấp hơn trong một số cấu hình (như mô hình 'M'), YOLO11 thường đạt được điểm mAP cao hơn và tốc độ suy luận cạnh tranh hoặc vượt trội trên GPU T4, chứng minh hiệu quả của kiến ​​trúc xương sống được tối ưu hóa của nó.

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn YOLOv10

YOLOv10 là lựa chọn tuyệt vời cho các dự án nghiên cứu hoặc các kịch bản triển khai biên cụ thể, nơi cần loại bỏ NMS Bước này rất quan trọng để giảm độ trễ. Kiến trúc đầu cuối của nó đơn giản hóa quy trình xuất dữ liệu cho một số hệ thống nhúng mà việc triển khai logic xử lý hậu kỳ một cách hiệu quả gặp khó khăn.

  • Hệ thống nhúng: Các thiết bị có chức năng hạn chế CPU chu kỳ xử lý hậu kỳ.
  • Nghiên cứu học thuật: Học tập NMS - Kiến trúc tự do và chiến lược đào tạo phân công kép.
  • Các ứng dụng đòi hỏi độ trễ cực thấp: Robot tốc độ cao, nơi mà từng mili giây độ trễ suy luận đều rất quan trọng.

Khi nào nên chọn Ultralytics YOLO11

YOLO11 Đây là giải pháp được ưu tiên cho các ứng dụng cấp độ sản xuất đòi hỏi sự cân bằng giữa độ chính xác cao, tính linh hoạt và dễ sử dụng. Được hỗ trợ bởi Nền tảng Ultralytics , nó cung cấp quy trình làm việc được tối ưu hóa từ chú thích dữ liệu đến giám sát mô hình.

  • Giải pháp dành cho doanh nghiệp: Triển khai quy mô lớn đòi hỏi mã nguồn đáng tin cậy, được bảo trì thường xuyên và giấy phép thương mại .
  • Các tác vụ thị giác phức tạp: Các dự án cần ước lượng tư thế hoặc phân đoạn cùng với phát hiện.
  • Đào tạo trên nền tảng đám mây: Tích hợp liền mạch với nền tảng Ultralytics để quản lý tập dữ liệu và các lần chạy đào tạo.
  • Tính linh hoạt: Phù hợp với các nhà phát triển cần một framework duy nhất để xử lý phân loại , phát hiện và phân đoạn đối tượng với một API thống nhất.

Lợi thế Hệ sinh thái Ultralytics

Một trong những yếu tố khác biệt quan trọng nhất của YOLO11 chính là hệ sinh thái xung quanh. Trong khi đó, YOLOv10 Đây là một đóng góp học thuật ấn tượng. YOLO11 Được hưởng lợi từ các bản cập nhật liên tục, tài liệu đầy đủ và sự tích hợp chặt chẽ với các công cụ như Ultralytics Explorer .

  • Dễ sử dụng: Đơn giản Python Giao diện này cho phép huấn luyện mô hình chỉ với vài dòng mã.
  • Hiệu quả bộ nhớ: Ultralytics Các mô hình này được tối ưu hóa để sử dụng ít bộ nhớ hơn trong quá trình huấn luyện so với nhiều mô hình thay thế dựa trên Transformer, giúp chúng có thể truy cập được trên các GPU cấp người tiêu dùng.
  • Khả năng tương thích rộng: Xuất dữ liệu của bạn YOLO11 Chuyển đổi mô hình sang CoreML , OpenVINO , TensorRT và nhiều công cụ khác chỉ với một lệnh duy nhất.
from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Hướng tới tương lai: Cùng YOLO26 khám phá tương lai!

Trong khi YOLOv10 Và YOLO11 Đại diện cho những cột mốc quan trọng, lĩnh vực này phát triển rất nhanh. Đối với các nhà phát triển tìm kiếm công nghệ tiên tiến nhất, YOLO26 (phát hành tháng 1 năm 2026) kết hợp những ưu điểm tốt nhất của cả hai thế giới.

YOLO26 áp dụng thiết kế đầu cuối không cần NMS một thiết kế tiên phong của YOLOv10 nhưng tinh chỉnh nó bằng Ultralytics 'Tối ưu hóa chữ ký cho quy mô doanh nghiệp. Nó có tính năng loại bỏ DFL (Distribution Focal Loss) để xuất dữ liệu đơn giản hơn và trình tối ưu hóa MuSGD tiên tiến cho sự hội tụ huấn luyện ổn định, lấy cảm hứng từ LLM. Với khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ trước và các hàm mất mát được cải tiến như ProgLoss + STAL , YOLO26 là sự lựa chọn tối ưu cho các dự án thị giác máy tính hiện đại.'

Tìm hiểu thêm về YOLO26

Đối với người dùng quan tâm đến các kiến ​​trúc chuyên biệt khác, tài liệu cũng đề cập đến RT-DETR để phát hiện dựa trên transformer và YOLO -World cho các tác vụ từ vựng mở.


Bình luận