Chuyển đến nội dung

YOLO11 so với YOLOv10 So sánh kỹ thuật toàn diện các thiết bị phát hiện vật thể thời gian thực

Lĩnh vực thị giác máy tính thời gian thực liên tục phát triển, với các kiến ​​trúc mới liên tục mở rộng giới hạn của những gì có thể thực hiện được trên cả thiết bị biên và cơ sở hạ tầng đám mây. Trong phân tích kỹ thuật chi tiết này, chúng ta sẽ khám phá những điểm khác biệt giữa hai mô hình quan trọng trong lĩnh vực này: Ultralytics YOLO11YOLOv10 . Cả hai đều đại diện cho những bước tiến đáng kể trong khả năng phát hiện đối tượng , nhưng chúng lại áp dụng các triết lý kiến ​​trúc khác nhau về cơ bản để đạt được hiệu suất của mình.

Mở hộp YOLO11 Ngành kiến ​​​​trúc

YOLO11 Chi tiết:

Được giới thiệu như một cỗ máy mạnh mẽ đa năng, YOLO11 Được xây dựng dựa trên nhiều năm nghiên cứu nền tảng về thị giác máy tính và trí tuệ nhân tạo . Triết lý thiết kế cốt lõi của... YOLO11 Tập trung vào sự phong phú về tính năng và tính linh hoạt vượt trội trong nhiều tác vụ thị giác máy tính khác nhau.

Một trong những cải tiến nổi bật là YOLO11 Đây là phần triển khai của khối C3k2 . Mô-đun điều tiết nút thắt cổ chai được tinh chỉnh này tối ưu hóa luồng gradient trong toàn bộ mạng, cải thiện đáng kể hiệu quả tham số trong khi vẫn duy trì độ chính xác cao. Ngoài ra, YOLO11 Nó sử dụng cơ chế chú ý không gian nâng cao, rất quan trọng để xác định các vật thể nhỏ hoặc bị che khuất một phần. Điều này làm cho nó trở thành lựa chọn đặc biệt cho các trường hợp sử dụng ảnh chụp từ trên khôngphân tích hình ảnh y tế chi tiết.

YOLO11 Nó sử dụng thiết kế không cần neo (anchor-free) giúp giảm thiểu độ phức tạp của việc điều chỉnh siêu tham số, cho phép khả năng khái quát hóa mạnh mẽ trên nhiều tập dữ liệu tùy chỉnh. Hơn nữa, yêu cầu về bộ nhớ trong quá trình huấn luyện thấp hơn đáng kể so với các kiến ​​trúc dựa trên Transformer, cho phép các nhà nghiên cứu huấn luyện các mô hình lớn một cách hiệu quả trên phần cứng tiêu chuẩn của người dùng.

Tìm hiểu thêm về YOLO11

Khám phá YOLOv10 Ngành kiến ​​​​trúc

YOLOv10 Chi tiết:

Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 đã tạo nên tiếng vang lớn với vai trò tiên phong trong toàn bộ quy trình. YOLO gia đình. Dấu ấn đặc trưng của YOLOv10 Điểm nổi bật của mô hình là phương pháp huấn luyện không sử dụng NMS . Bằng cách sử dụng các phép gán kép nhất quán trong giai đoạn huấn luyện, mô hình tự nhiên dự đoán chính xác một hộp giới hạn cho mỗi đối tượng. Bước đột phá này loại bỏ hoàn toàn nhu cầu sử dụng Non-Maximum Suppression ( NMS ) trong quá trình suy luận, một bước xử lý hậu kỳ trước đây thường gây ra tắc nghẽn độ trễ trong các quy trình triển khai.

Kiến trúc này cũng giới thiệu một chiến lược thiết kế hiệu quả-độ chính xác toàn diện. Nó kết hợp việc lấy mẫu giảm tách rời kênh không gian và thiết kế khối hướng dẫn theo thứ hạng nhằm giảm thiểu sự dư thừa một cách có chọn lọc trong các giai đoạn mạng. Điều này dẫn đến số lượng phép tính FLOP ít hơn và giảm chi phí tính toán mà không làm giảm đáng kể độ chính xác trung bình ( mAP ) . Đối với các ứng dụng thời gian thực, nơi mỗi mili giây đều quan trọng, việc loại bỏ... NMS Cung cấp một đồ thị suy luận xác định, rất phù hợp cho các thiết bị AI biên .

Tìm hiểu thêm về YOLOv10

Các chỉ số hiệu suất và điểm chuẩn

Khi đánh giá hai mô hình này, chúng ta xem xét sự cân bằng giữa độ chính xác, số lượng tham số và tốc độ. Bảng sau đây thể hiện sự so sánh giữa chúng trên nhiều thang đo khác nhau trên tập dữ liệu COCO .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Như đã quan sát thấy trong các chỉ số hiệu suất YOLO , YOLO11 thường đạt được kết quả cao hơn một chút mAP Điểm số đạt được trên các biến thể của nó, đặc biệt là ở các mẫu lớn hơn. NMS - Thiết kế miễn phí của YOLOv10 đảm bảo thời gian suy luận đầu cuối cực kỳ ổn định, nhưng YOLO11 vẫn duy trì hiệu suất vượt trội khi được tối ưu hóa bằng TensorRT . NVIDIA phần cứng.

Xuất khẩu để sản xuất

Khi chuẩn bị mô hình để triển khai, việc xuất sang các định dạng tối ưu là rất quan trọng. Cả hai YOLO11 Và YOLOv10 có thể xuất khẩu liền mạch sang các định dạng như ONNX Và TensorRT sử dụng Ultralytics khung. Xem hướng dẫn của chúng tôi về các tùy chọn triển khai mô hình để biết hướng dẫn từng bước.

Lợi thế Hệ sinh thái Ultralytics

Mặc dù các chỉ số hiệu suất độc lập rất quan trọng, nhưng khuôn khổ xung quanh mới quyết định sự thành công thực tế của một dự án học máy. Đây là điểm mấu chốt. YOLO11 , với tư cách là công dân bản địa của Ultralytics Hệ sinh thái này thực sự tỏa sáng.

Nền tảng Ultralytics cung cấp trải nghiệm người dùng vô cùng đơn giản. Với API Python thống nhất và dễ sử dụng, các nhà phát triển có thể xử lý các tác vụ vượt xa việc chỉ vẽ các hộp giới hạn cơ bản. YOLO11 Hỗ trợ phân đoạn đối tượng gốc, ước lượng tư thế , phân loại hình ảnh và phát hiện hộp giới hạn định hướng (OBB) ngay từ đầu. Tính linh hoạt vượt trội này thường thiếu trong các kho lưu trữ nghiên cứu chuyên biệt.

Hơn nữa, hệ sinh thái này được hỗ trợ bởi tài liệu đầy đủ và sự tham gia tích cực của cộng đồng. Nó tích hợp với các công cụ như Weights & Biases để theo dõi thí nghiệm và OpenVINO để... Intel Việc tối ưu hóa phần cứng được tích hợp trực tiếp vào thư viện. Việc huấn luyện mô hình yêu cầu mã mẫu tối thiểu và được hưởng lợi từ các quy trình huấn luyện hiệu quả cao, đòi hỏi ít hơn. CUDA có bộ nhớ nhỏ hơn so với các mô hình biến áp nặng như RT-DETR .

Ví dụ mã thực hành

Huấn luyện và chạy suy luận với Ultralytics Được thiết kế để trực quan nhất có thể. API giống hệt nhau xử lý cả hai trường hợp. YOLO11 Và YOLOv10 một cách dễ dàng.

from ultralytics import YOLO

# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")

# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects
inference_results[0].show()

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLO11 Và YOLOv10 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn YOLO11

YOLO11 là một lựa chọn tốt cho:

  • Triển khai tại biên môi trường sản xuất: Các ứng dụng thương mại trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson , nơi độ tin cậy và bảo trì thường xuyên là yếu tố tối quan trọng.
  • Ứng dụng thị giác đa nhiệm: Các dự án yêu cầu phát hiện , phân đoạn , ước lượng tư thếOBB trong một khung thống nhất duy nhất.
  • Tạo mẫu và triển khai nhanh chóng: Các nhóm cần chuyển nhanh từ thu thập dữ liệu sang sản xuất bằng cách sử dụng API Python Ultralytics được tối ưu hóa.

Khi nào nên chọn YOLOv10

YOLOv10 được khuyến nghị cho:

  • NMS - Phát hiện thời gian thực không cần hệ thống quản lý truy cập (NMS): Các ứng dụng được hưởng lợi từ khả năng phát hiện toàn diện mà không cần hệ thống loại bỏ truy cập không tối đa (Non-Maximum Suppression), giúp giảm độ phức tạp khi triển khai.
  • Cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng tốt giữa tốc độ suy luận và độ chính xác phát hiện trên nhiều quy mô mô hình khác nhau.
  • Ứng dụng độ trễ ổn định: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như robot hoặc hệ thống tự hành.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Thế hệ tiếp theo: YOLO26

Trong khi YOLOv10 giới thiệu cuộc cách mạng NMS - mô hình tự do và YOLO11 Với khả năng thực hiện nhiều tác vụ cùng lúc một cách hoàn hảo, lĩnh vực trí tuệ nhân tạo đang phát triển rất nhanh chóng. Đối với các nhà phát triển bắt đầu triển khai sản phẩm mới ngày nay, chúng tôi đặc biệt khuyên bạn nên tìm hiểu Ultralytics YOLO26 .

Ra mắt vào tháng 1 năm 2026, YOLO26 kết hợp những ưu điểm tốt nhất của cả hai thế giới. Nó áp dụng nguyên bản thiết kế "Không cần NMS từ đầu đến cuối, một thiết kế tiên phong của... YOLOv10 Điều này giúp đơn giản hóa đáng kể quy trình triển khai và đảm bảo độ trễ ổn định. Hơn nữa, YOLO26 tích hợp các tối ưu hóa điện toán biên chuyên biệt. Bằng cách thực hiện loại bỏ DFL (loại bỏ hiện tượng mất tiêu điểm phân tán), kiến ​​trúc này đảm bảo khả năng xuất khẩu dễ dàng hơn và đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với các mô hình cũ, biến nó trở thành lựa chọn hàng đầu cho các thiết bị IoT công suất thấp và ứng dụng di động.

YOLO26 cũng mang lại sự ổn định trong huấn luyện Mô hình Ngôn ngữ Lớn (LLM) cho thị giác máy tính thông qua Trình tối ưu hóa MuSGD tiên tiến, một mô hình lai được lấy cảm hứng từ nghiên cứu AI hiện đại. Kết hợp với các hàm mất mát ProgLoss + STAL , YOLO26 mang lại độ chính xác vượt trội trên các vật thể nhỏ, điều này rất cần thiết cho việc phát hiện video giao thông chi tiết và tự động hóa robot phức tạp.

Tìm hiểu thêm về YOLO26

Kết luận

Việc lựa chọn mô hình thị giác phù hợp phụ thuộc vào các ràng buộc hoạt động cụ thể của bạn. YOLOv10 Đây là một cột mốc quan trọng trong giới học thuật, chứng minh rằng... NMS có thể loại bỏ hiệu quả khỏi quy trình phát hiện. Tuy nhiên, để đạt được sự cân bằng vượt trội giữa hiệu năng, tính linh hoạt toàn diện trong các tác vụ và các công cụ triển khai liền mạch, YOLO11 cung cấp một giải pháp mạnh mẽ, sẵn sàng cho doanh nghiệp.

Đối với các kỹ sư muốn có công nghệ tiên tiến nhất – kết hợp sự đơn giản từ đầu đến cuối với hiệu năng cực nhanh – việc chuyển sang YOLO26 phiên bản mới nhất là sự lựa chọn tối ưu. Bằng cách tận dụng Nền tảng Ultralytics toàn diện, bạn đảm bảo các dự án của mình được xây dựng trên một nền tảng được bảo trì tốt, hiệu quả cao và có khả năng đáp ứng nhu cầu trong tương lai.


Bình luận