Chuyển đến nội dung

YOLO11 So sánh kỹ thuật giữa hai thiết bị dò thời gian thực: PP-YOLOE+

Việc lựa chọn kiến ​​trúc mạng nơ-ron tối ưu là rất quan trọng khi triển khai các ứng dụng thị giác máy tính trong môi trường sản xuất. Trong bài so sánh kỹ thuật này, chúng tôi xem xét hai mô hình nổi bật trong lĩnh vực phát hiện đối tượng thời gian thực: Ultralytics YOLO11 và Baidu PP-YOLOE+. Cả hai kiến ​​trúc đều cung cấp hiệu năng mạnh mẽ, nhưng chúng tiếp cận các thách thức về độ chính xác, tốc độ suy luận và hệ sinh thái nhà phát triển theo những cách khá khác nhau.

Dưới đây là biểu đồ tương tác thể hiện giới hạn hiệu năng của các mẫu máy này, giúp bạn xác định mẫu máy phù hợp nhất với các hạn chế phần cứng của mình.

Nguồn gốc và dòng dõi kỹ thuật của mẫu xe

Việc hiểu rõ nguồn gốc và triết lý thiết kế của các mô hình này sẽ cung cấp bối cảnh quan trọng cho những điểm mạnh và trường hợp sử dụng lý tưởng của chúng.

YOLO11 Chi tiết

Được phát triển bởi Ultralytics , YOLO11 đại diện cho một phiên bản được tinh chỉnh cao của YOLO Dòng sản phẩm này ưu tiên sự cân bằng giữa tốc độ suy luận cao, hiệu quả tham số tối ưu và tính dễ sử dụng vượt trội. Nó được công nhận rộng rãi nhờ khả năng đa nhiệm thống nhất và thân thiện với nhà phát triển. Python API.

Tìm hiểu thêm về YOLO11

Thông tin chi tiết về PP-YOLOE+

PP-YOLOE+ là phiên bản nâng cấp của PP-YOLOv2, được xây dựng dựa trên... PaddlePaddle Khung phần mềm này giới thiệu những thay đổi về kiến ​​trúc như kiến ​​trúc xương sống CSPRepResNet và Học căn chỉnh tác vụ (TAL) để đẩy giới hạn về độ chính xác, đặc biệt là trên các GPU cao cấp.

Tìm hiểu thêm về PP-YOLOE+

Sự khác biệt về kiến trúc

Các thiết kế kiến ​​trúc cơ bản của YOLO11 và PP-YOLOE+ phản ánh những ưu tiên khác nhau của chúng trong lĩnh vực thị giác máy tính .

YOLO11 được xây dựng dựa trên một kiến ​​trúc xương sống được tối ưu hóa cao và một đầu phát hiện không cần neo. Nó sử dụng các khối C3k2 và Spatial Pyramid Pooling - Fast (SPPF) để thu thập các đặc trưng đa tỷ lệ với chi phí tính toán tối thiểu. Thiết kế này rất có lợi trong việc giảm độ trễ suy luận trên các thiết bị hạn chế tài nguyên như NPU biên và CPU di động. Hơn nữa, YOLO11 Được thiết kế dành riêng cho học tập đa nhiệm, hỗ trợ phân đoạn đối tượng , ước lượng tư thếphát hiện hộp giới hạn định hướng (OBB) ngay từ đầu.

PP-YOLOE+ giới thiệu kiến ​​trúc xương sống CSPRepResNet và một phần đầu được căn chỉnh theo nhiệm vụ hiệu quả (ET-head). Nó tận dụng tối đa các kỹ thuật tham số hóa biểu diễn để tăng khả năng biểu diễn trong quá trình huấn luyện, đồng thời tích hợp các tham số đó vào các phép tích chập tiêu chuẩn cho quá trình suy luận. Mặc dù điều này mang lại độ chính xác trung bình ( mAP ) ấn tượng, nhưng các mô hình thu được có xu hướng nặng hơn về số lượng tham số và dung lượng bộ nhớ, khiến chúng phù hợp hơn để triển khai trên các GPU máy chủ mạnh mẽ hơn là các thiết bị biên nhẹ.

Tính linh hoạt đa nhiệm

Nếu dự án của bạn yêu cầu mở rộng ra ngoài các khung giới hạn tiêu chuẩn, Ultralytics YOLO11 Cung cấp hỗ trợ gốc cho phân đoạn, ước tính tư thế và phân loại trong cùng một API, giúp giảm đáng kể chi phí phát triển so với việc tích hợp nhiều kho lưu trữ riêng biệt.

Hiệu năng và điểm chuẩn

Khi đánh giá hiệu suất, chúng ta xem xét độ chính xác ( mAP ), tốc độ suy luận trên các phần cứng khác nhau và hiệu quả của mô hình (tham số và FLOPs). Bảng dưới đây nêu bật các chỉ số so sánh, với các giá trị hiệu quả nhất hoặc có hiệu suất cao nhất được in đậm .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Phân tích

YOLO11 thể hiện một lợi thế rõ ràng trong cân bằng hiệu suất và hiệu quả tham số. Ví dụ, YOLO11m đạt được mức cao hơn mAP (51,5) hơn PP-YOLOE+m (49,8) trong khi sử dụng ít tham số hơn (20,1 triệu so với 23,43 triệu) và đạt được tốc độ suy luận nhanh hơn đáng kể trên TensorRT (4,7ms so với 5,56ms). Tính chất nhẹ của YOLO11 Các mô hình này vốn dĩ dẫn đến yêu cầu bộ nhớ thấp hơn trong cả hai trường hợp. huấn luyện mô hình và triển khai.

Hệ sinh thái đào tạo và tính dễ sử dụng

Giá trị thực sự của một mô hình thường nằm ở việc các nhà phát triển có thể dễ dàng huấn luyện nó trên các tập dữ liệu thị giác máy tính tùy chỉnh và triển khai nó vào môi trường sản xuất như thế nào.

Lợi thế của Ultralytics

Ultralytics Ưu tiên trải nghiệm phát triển được tối ưu hóa. Đào tạo YOLO11 được quản lý thông qua một phương pháp đơn giản. Python API hoặc CLI Loại bỏ các đoạn mã phức tạp rườm rà. Nền tảng Ultralytics còn nâng cao điều này hơn nữa bằng cách cung cấp đào tạo không cần lập trình, quản lý tập dữ liệu tự động và xuất dữ liệu chỉ bằng một cú nhấp chuột sang các định dạng như ONNX , CoreML và TensorRT .

Hơn nữa, YOLO Các mô hình này rất tiết kiệm bộ nhớ trong quá trình huấn luyện, tránh được tình trạng tiêu tốn dung lượng VRAM khổng lồ thường thấy ở các kiến ​​trúc dựa trên transformer hoặc các mô hình tham số hóa rep phức tạp, cho phép huấn luyện trên phần cứng cấp độ người tiêu dùng.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Hệ sinh thái PP-YOLOE+

PP-YOLOE+ hoạt động trong hệ sinh thái PaddleDetection. Mặc dù khung phần mềm này mạnh mẽ và được tích hợp sâu rộng với các giải pháp công nghiệp của Baidu, nhưng nó yêu cầu các nhà phát triển phải áp dụng các quy định cụ thể. PaddlePaddle khung học sâu. Điều này có thể tạo ra một đường cong học tập dốc hơn cho các nhóm đã quen thuộc với hệ thống này. PyTorch Ngoài ra, việc xuất các mô hình PP-YOLOE+ sang các định dạng phổ quát tiêu chuẩn cho các thiết bị biên có thể yêu cầu các bước chuyển đổi bổ sung so với các quy trình xuất gốc được tìm thấy trong... Ultralytics quy trình làm việc.

Các trường hợp sử dụng lý tưởng

Việc lựa chọn giữa các mô hình này phụ thuộc vào môi trường triển khai cụ thể của bạn.

  • Hãy chọn YOLO11 cho phát triển phần mềm linh hoạt, điện toán biên và ứng dụng di động. Tốc độ suy luận cao, dung lượng bộ nhớ thấp và khả năng xuất dữ liệu mở rộng khiến nó trở nên lý tưởng cho các tác vụ như quản lý kho hàng bán lẻ thời gian thực trên CPU tiêu chuẩn, phân tích ảnh chụp từ trên không bằng máy bay không người lái và các quy trình đa nhiệm phức tạp.
  • Hãy chọn PP-YOLOE+ nếu toàn bộ dây chuyền sản xuất của bạn đã được đầu tư mạnh vào hệ thống này. PaddlePaddle hoặc nếu bạn đang triển khai trên các máy chủ suy luận chuyên dụng cao cấp, nơi các hạn chế về bộ nhớ và khả năng tương thích phần cứng (ngoài phần cứng được tối ưu hóa của Paddle) không phải là mối quan tâm chính.

Thế hệ tiếp theo: Giới thiệu YOLO26

Trong khi YOLO11 Mặc dù vẫn vô cùng mạnh mẽ, lĩnh vực trí tuệ nhân tạo (AI) phát triển rất nhanh. Để có được công nghệ tiên tiến nhất trong phát hiện đối tượng, Ultralytics đã giới thiệu YOLO26 mới. Được phát hành vào tháng 1 năm 2026, YOLO26 kế thừa những thành công của các phiên bản tiền nhiệm để mang lại hiệu quả và độ chính xác chưa từng có.

Những cải tiến quan trọng của YOLO26:

  • Thiết kế hoàn toàn không cần NMS : YOLO26 loại bỏ hoàn toàn quá trình xử lý hậu kỳ Non-Maximum Suppression ( NMS ) . Điều này giúp tăng tốc đáng kể quá trình suy luận và đơn giản hóa logic triển khai, một bước tiến đột phá về kiến ​​trúc lần đầu tiên được tiên phong trong YOLOv10 .
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa đặc biệt cho các thiết bị biên không có GPU, đảm bảo hiệu năng thời gian thực trên phần cứng công suất thấp.
  • MuSGD Optimizer: Lấy cảm hứng từ sự ổn định của quá trình huấn luyện LLM, đây là sự kết hợp của... SGD và Muon đảm bảo sự hội tụ nhanh hơn và quá trình huấn luyện ổn định hơn.
  • ProgLoss + STAL: Các hàm mất mát được cải tiến giúp tăng cường đáng kể khả năng nhận dạng vật thể nhỏ, điều này rất quan trọng đối với các ứng dụng máy bay không người lái và giám sát an ninh.
  • Loại bỏ DFL: Việc loại bỏ Suy hao tiêu điểm phân tán (Distribution Focal Loss - DFL) giúp đơn giản hóa việc xuất mô hình và cải thiện đáng kể khả năng tương thích trên nhiều thiết bị biên khác nhau.

Đối với các dự án mới ưu tiên tốc độ, xuất dữ liệu liền mạch và độ chính xác tối đa, chúng tôi đặc biệt khuyên bạn nên tận dụng các khả năng của YOLO26 thông qua Nền tảng Ultralytics .

Nếu bạn đang đánh giá các kiến ​​trúc khác, bạn cũng có thể quan tâm đến việc so sánh YOLO11 đến RT-DETR hoặc khám phá xem YOLOv8 cũ hoạt động như thế nào trong các bài kiểm tra hiệu năng hiện đại.


Bình luận