YOLO11 So sánh chi tiết kiến trúc và hiệu năng giữa PP-YOLOE và PP-YOLOE+

Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, ảnh hưởng đến mọi thứ từ tốc độ phát triển đến độ trễ triển khai. Hướng dẫn này cung cấp một so sánh kỹ thuật toàn diện giữa Ultralytics YOLO11 , một mô hình đa năng và được sử dụng rộng rãi ra mắt vào cuối năm 2024, và PP-YOLOE+ , một bộ phát hiện công nghiệp mạnh mẽ từ... PaddlePaddle hệ sinh thái.

Chúng tôi phân tích các kiến trúc này dựa trên các chỉ số về độ chính xác , tốc độ suy luận, tính dễ sử dụng và tính linh hoạt trong triển khai để giúp bạn lựa chọn công cụ tốt nhất cho ứng dụng cụ thể của mình.

Điểm chuẩn hiệu suất tương tác

Để hiểu rõ sự đánh đổi giữa các mô hình này, điều cần thiết là phải hình dung hiệu suất của chúng trên các tập dữ liệu chuẩn như COCO . Biểu đồ bên dưới minh họa sự cân bằng giữa độ chính xác trung bình (Average Precision) và độ chính xác trung bình (Average Precision). mAP ) và tốc độ suy luận, giúp bạn xác định "ranh giới Pareto" cho các ràng buộc về độ trễ của mình.

Phân tích các chỉ số hiệu suất

Bảng sau đây trình bày chi tiết về hiệu suất của mô hình. Ultralytics YOLO11 Các mô hình này thể hiện hiệu quả vượt trội, mang lại độ chính xác cao hơn với số lượng tham số ít hơn đáng kể so với các mô hình PP-YOLOE+ tương ứng.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

Ultralytics YOLO11 Kiến trúc và Hệ sinh thái

Ra mắt vào tháng 9 năm 2024, YOLO11 tiếp nối thành công của các phiên bản trước đó. YOLO các phiên bản, giới thiệu các thành phần kiến trúc được tinh chỉnh nhằm đạt hiệu quả trích xuất tính năng tối đa.

Các tính năng kiến trúc chính

Khối C3k2: Là sự phát triển của nút thắt cổ chai CSP (Cross Stage Partial), khối C3k2 sử dụng các phép toán tích chập nhanh hơn để cải thiện tốc độ xử lý trong khi vẫn duy trì luồng gradient.
Lưu ý về C2PSA: Việc giới thiệu mô-đun C2PSA (Cross-Stage Partial with Spatial Attention) giúp tăng cường khả năng tập trung vào các đối tượng nhỏ và kết cấu phức tạp của mô hình, một thách thức thường gặp trong phân tích ảnh vệ tinh .
Đầu đa nhiệm: Không giống như nhiều đối thủ cạnh tranh, YOLO11 Sử dụng cấu trúc đầu thống nhất hỗ trợ phát hiện, phân đoạn đối tượng , ước tính tư thế và hộp giới hạn định hướng (OBB) trong một khung duy nhất.

YOLO11 Chi tiết:

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 27/09/2024
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLO11

Tìm hiểu thêm về YOLO11

PP-YOLOE+: Kiến trúc và Hệ sinh thái

PP-YOLOE+ là phiên bản nâng cấp của PP-YOLOE, được phát triển bởi... PaddlePaddle Nhóm này được thiết kế như một nền tảng vững chắc cho các ứng dụng công nghiệp, tận dụng khung học sâu Baidu PaddlePaddle .

Các tính năng kiến trúc chính

CSPRepResStage: Kiến trúc xương sống này kết hợp các kết nối dư với các kỹ thuật tái tham số hóa, cho phép mô hình phức tạp trong quá trình huấn luyện nhưng được đơn giản hóa trong quá trình suy luận.
TAL (Học tập căn chỉnh nhiệm vụ): PP-YOLOE+ sử dụng chiến lược gán nhãn động giúp căn chỉnh các nhiệm vụ phân loại và định vị, cải thiện chất lượng lựa chọn mẫu tích cực.
Không cần neo: Giống như YOLO11 Nó sử dụng phương pháp không cần neo để giảm số lượng siêu tham số cần thiết cho việc điều chỉnh.

Chi tiết PP-YOLOE+:

Tác giả: PaddlePaddle Authors
Tổ chức: Baidu
Ngày: 02-04-2022
Arxiv: PP-YOLOE: Một phiên bản tiến hóa của YOLO
GitHub: PaddlePaddle /PaddleDetection
Tài liệu: PP-YOLOE+ README

Phân tích so sánh: Tại sao nên chọn Ultralytics ?

Mặc dù cả hai mẫu đều là những thiết bị dò tìm có khả năng, Ultralytics YOLO11 Mang lại những lợi thế rõ rệt về khả năng sử dụng, hỗ trợ hệ sinh thái và hiệu quả tài nguyên.

1. Dễ sử dụng và Triển khai

Một trong những điểm khác biệt quan trọng nhất nằm ở trải nghiệm người dùng. Ultralytics Các mẫu xe được thiết kế theo triết lý "không ma sát". Python API này cho phép các nhà phát triển tải, huấn luyện và triển khai mô hình chỉ với chưa đến năm dòng mã.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Ngược lại, PP-YOLOE+ dựa vào bộ công cụ PaddleDetection. Mặc dù mạnh mẽ, nó thường đòi hỏi người dùng phải học hỏi nhiều hơn, bao gồm các tệp cấu hình và các phụ thuộc cụ thể. PaddlePaddle Khung làm việc này có thể không trực quan lắm đối với những người dùng đã quen với quy trình làm việc PyTorch tiêu chuẩn.

2. Hiệu quả đào tạo và sử dụng bộ nhớ

Ultralytics YOLO Các mô hình này nổi tiếng về khả năng sử dụng tài nguyên hiệu quả.

Giảm dung lượng bộ nhớ sử dụng: YOLO11 Được tối ưu hóa để huấn luyện trên các GPU dành cho người tiêu dùng. Đây là một lợi thế quan trọng so với các kiến trúc nặng về transformer hoặc các mô hình công nghiệp cũ hơn yêu cầu bộ nhớ CUDA đáng kể.
Tốc độ hội tụ nhanh hơn: Nhờ các siêu tham số mặc định được tối ưu hóa và các kỹ thuật tăng cường dữ liệu như Mosaic và Mixup, YOLO11 Thường đạt được độ chính xác có thể sử dụng được trong ít chu kỳ hơn, giúp tiết kiệm chi phí tính toán.

3. Tính linh hoạt và khả năng hỗ trợ công việc

Các dự án thị giác máy tính hiện đại thường đòi hỏi nhiều hơn chỉ là các hộp giới hạn. Nếu phạm vi dự án của bạn mở rộng, Ultralytics Nó đáp ứng được nhu cầu của bạn mà không cần phải chuyển đổi sang framework khác.

YOLO11 : Hỗ trợ natively các chức năng Phát hiện đối tượng , Phân đoạn đối tượng , Ước tính tư thế , Hộp giới hạn định hướng (OBB) và Phân loại.
PP-YOLOE+: Chủ yếu tập trung vào phát hiện đối tượng. Mặc dù PaddleDetection hỗ trợ các tác vụ khác, nhưng chúng thường yêu cầu các kiến trúc mô hình và quy trình cấu hình khác nhau.

Triển khai tinh gọn

Ultralytics YOLO11 Các mô hình có thể được xuất sang hơn 10 định dạng khác nhau, bao gồm... ONNX , TensorRT , CoreML , Và TFLite với một phương pháp duy nhất: model.export(format='onnx')Tính linh hoạt vốn có này giúp đơn giản hóa đáng kể quy trình từ nghiên cứu đến sản xuất.

Tương lai của Trí tuệ Nhân tạo Thị giác: Giới thiệu YOLO26

Trong khi YOLO11 Đại diện cho một lựa chọn chín chắn và đáng tin cậy, lĩnh vực này vẫn tiếp tục phát triển. Dành cho các nhà phát triển đang tìm kiếm công nghệ tiên tiến nhất. Ultralytics YOLO26 được giới thiệu vào đầu năm 2026.

YOLO26 cách mạng hóa kiến trúc với thiết kế hoàn toàn không cần NMS từ đầu đến cuối , lần đầu tiên được tiên phong trong YOLOv10 . Bằng cách loại bỏ nhu cầu về Non-Maximum Suppression ( ) NMS Nhờ xử lý hậu kỳ và thuật toán Distribution Focal Loss (DFL), YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước. Nó cũng tích hợp trình tối ưu hóa MuSGD , một thuật toán lai giữa... SGD và Muon, đảm bảo động lực huấn luyện ổn định được truyền cảm hứng từ những đổi mới của LLM.

Đối với các dự án mới nhắm đến các thiết bị biên hoặc yêu cầu thông lượng cao nhất có thể, chúng tôi đặc biệt khuyên bạn nên tìm hiểu về YOLO26.

Tìm hiểu thêm về YOLO26

Các trường hợp sử dụng thực tế

Nơi YOLO11 vượt trội

AI và IoT biên: Nhờ tỷ lệ độ chính xác trên tham số cao, YOLO11n (Nano) rất phù hợp cho Raspberry Pi và các ứng dụng di động.
Chụp ảnh y tế: Khả năng thực hiện phân đoạn và phát hiện đồng thời khiến nó trở nên lý tưởng để xác định khối u hoặc phân tích cấu trúc tế bào.
Robot học: Khả năng hỗ trợ OBB của nó rất quan trọng đối với các tác vụ gắp vật bằng robot, nơi mà hướng đặt vật thể đóng vai trò quan trọng.

PP-YOLOE+ Phù Hợp Ở Đâu

Tích hợp hệ sinh thái Baidu: Nếu cơ sở hạ tầng của bạn đã được đầu tư mạnh vào điện toán đám mây AI của Baidu hoặc PaddlePaddle Với các bộ tăng tốc phần cứng, PP-YOLOE+ cung cấp khả năng tương thích gốc.
Camera công nghiệp cố định: Đối với suy luận phía máy chủ, nơi kích thước mô hình ít bị hạn chế hơn, PP-YOLOE+ vẫn là một lựa chọn cạnh tranh.

Kết luận

Cả hai YOLO11 PP-YOLOE+ và YOLOE+ đều là những kiến trúc phát hiện đối tượng có khả năng. Tuy nhiên, đối với phần lớn các nhà nghiên cứu và nhà phát triển, Ultralytics YOLO11 (và YOLO26 mới hơn) mang lại sự cân bằng vượt trội giữa hiệu năng, tính dễ sử dụng và hỗ trợ hệ sinh thái. Khả năng chuyển đổi liền mạch giữa các tác vụ, kết hợp với thư viện tài nguyên và tài liệu cộng đồng khổng lồ, đảm bảo dự án của bạn có khả năng thích ứng và mở rộng trong tương lai.

Để tìm hiểu sâu hơn về kiến trúc mô hình, hãy xem lại các so sánh của chúng tôi về RT-DETR cho phát hiện dựa trên transformer hoặc YOLOv10 để biết thêm về những đột phá hiệu quả thời gian thực trước đó.

YOLO11 So sánh chi tiết kiến ​​trúc và hiệu năng giữa PP-YOLOE và PP-YOLOE+

Điểm chuẩn hiệu suất tương tác

Phân tích các chỉ số hiệu suất

Ultralytics YOLO11 Kiến trúc và Hệ sinh thái

Các tính năng kiến trúc chính

PP-YOLOE+: Kiến trúc và Hệ sinh thái

Các tính năng kiến trúc chính

Phân tích so sánh: Tại sao nên chọn Ultralytics ?

1. Dễ sử dụng và Triển khai

2. Hiệu quả đào tạo và sử dụng bộ nhớ

3. Tính linh hoạt và khả năng hỗ trợ công việc

Tương lai của Trí tuệ Nhân tạo Thị giác: Giới thiệu YOLO26

Các trường hợp sử dụng thực tế

Nơi YOLO11 vượt trội

PP-YOLOE+ Phù Hợp Ở Đâu

Kết luận

Bình luận

YOLO11 So sánh chi tiết kiến trúc và hiệu năng giữa PP-YOLOE và PP-YOLOE+