PP-YOLOE+ so với YOLO26: Phân tích chuyên sâu về các kiến trúc phát hiện đối tượng thời gian thực
Lĩnh vực thị giác máy tính thời gian thực đã chứng kiến sự tăng trưởng vượt bậc, được thúc đẩy bởi nhu cầu về các mô hình phát hiện đối tượng có khả năng mở rộng, hiệu quả và độ chính xác cao. Hai kiến trúc nổi bật trong lĩnh vực này là PP-YOLOE+ , một bộ phát hiện mạnh mẽ từ hệ sinh thái PaddlePaddle , và Ultralytics YOLO26 , mô hình tiên tiến nhất hiện nay đang định nghĩa lại hiệu quả triển khai và huấn luyện ở biên mạng.
Hướng dẫn toàn diện này so sánh hai mô hình trên, nêu bật kiến trúc, các chỉ số hiệu suất , phương pháp huấn luyện và các trường hợp sử dụng lý tưởng để giúp bạn đưa ra quyết định sáng suốt cho dự án AI tiếp theo của mình.
Thông số kỹ thuật và tác giả
Việc hiểu rõ nguồn gốc và triết lý thiết kế đằng sau những mô hình này sẽ cung cấp bối cảnh quan trọng cho việc ứng dụng chúng trong thực tế.
Chi tiết PP-YOLOE+:
- Tác giả: Các tác giả của PaddlePaddle
- Tổ chức:Baidu
- Ngày: 2 tháng 4 năm 2022
- Arxiv:https://arxiv.org/abs/2203.16250
- GitHub:Kho lưu trữ PaddleDetection
- Tài liệu:Tài liệu PP-YOLOE+
Chi tiết YOLO26:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 14 tháng 1 năm 2026
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu YOLO26
Đổi mới Kiến trúc
Kiến trúc PP-YOLOE+
Được xây dựng dựa trên phiên bản tiền nhiệm PP-YOLOv2, PP-YOLOE+ giới thiệu một thiết kế mạnh mẽ được tùy chỉnh cho các ứng dụng công nghiệp. Nó tận dụng backbone CSPRepResNet và một ET-head (Efficient Task-aligned head) để cân bằng tốc độ và độ chính xác. PP-YOLOE+ sử dụng gán nhãn động (TAL) và tích hợp liền mạch với framework PaddlePaddle của Baidu, làm cho nó được tối ưu hóa cao cho các GPU NVIDIA như T4 và V100. Tuy nhiên, việc nó phụ thuộc nhiều vào hệ sinh thái PaddlePaddle có thể gây khó khăn cho các nhà phát triển đã quen với quy trình làm việc PyTorch.
Kiến trúc YOLO26: Cuộc cách mạng ưu tiên cạnh
Ra mắt vào đầu năm 2026, Ultralytics YOLO26 hoàn toàn định hình lại quy trình phát hiện thời gian thực, tập trung mạnh vào sự đơn giản trong triển khai và hiệu quả tại biên.
Các cải tiến quan trọng của YOLO26 bao gồm:
- Thiết kế loại bỏ NMS đầu cuối (End-to-End NMS-Free): YOLO26 có tính đầu cuối tự nhiên, loại bỏ hoàn toàn nhu cầu hậu xử lý Non-Maximum Suppression (NMS). Bước đột phá này, lần đầu tiên được tiên phong trong YOLOv10, đảm bảo độ trễ suy luận nhất quán bất kể cảnh đông đúc, giúp việc triển khai đơn giản hơn đáng kể.
- Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss (DFL), YOLO26 đơn giản hóa đáng kể phần đầu ra của nó. Điều này mang lại khả năng tương thích tốt hơn nhiều với các thiết bị biên và vi điều khiển.
- Tăng tốc suy luận trên CPU lên đến 43%: Nhờ việc loại bỏ DFL và các tối ưu hóa cấu trúc, YOLO26 được tối ưu hóa mạnh mẽ cho các môi trường không có GPU chuyên dụng, đạt tốc độ suy luận trên CPU nhanh hơn tới 43% so với YOLO11.
- Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến như của Moonshot AI, YOLO26 giới thiệu một sự kết hợp lai giữa SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và hội tụ nhanh hơn cho các tác vụ thị giác máy tính.
- ProgLoss + STAL: Các hàm mất mát tiên tiến đặc biệt nhắm mục tiêu và cải thiện khả năng nhận diện vật thể nhỏ, điều này rất quan trọng đối với các hoạt động máy bay không người lái và cảm biến biên IoT.
Những cải tiến cụ thể cho từng tác vụ trong YOLO26
Ngoài các hộp giới hạn tiêu chuẩn, YOLO26 giới thiệu các nâng cấp cụ thể trên tất cả các tác vụ thị giác. Nó sử dụng hàm mất mát phân đoạn ngữ nghĩa và tạo mẫu đa tỷ lệ cho Phân đoạn, Ước tính Log-Likelihood dư (RLE) cho Ước tính Tư thế, và một hàm mất mát góc chuyên biệt để giải quyết các vấn đề ranh giới trong phát hiện Hộp giới hạn định hướng (OBB).
Hiệu suất và số liệu
Bảng dưới đây cung cấp cái nhìn toàn diện về cách PP-YOLOE+ so sánh với YOLO26 trên các kích thước mô hình khác nhau. Mô hình YOLO26 rõ ràng vượt trội về tốc độ xử lý thô, hiệu quả tham số và độ chính xác trung bình tổng thể ( mAP ) .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Lưu ý: Các giá trị được in đậm làm nổi bật các chỉ số hoạt động tốt nhất trên tất cả các mô hình.
Phân tích
- Yêu cầu và hiệu quả bộ nhớ: YOLO26 yêu cầu ít tham số và FLOPs hơn đáng kể để đạt được điểm mAP cao hơn. Ví dụ, mô hình YOLO26n (Nano) đạt 40.9 mAP chỉ với 2.4M tham số, vượt trội hơn mô hình PP-YOLOE+t trong khi kích thước chỉ bằng khoảng một nửa. Điều này dẫn đến việc sử dụng bộ nhớ thấp hơn trong cả quá trình huấn luyện và triển khai.
- Tốc độ suy luận: Khi xuất bằng TensorRT, YOLO26 chiếm ưu thế về các chỉ số độ trễ. Việc loại bỏ NMS đảm bảo rằng thời gian suy luận 1.7ms trên một GPU T4 vẫn hoàn toàn ổn định, trong khi PP-YOLOE+ phụ thuộc vào thời gian hậu xử lý có thể thay đổi.
Cái Ultralytics Ưu điểm: Hệ sinh thái và tính dễ sử dụng
Mặc dù các số liệu thô rất quan trọng, nhưng trải nghiệm của nhà phát triển thường quyết định sự thành công của dự án. Nền tảng Ultralytics cung cấp một hệ sinh thái được duy trì tốt, hoàn toàn vượt trội so với các framework cũ hơn.
- Dễ sử dụng: Ultralytics trừu tượng hóa mã boilerplate phức tạp. Huấn luyện YOLO26 chỉ mất vài dòng python, tránh các tệp cấu hình dày đặc mà PP-YOLOE+ yêu cầu.
- Tính linh hoạt: PP-YOLOE+ chủ yếu là một kiến trúc object detection. YOLO26 cung cấp hỗ trợ ngay lập tức cho segmentation, classification, ước tính tư thế và OBB.
- Hiệu quả huấn luyện: Các mô hình Ultralytics YOLO yêu cầu bộ nhớ CUDA thấp hơn đáng kể so với các mô hình transformer cồng kềnh như RT-DETR hoặc các kiến trúc cũ hơn, cho phép các nhà nghiên cứu huấn luyện các mô hình tiên tiến trên phần cứng phổ thông.
Khác Ultralytics Mô hình
Mặc dù YOLO26 là đỉnh cao của nghiên cứu hiện tại, nhưng Ultralytics Hệ sinh thái này cũng bao gồm YOLO11 và YOLOv8 . Cả hai đều là những mô hình mạnh mẽ với sự hỗ trợ cộng đồng lớn, lý tưởng cho người dùng chuyển đổi từ các hệ thống cũ hơn.
Ví dụ mã: Huấn luyện YOLO26
Bắt đầu với Ultralytics Quá trình này diễn ra liền mạch. Dưới đây là một ví dụ hoàn chỉnh minh demonstrating cách tải, huấn luyện và xác thực mô hình YOLO26:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 dataset using the new MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=16,
optimizer="auto", # MuSGD is automatically engaged for YOLO26
)
# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
print(f"Model successfully exported to: {export_path}")
Các trường hợp sử dụng lý tưởng
Khi nào nên chọn PP-YOLOE+
- Cơ sở hạ tầng PaddlePaddle cũ: Nếu một doanh nghiệp đã tích hợp sâu vào hệ sinh thái công nghệ của Baidu và sử dụng phần cứng được cấu hình sẵn cho Paddle Inference, PP-YOLOE+ là một lựa chọn an toàn, ổn định.
- Các Trung tâm Sản xuất Châu Á: Nhiều hệ thống thị giác công nghiệp ở Châu Á đã có sự hỗ trợ mạnh mẽ, có sẵn cho PP-YOLOE+ trong việc detect lỗi tự động.
Khi nào nên chọn YOLO26
- Điện toán biên và IoT: Suy luận CPU nhanh hơn 43% và việc loại bỏ DFL giúp YOLO26 trở thành nhà vô địch không thể tranh cãi để triển khai trên Raspberry Pi, điện thoại di động và các thiết bị nhúng.
- Các cảnh đông đúc và thành phố thông minh: Kiến trúc End-to-End NMS-Free đảm bảo độ trễ ổn định trong các môi trường dày đặc như quản lý bãi đỗ xe và giám sát giao thông, nơi NMS truyền thống sẽ gây ra tắc nghẽn.
- Các dự án đa nhiệm: Nếu pipeline của bạn yêu cầu track đối tượng, ước tính tư thế người hoặc tạo mặt nạ chính xác đến từng pixel, YOLO26 xử lý tất cả trong một gói python thống nhất duy nhất.
Kết luận
Mặc dù PP-YOLOE+ vẫn là một bộ dò có khả năng cao trong hệ sinh thái cụ thể của nó, nhưng sự ra mắt của YOLO26 đã thay đổi mô hình. Bằng cách kết hợp các tối ưu hóa huấn luyện lấy cảm hứng từ LLM (MuSGD) với một quá trình tối ưu hóa không ngừng, NMS - Kiến trúc tự do, Ultralytics YOLO26 đã tạo ra một mô hình vừa có độ chính xác cao vừa dễ dàng triển khai. Đối với các nhà phát triển hiện đại đang tìm kiếm sự cân bằng tốt nhất giữa tốc độ, độ chính xác và trải nghiệm người dùng, YOLO26 là sự lựa chọn tối ưu.