Chuyển đến nội dung

PP-YOLOE+ so với YOLO26: Phân tích chuyên sâu về các kiến ​​trúc phát hiện đối tượng thời gian thực

Lĩnh vực thị giác máy tính thời gian thực đã chứng kiến ​​sự tăng trưởng vượt bậc, được thúc đẩy bởi nhu cầu về các mô hình phát hiện đối tượng có khả năng mở rộng, hiệu quả và độ chính xác cao. Hai kiến ​​trúc nổi bật trong lĩnh vực này là PP-YOLOE+ , một bộ phát hiện mạnh mẽ từ hệ sinh thái PaddlePaddle , và Ultralytics YOLO26 , mô hình tiên tiến nhất hiện nay đang định nghĩa lại hiệu quả triển khai và huấn luyện ở biên mạng.

Hướng dẫn toàn diện này so sánh hai mô hình trên, nêu bật kiến ​​trúc, các chỉ số hiệu suất , phương pháp huấn luyện và các trường hợp sử dụng lý tưởng để giúp bạn đưa ra quyết định sáng suốt cho dự án AI tiếp theo của mình.

Thông số kỹ thuật và tác giả

Việc hiểu rõ nguồn gốc và triết lý thiết kế đằng sau những mô hình này sẽ cung cấp bối cảnh quan trọng cho việc ứng dụng chúng trong thực tế.

Chi tiết PP-YOLOE+:

Tìm hiểu thêm về PP-YOLOE+

Chi tiết YOLO26:

Tìm hiểu thêm về YOLO26

Đổi mới Kiến trúc

Kiến trúc PP-YOLOE+

Được xây dựng dựa trên phiên bản tiền nhiệm PP-YOLOv2, PP-YOLOE+ giới thiệu một thiết kế mạnh mẽ được tùy chỉnh cho các ứng dụng công nghiệp. Nó tận dụng kiến ​​trúc xương sống CSPRepResNet và đầu ET (Efficient Task-aligned head) để cân bằng tốc độ và độ chính xác . PP-YOLOE+ sử dụng gán nhãn động (TAL) và tích hợp liền mạch với Baidu. PaddlePaddle khung, giúp nó được tối ưu hóa cao cho NVIDIA Các GPU như T4 và V100. Tuy nhiên, nó phụ thuộc rất nhiều vào... PaddlePaddle Hệ sinh thái có thể gây khó khăn cho các nhà phát triển đã quen với quy trình làm việc PyTorch .

Kiến trúc YOLO26: Cuộc cách mạng ưu tiên cạnh

Ra mắt vào đầu năm 2026, Ultralytics YOLO26 hoàn toàn định hình lại quy trình phát hiện thời gian thực, tập trung mạnh vào sự đơn giản trong triển khai và hiệu quả tại biên.

Các cải tiến quan trọng của YOLO26 bao gồm:

  • Thiết kế không cần NMS từ đầu đến cuối: YOLO26 được thiết kế từ đầu đến cuối, loại bỏ hoàn toàn nhu cầu xử lý hậu kỳ bằng phương pháp loại bỏ cực đại không tương thích ( NMS ). Bước đột phá này, lần đầu tiên được tiên phong trong YOLOv10 , đảm bảo độ trễ suy luận nhất quán bất kể mật độ khung hình, giúp việc triển khai trở nên đơn giản hơn đáng kể.
  • Loại bỏ DFL: Bằng cách loại bỏ hiện tượng suy hao tiêu điểm phân tán (DFL), YOLO26 đơn giản hóa đáng kể đầu ra của nó. Điều này dẫn đến khả năng tương thích tốt hơn nhiều với các thiết bị biên và bộ vi điều khiển.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Nhờ việc loại bỏ DFL và các tối ưu hóa cấu trúc, YOLO26 được tối ưu hóa mạnh mẽ cho các môi trường không có GPU chuyên dụng, đạt được tốc độ suy luận trên CPU nhanh hơn tới 43% so với YOLO11 .
  • MuSGD Optimizer: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến như của Moonshot AI , YOLO26 giới thiệu một sự kết hợp giữa... SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn cho các tác vụ thị giác máy tính.
  • ProgLoss + STAL: Các hàm mất mát nâng cao được thiết kế đặc biệt để cải thiện khả năng nhận dạng vật thể nhỏ, điều này rất quan trọng đối với hoạt động của máy bay không người lái và các cảm biến IoT biên.

Những cải tiến cụ thể cho từng tác vụ trong YOLO26

Ngoài các hộp giới hạn tiêu chuẩn, YOLO26 còn giới thiệu những nâng cấp cụ thể cho tất cả các tác vụ thị giác. Nó sử dụng hàm mất mát phân đoạn ngữ nghĩa và tạo mẫu đa tỷ lệ cho Phân đoạn , Ước lượng logarit xác suất dư (RLE) cho Ước lượng tư thế , và một hàm mất mát góc chuyên dụng để giải quyết các vấn đề về ranh giới trong phát hiện Hộp giới hạn định hướng (OBB) .

Hiệu suất và số liệu

Bảng dưới đây cung cấp cái nhìn toàn diện về cách PP-YOLOE+ so sánh với YOLO26 trên các kích thước mô hình khác nhau. Mô hình YOLO26 rõ ràng vượt trội về tốc độ xử lý thô, hiệu quả tham số và độ chính xác trung bình tổng thể ( mAP ) .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Lưu ý: Các giá trị được in đậm làm nổi bật các chỉ số hoạt động tốt nhất trên tất cả các mô hình.

Phân tích

  • Yêu cầu bộ nhớ và hiệu suất: YOLO26 yêu cầu số lượng tham số và phép tính FLOP ít hơn đáng kể để đạt được hiệu suất cao hơn. mAP điểm số. Ví dụ, mẫu YOLO26n (Nano) đạt được 40,9 điểm. mAP Với chỉ 2,4 triệu tham số, mô hình này vượt trội hơn mô hình PP-YOLOE+t trong khi kích thước chỉ bằng khoảng một nửa. Điều này đồng nghĩa với việc sử dụng bộ nhớ thấp hơn trong cả quá trình huấn luyện và triển khai.
  • Tốc độ suy luận: Khi xuất bằng TensorRT , YOLO26 vượt trội về các chỉ số độ trễ. Việc loại bỏ NMS đảm bảo thời gian suy luận 1,7ms trên T4. GPU Nó duy trì trạng thái hoàn toàn ổn định, trong khi PP-YOLOE+ phụ thuộc vào thời gian xử lý hậu kỳ có thể thay đổi.

Cái Ultralytics Ưu điểm: Hệ sinh thái và tính dễ sử dụng

Mặc dù các số liệu thô rất quan trọng, nhưng trải nghiệm của nhà phát triển thường quyết định sự thành công của dự án. Nền tảng Ultralytics cung cấp một hệ sinh thái được duy trì tốt, hoàn toàn vượt trội so với các framework cũ hơn.

  1. Dễ sử dụng: Ultralytics Loại bỏ các đoạn mã lặp đi lặp lại phức tạp. Việc huấn luyện YOLO26 chỉ mất vài dòng mã. Python , tránh được các tệp cấu hình phức tạp mà PP-YOLOE+ yêu cầu.
  2. Tính linh hoạt: PP-YOLOE+ chủ yếu là một kiến ​​trúc phát hiện đối tượng . YOLO26 cung cấp hỗ trợ sẵn có cho phân đoạn, phân loại, ước tính tư thế và OBB.
  3. Hiệu quả đào tạo: Ultralytics YOLO các mô hình yêu cầu thấp hơn nhiều CUDA So với các mô hình transformer cồng kềnh như RT-DETR hoặc các kiến ​​trúc cũ hơn, bộ nhớ của nó nhỏ hơn, cho phép các nhà nghiên cứu huấn luyện các mô hình tiên tiến trên phần cứng cấp độ người tiêu dùng.

Khác Ultralytics Mô hình

Mặc dù YOLO26 là đỉnh cao của nghiên cứu hiện tại, nhưng Ultralytics Hệ sinh thái này cũng bao gồm YOLO11YOLOv8 . Cả hai đều là những mô hình mạnh mẽ với sự hỗ trợ cộng đồng lớn, lý tưởng cho người dùng chuyển đổi từ các hệ thống cũ hơn.

Ví dụ mã: Huấn luyện YOLO26

Bắt đầu với Ultralytics Quá trình này diễn ra liền mạch. Dưới đây là một ví dụ hoàn chỉnh minh demonstrating cách tải, huấn luyện và xác thực mô hình YOLO26:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset using the new MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    optimizer="auto",  # MuSGD is automatically engaged for YOLO26
)

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
print(f"Model successfully exported to: {export_path}")

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn PP-YOLOE+

  • Hệ thống hạ tầng PaddlePaddle hiện có: Nếu doanh nghiệp đã sử dụng sâu rộng công nghệ của Baidu và phần cứng được cấu hình sẵn cho Paddle Inference, PP-YOLOE+ là một lựa chọn an toàn và ổn định.
  • Các trung tâm sản xuất châu Á: Nhiều hệ thống xử lý hình ảnh công nghiệp ở châu Á đã có sẵn sự hỗ trợ mạnh mẽ cho PP-YOLOE+ trong việc phát hiện lỗi tự động.

Khi nào nên chọn YOLO26

  • Điện toán biên và IoT: Tốc độ suy luận CPU nhanh hơn 43% và việc loại bỏ DFL giúp YOLO26 trở thành nhà vô địch không thể tranh cãi khi triển khai trên Raspberry Pi, điện thoại di động và các thiết bị nhúng.
  • Môi trường đông đúc và thành phố thông minh: Kiến trúc NMS -Free từ đầu đến cuối đảm bảo độ trễ ổn định trong môi trường dày đặc như quản lý bãi đậu xe và giám sát giao thông, nơi các giải pháp truyền thống phát huy hiệu quả. NMS sẽ gây ra tắc nghẽn.
  • Dự án đa nhiệm: Nếu quy trình của bạn yêu cầu theo dõi đối tượng, ước tính tư thế người hoặc tạo mặt nạ chính xác đến từng pixel, YOLO26 đều xử lý tất cả trong một phần mềm duy nhất và thống nhất. Python bưu kiện.

Kết luận

Mặc dù PP-YOLOE+ vẫn là một bộ dò có khả năng cao trong hệ sinh thái cụ thể của nó, nhưng sự ra mắt của YOLO26 đã thay đổi mô hình. Bằng cách kết hợp các tối ưu hóa huấn luyện lấy cảm hứng từ LLM (MuSGD) với một quá trình tối ưu hóa không ngừng, NMS - Kiến trúc tự do, Ultralytics YOLO26 đã tạo ra một mô hình vừa có độ chính xác cao vừa dễ dàng triển khai. Đối với các nhà phát triển hiện đại đang tìm kiếm sự cân bằng tốt nhất giữa tốc độ, độ chính xác và trải nghiệm người dùng, YOLO26 là sự lựa chọn tối ưu.


Bình luận