Chuyển đến nội dung

PP-YOLOE+ so với YOLOv5 So sánh kỹ thuật về phát hiện đối tượng thời gian thực

Trong bối cảnh cạnh tranh khốc liệt của thị giác máy tính , việc lựa chọn kiến ​​trúc phát hiện đối tượng phù hợp là một quyết định quan trọng đối với các nhà phát triển và nhà nghiên cứu. PP-YOLOE+ , được phát triển bởi Baidu, là một ví dụ. PaddlePaddle nhóm và YOLOv5 , được tạo bởi Ultralytics Hai phương pháp này nổi bật như hai cách tiếp cận riêng biệt để giải quyết các thách thức phát hiện thời gian thực. Trong khi PP-YOLOE+ nhấn mạnh vào các cơ chế không cần neo trong phạm vi... PaddlePaddle hệ sinh thái, YOLOv5 đã thiết lập tiêu chuẩn ngành về khả năng sử dụng, tính linh hoạt trong triển khai và hỗ trợ cộng đồng. PyTorch .

Hướng dẫn này cung cấp phân tích kỹ thuật chuyên sâu về hai mô hình có ảnh hưởng này, so sánh kiến ​​trúc, các chỉ số hiệu suất và tính phù hợp của chúng đối với các ứng dụng thực tế như tự động hóa sản xuất và điện toán biên.

Tổng quan mô hình

PP-YOLOE+

PP-YOLOE+ là phiên bản nâng cấp của PP-YOLOE, được thiết kế để cải thiện sự hội tụ của quá trình huấn luyện và hiệu suất của các tác vụ tiếp theo. Nó hoạt động trên... PaddlePaddle Khung này sử dụng mô hình không cần neo để đơn giản hóa đầu phát hiện. Bằng cách kết hợp một hệ thống xương sống mạnh mẽ hơn và các chiến lược huấn luyện được tinh chỉnh, nó hướng đến việc cung cấp độ chính xác cao cho các ứng dụng công nghiệp nơi suy luận dựa trên đám mây là phổ biến.

Ultralytics YOLOv5

YOLOv5 đã cách mạng hóa trải nghiệm người dùng trong việc phát hiện đối tượng. Được phát hành bởi Ultralytics Nó ưu tiên kỹ thuật "triển khai trước", đảm bảo rằng các mô hình không chỉ chính xác mà còn cực kỳ dễ huấn luyện, xuất khẩu và chạy trên nhiều phần cứng khác nhau. Kiến trúc dựa trên anchor của nó được tối ưu hóa cao về tốc độ, khiến nó trở thành lựa chọn ưa thích cho suy luận thời gian thực trên các thiết bị biên.

Tìm hiểu thêm về YOLOv5

So sánh Kiến trúc Kỹ thuật

Triết lý kiến ​​trúc của PP-YOLOE+ và YOLOv5 Chúng khác nhau đáng kể, ảnh hưởng đến hành vi huấn luyện và đặc điểm triển khai của chúng.

Backbone và Trích xuất Đặc trưng

YOLOv5 sử dụng kiến ​​trúc mạng CSPDarknet (Cross Stage Partial Network). Thiết kế này cải thiện luồng gradient và giảm số lượng tham số mà không làm giảm hiệu suất. Kiến trúc này có tính mô-đun cao, cho phép thử nghiệm nhanh chóng với các độ sâu và chiều rộng mô hình khác nhau (từ Nano đến X-Large). Tính mô-đun này rất quan trọng đối với các nhà phát triển triển khai trên các môi trường hạn chế tài nguyên như Raspberry Pi hoặc thiết bị di động.

Ngược lại, PP-YOLOE+ thường sử dụng kiến ​​trúc xương sống CSPRepResStage, kết hợp các kết nối dư với các kỹ thuật tái tham số hóa. Mặc dù hiệu quả trong việc trích xuất các đặc trưng phong phú, cấu trúc này thường dẫn đến độ phức tạp cao hơn trong giai đoạn huấn luyện so với hiệu quả được tối ưu hóa của các phương pháp khác. YOLOv5 việc triển khai của nó.

Đầu dò: Dựa trên neo so với không dựa trên neo

Sự khác biệt cơ bản nằm ở các đầu dò:

  1. YOLOv5 (Dựa trên neo): Sử dụng các hộp neo được xác định trước để dự đoán vị trí đối tượng. Mặc dù điều này yêu cầu cấu hình ban đầu (mà Ultralytics (tự động hóa thông qua AutoAnchor), nó cung cấp độ dốc huấn luyện ổn định và hiệu suất mạnh mẽ trong quá khứ trên các tập dữ liệu tiêu chuẩn như COCO .
  2. PP-YOLOE+ (Không dùng Anchor): Dự đoán trực tiếp tâm và kích thước đối tượng, loại bỏ nhu cầu điều chỉnh siêu tham số anchor box. Phương pháp này xử lý tốt các đối tượng có tỷ lệ khung hình cực đoan nhưng có thể nhạy cảm hơn với chất lượng dữ liệu huấn luyện và sự hội tụ ban đầu của hàm mất mát.

Tiến hóa hướng tới sự không cần neo

Trong khi YOLOv5 sử dụng thành công các điểm neo, mới hơn Ultralytics Các mẫu như YOLOv8YOLO26 tiên tiến đã chuyển sang thiết kế không cần neo, kết hợp những ưu điểm tốt nhất của cả hai thế giới: dễ sử dụng và khả năng khái quát hóa hình học vượt trội.

Các chỉ số hiệu suất

Khi đánh giá hiệu năng, điều quan trọng là phải xem xét sự cân bằng giữa độ chính xác trung bình ( mAP ) và độ trễ. Bảng dưới đây cho thấy rằng trong khi PP-YOLOE+ đạt được độ chính xác cao, YOLOv5 duy trì lợi thế cạnh tranh trong CPU Tốc độ và tính linh hoạt trong triển khai, với rào cản gia nhập thấp hơn đáng kể đối với người dùng mới.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Phân tích tốc độ và hiệu quả

Ultralytics YOLOv5 Thể hiện hiệu quả vượt trội, đặc biệt là ở các biến thể "Nano" và "Small". Mô hình YOLOv5n , chỉ với 1,9 triệu tham số, được thiết kế đặc biệt cho các môi trường cực kỳ hạn chế, chẳng hạn như ứng dụng di động hoặc cảm biến IoT. Trong khi PP-YOLOE+ cung cấp khả năng mạnh mẽ mAP số liệu, độ phức tạp của việc thiết lập và sự phụ thuộc vào... PaddlePaddle Khung này có thể gây ra sự cản trở trong các quy trình sản xuất dựa trên tiêu chuẩn. PyTorch hoặc ONNX quy trình làm việc.

Hơn nữa, yêu cầu về bộ nhớ có ưu điểm là... YOLOv5 Trong quá trình huấn luyện, YOLOv5 Các trình tải dữ liệu và quản lý bộ nhớ được tối ưu hóa của cho phép kích thước lô lớn hơn trên GPU dành cho người tiêu dùng so với nhiều đối thủ cạnh tranh, giảm bớt rào cản phần cứng cho các kỹ sư AI .

Đào tạo và Hệ sinh thái

Hệ sinh thái xung quanh một mô hình thường quan trọng không kém gì chính mô hình đó. Đây là lý do tại sao Ultralytics mang lại một lợi thế rõ rệt.

Dễ sử dụng và tài liệu hướng dẫn

YOLOv5 Nó nổi tiếng với trải nghiệm "từ con số không đến chuyên gia". Nhà phát triển có thể hoàn tất quá trình từ cài đặt thư viện đến huấn luyện mô hình tùy chỉnh trên tập dữ liệu như VisDrone chỉ trong vài phút.

from ultralytics import YOLO

# Load a pretrained YOLO model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5s.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Ngược lại, PP-YOLOE+ yêu cầu cài đặt... PaddlePaddle và việc sao chép kho lưu trữ PaddleDetection. Cấu hình thường bao gồm việc sửa đổi nhiều tệp YAML và điều hướng cấu trúc thư mục phức tạp hơn, điều này có thể gây khó khăn hơn cho những người đã quen với sự đơn giản của Python. Ultralytics .

Tính linh hoạt và hỗ trợ tác vụ

Trong khi PP-YOLOE+ chủ yếu tập trung vào việc phát hiện, thì Ultralytics Hệ sinh thái này cung cấp hỗ trợ gốc cho nhiều tác vụ xử lý hình ảnh hơn trong một API duy nhất:

Tính linh hoạt này cho phép các nhà phát triển chuyển đổi giữa các nhiệm vụ mà không cần học các framework mới hoặc viết lại các pipeline dữ liệu.

Các ứng dụng thực tế

Khi nào nên chọn PP-YOLOE+

PP-YOLOE+ là một lựa chọn tiềm năng nếu cơ sở hạ tầng của bạn đã được tích hợp sâu rộng với hệ thống công nghệ của Baidu. Đối với người dùng ở các khu vực mà PaddlePaddle là khung cấu trúc chiếm ưu thế, hoặc dành cho các triển khai phía máy chủ cụ thể trong đó mAP Nếu ưu tiên hàng đầu là tính dễ triển khai, thì PP-YOLOE+ vẫn là một lựa chọn khả thi.

Khi nào nên lựa chọn Ultralytics YOLO Mô hình

Đối với phần lớn các nhà phát triển, công ty khởi nghiệp và đội ngũ doanh nghiệp trên toàn cầu, Ultralytics YOLOv5 (và các phiên bản kế nhiệm) là lựa chọn được khuyến nghị vì những lý do sau:

  1. Triển khai tại biên: Xuất dữ liệu liền mạch sang TFLite . CoreML Và OpenVINO đảm bảo các mô hình hoạt động hiệu quả trên thiết bị của người dùng cuối.
  2. Hỗ trợ cộng đồng: Một cộng đồng lớn mạnh và năng động đóng góp vào việc cập nhật thường xuyên, đảm bảo các lỗi được khắc phục và các tính năng mới như chú thích tự động được bổ sung đều đặn.
  3. Nền tảng toàn diện: Nền tảng Ultralytics đơn giản hóa toàn bộ vòng đời, từ quản lý tập dữ liệu đến huấn luyện mô hình và triển khai trên đám mây.

Tương lai: Hãy cùng bước vào YOLO26

Trong khi YOLOv5 Mặc dù vẫn là một công cụ mạnh mẽ và đáng tin cậy, lĩnh vực thị giác máy tính đang phát triển rất nhanh. Ultralytics Mới đây, hãng đã giới thiệu YOLO26 , đại diện cho công nghệ tiên tiến nhất hiện nay về hiệu quả và hiệu năng.

YOLO26 mang đến một số cải tiến đột phá so với cả hai phiên bản trước đó. YOLOv5 và PP-YOLOE+:

  • NMS từ đầu đến cuối - Miễn phí: YOLO26 loại bỏ hiện tượng Non-Maximmum Suppression (Ứng dụng loại bỏ tối đa không cần thiết) NMS (Đây là bước xử lý hậu kỳ giúp làm chậm quá trình suy luận. Điều này dẫn đến logic triển khai đơn giản hơn và độ trễ thấp hơn.)
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM, bộ tối ưu hóa lai này đảm bảo sự hội tụ ổn định và thời gian huấn luyện nhanh hơn.
  • Phát hiện vật thể nhỏ được nâng cao: Thông qua ProgLossSTAL (Task-Alignment Loss), YOLO26 vượt trội trong việc phát hiện các vật thể nhỏ, một khả năng quan trọng đối với việc kiểm tra bằng máy bay không người lái và nông nghiệp chính xác.
  • Suy luận CPU nhanh hơn 43%: Với việc loại bỏ hàm mất mát tiêu điểm phân phối (DFL), YOLO26 được tối ưu hóa đặc biệt cho CPU, trở thành lựa chọn vượt trội cho điện toán biên tiết kiệm chi phí.

Đối với các nhà phát triển bắt đầu các dự án mới vào năm 2026, chúng tôi đặc biệt khuyên bạn nên đánh giá YOLO26 để đảm bảo ứng dụng của bạn luôn tương thích với các tiến bộ mới nhất trong kiến ​​trúc mạng thần kinh.

Tìm hiểu thêm về YOLO26


Bình luận