PP-YOLOE+ so với YOLOv10 : So sánh kỹ thuật toàn diện
Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định then chốt ảnh hưởng đến hiệu quả, độ chính xác và khả năng mở rộng của các hệ thống thị giác máy tính. Bài so sánh chi tiết này phân tích PP-YOLOE+ , một bộ phát hiện không cần neo được tinh chỉnh từ Baidu. PaddlePaddle hệ sinh thái và YOLOv10 , một máy dò đầu cuối thời gian thực mang tính cách mạng từ Đại học Thanh Hoa được tích hợp hoàn toàn vào Ultralytics hệ sinh thái.
Các mô hình này đại diện cho hai cách tiếp cận riêng biệt để giải quyết vấn đề đánh đổi giữa tốc độ và độ chính xác. Bằng cách xem xét những cải tiến về kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng, chúng tôi cung cấp những thông tin chi tiết cần thiết để lựa chọn công cụ tốt nhất cho ứng dụng cụ thể của bạn.
PP-YOLOE+: Độ chính xác trong PaddlePaddle Hệ sinh thái
PP-YOLOE+ (Thực hành PaddlePaddle You Only Look One-level Efficient Plus) là một bước tiến của kiến trúc PP-YOLOE, được thiết kế để cung cấp các cơ chế phát hiện có độ chính xác cao. Được phát triển bởi Baidu, đây là mô hình chủ lực trong khuôn khổ PaddlePaddle , nhấn mạnh vào việc tối ưu hóa cho các ứng dụng công nghiệp trong đó môi trường phần cứng được xác định trước.
Tác giả: PaddlePaddle Tác giả
Tổ chức: Baidu
Ngày: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: Kho lưu trữ PaddleDetection
Tài liệu: Tài liệu PP-YOLOE+
Các đặc điểm kiến trúc chính
PP-YOLOE+ nổi bật nhờ một số cải tiến về mặt cấu trúc nhằm tinh chỉnh khả năng biểu diễn và định vị đặc điểm:
- Cơ chế không có điểm neo: Sử dụng phương pháp không có điểm neo để giảm độ phức tạp của việc điều chỉnh siêu tham số và cải thiện khả năng khái quát hóa trên các hình dạng đối tượng.
- Xương sống CSPRepResNet: Tích hợp mạng từng phần giai đoạn chéo (CSP) với RepResNet, cung cấp khả năng trích xuất tính năng mạnh mẽ giúp cân bằng tải tính toán với sức mạnh biểu diễn.
- Học căn chỉnh tác vụ (TAL): Sử dụng hàm mất mát chuyên biệt để căn chỉnh động điểm phân loại với độ chính xác định vị, đảm bảo các phát hiện có độ tin cậy cao cũng chính xác nhất.
- Đầu hiệu quả (ET-Head): Đầu phát hiện hợp lý giúp tách biệt nhiệm vụ phân loại và hồi quy để giảm thiểu nhiễu và cải thiện tốc độ hội tụ.
YOLOv10 : Cái NMS -Cách mạng thời gian thực miễn phí
YOLOv10 đại diện cho một sự thay đổi mô hình trong YOLO dòng dõi. Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, nó giải quyết nút thắt lịch sử của Sự ức chế không tối đa ( NMS ) bằng cách giới thiệu các nhiệm vụ kép nhất quán cho NMS -đào tạo miễn phí. Điều này cho phép triển khai toàn diện với độ trễ suy luận được giảm đáng kể.
Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Ngày: 23-05-2024
ArXiv: https://arxiv.org/abs/2405.14458
GitHub: Kho lưu trữ YOLOv10
Tài liệu: Tài liệu Ultralytics YOLOv10
Đổi mới và Tích hợp Hệ sinh thái
YOLOv10 không chỉ là một bản cập nhật về kiến trúc; mà là một thiết kế toàn diện hướng đến hiệu quả.
- NMS Đào tạo miễn phí: Bằng cách áp dụng chiến lược gán nhãn kép—một-nhiều để giám sát phong phú và một-một để suy luận hiệu quả— YOLOv10 loại bỏ nhu cầu về NMS hậu xử lý. Điều này làm giảm độ trễ suy luận và độ phức tạp khi triển khai.
- Thiết kế hiệu quả toàn diện: Có đầu phân loại nhẹ và chức năng lấy mẫu hạ tần tách biệt kênh không gian để tối đa hóa khả năng lưu giữ thông tin đồng thời giảm thiểu FLOP .
- Tích hợp Ultralytics : Là một phần của Ultralytics hệ sinh thái, YOLOv10 lợi ích từ tính dễ sử dụng thông qua một Python API giúp các nhà phát triển có thể dễ dàng đào tạo, xác thực và triển khai các mô hình.
- Hiệu quả bộ nhớ: Kiến trúc được tối ưu hóa để giảm mức tiêu thụ bộ nhớ trong quá trình đào tạo, một lợi thế đáng kể so với các máy dò dựa trên máy biến áp hoặc các máy dò cũ hơn YOLO các lần lặp lại.
Phân tích hiệu suất kỹ thuật
Các số liệu sau đây nêu bật sự khác biệt về hiệu suất giữa hai mô hình. YOLOv10 luôn chứng minh được hiệu quả vượt trội, mang lại độ chính xác cao hơn với ít tham số hơn và độ trễ thấp hơn.
| Mô hình | Kích thước (pixels) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Hiệu quả và tốc độ giải thích
Dữ liệu cho thấy YOLOv10 có lợi thế rõ ràng về Cân bằng hiệu suất .
- Hiệu quả tham số: YOLOv10l đạt được hiệu suất cao hơn mAP (53,3%) so với PP-YOLOE+l (52,9%) trong khi sử dụng gần một nửa số tham số (29,5M so với 52,2M). Điều này làm cho YOLOv10 nhẹ hơn đáng kể khi cất giữ và tải nhanh hơn.
- Tải tính toán: FLOPs được tính cho YOLOv10 các mô hình luôn thấp hơn đối với các cấp độ chính xác tương đương, dẫn đến mức tiêu thụ điện năng thấp hơn—một yếu tố quan trọng đối với các thiết bị AI biên .
- Tốc độ suy luận: Nhờ vào NMS -Thiết kế miễn phí, YOLOv10n đạt độ trễ cực thấp là 1,56ms trên T4 GPU , vượt trội hơn biến thể PP-YOLOE+ nhỏ nhất.
NMS -Ưu đãi miễn phí
Các máy dò vật thể truyền thống yêu cầu phải loại bỏ tối đa ( NMS ) để lọc các hộp chồng chéo, một bước thường chậm và khó tối ưu hóa trên phần cứng. YOLOv10 loại bỏ hoàn toàn bước này, dẫn đến thời gian suy luận không đổi bất kể số lượng đối tượng được phát hiện.
Điểm mạnh và Điểm yếu
YOLOv10 : Sự lựa chọn hiện đại
- Điểm mạnh:
- Dễ sử dụng: Tích hợp liền mạch vào Ultralytics hệ sinh thái, cung cấp API chuẩn hóa cho việc đào tạo và triển khai.
- Tốc độ triển khai: Kiến trúc đầu cuối thực sự loại bỏ tình trạng tắc nghẽn hậu xử lý.
- Hiệu quả sử dụng tài nguyên: Sử dụng ít bộ nhớ hơn và ít tham số hơn khiến nó trở nên lý tưởng cho các môi trường hạn chế tài nguyên như robot và ứng dụng di động.
- Hiệu quả đào tạo: Hỗ trợ đào tạo nhanh với tạ được đào tạo sẵn và trình tải dữ liệu được tối ưu hóa.
- Điểm yếu:
- Là một kiến trúc mới hơn, hệ sinh thái hướng dẫn của bên thứ ba đang phát triển nhanh chóng nhưng có thể nhỏ hơn so với các kiến trúc cũ hơn YOLO các phiên bản như YOLOv5 hoặc YOLOv8 .
PP-YOLOE+: Các PaddlePaddle Chuyên gia
- Điểm mạnh:
- Độ chính xác cao: Mang lại độ chính xác tuyệt vời, đặc biệt là ở các biến thể mô hình lớn nhất (PP-YOLOE+x).
- Tối ưu hóa khung: Được điều chỉnh cao cho người dùng đã đầu tư sâu vào PaddlePaddle cơ sở hạ tầng.
- Điểm yếu:
- Khóa hệ sinh thái: Hỗ trợ chính bị giới hạn ở PaddlePaddle khuôn khổ, có thể là rào cản đối với các nhóm sử dụng PyTorch hoặc TensorFlow .
- Nặng: Yêu cầu nhiều tài nguyên tính toán hơn đáng kể (FLOP và Params) để phù hợp với độ chính xác của các thuật toán mới hơn YOLO các mô hình.
Đề xuất trường hợp sử dụng
Ứng dụng thời gian thực và điện toán biên
Đối với các ứng dụng đòi hỏi thời gian phản hồi ngay lập tức, chẳng hạn như xe tự hành hoặc dây chuyền sản xuất tốc độ cao, YOLOv10 là lựa chọn ưu việt. Độ trễ thấp và loại bỏ NMS bước đảm bảo tốc độ suy luận xác định, rất quan trọng đối với các hệ thống quan trọng về an toàn.
Tầm nhìn máy tính mục đích chung
Đối với các nhà phát triển đang tìm kiếm một giải pháp đa năng, mô hình YOLO Ultralytics mang lại lợi thế rõ rệt nhờ Hệ sinh thái được bảo trì tốt . Khả năng dễ dàng chuyển đổi giữa các tác vụ ( detect , segment , tư thế) và xuất sang các định dạng như ONNX , TensorRT , Và CoreML làm cho YOLOv10 và các loài anh chị em của nó có khả năng thích nghi cao.
Triển khai công nghiệp cụ thể
Nếu cơ sở hạ tầng hiện tại của bạn được xây dựng hoàn toàn trên nền tảng công nghệ của Baidu, PP-YOLOE+ cung cấp giải pháp gốc tích hợp tốt với các giải pháp khác PaddlePaddle công cụ. Tuy nhiên, đối với các dự án mới, hiệu quả đào tạo và chi phí phần cứng thấp hơn YOLOv10 thường mang lại lợi nhuận đầu tư tốt hơn.
Bắt đầu với YOLOv10
Trải nghiệm tính dễ sử dụng của Ultralytics mô hình. Bạn có thể tải và chạy dự đoán với YOLOv10 chỉ trong một vài dòng Python mã số:
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
API đơn giản này cho phép các nhà nghiên cứu tập trung vào dữ liệu và kết quả thay vì mã mẫu.
Kết luận
Trong khi PP-YOLOE+ vẫn là một đối thủ đáng gờm trong khuôn khổ cụ thể của nó, YOLOv10 cung cấp một gói phần mềm hấp dẫn hơn cho cộng đồng thị giác máy tính nói chung. Những đột phá về kiến trúc của nó trong việc loại bỏ NMS , kết hợp với sự mạnh mẽ của Ultralytics hệ sinh thái, cung cấp cho các nhà phát triển một công cụ không chỉ nhanh hơn và nhẹ hơn mà còn dễ sử dụng và bảo trì hơn.
Đối với những ai muốn luôn dẫn đầu xu hướng, chúng tôi cũng khuyên bạn nên khám phá YOLO11 , mẫu flagship mới nhất từ Ultralytics điều này càng mở rộng ranh giới về tính linh hoạt và hiệu suất trên nhiều tác vụ thị giác.
Khám phá các Mô hình Khác
Mở rộng hiểu biết của bạn về bối cảnh phát hiện đối tượng với những so sánh sau:
- YOLOv10 so với YOLOv9 - So sánh hai thế hệ mới nhất.
- YOLOv10 so với RT-DETR - Phân tích máy biến áp thời gian thực so với CNN.
- YOLO11 so với YOLOv8 - Xem sự tiến hóa của Ultralytics dòng sản phẩm chủ lực.