So sánh mô hình: PP-YOLOE+ so với YOLO11 để phát hiện đối tượng
Khi lựa chọn mô hình thị giác máy tính để phát hiện đối tượng, điều cần thiết là phải hiểu được điểm mạnh và điểm yếu của các kiến trúc khác nhau. Trang này cung cấp so sánh kỹ thuật chi tiết giữa PP-YOLOE+ và Ultralytics YOLO11 , hai mô hình hiện đại, giúp bạn đưa ra quyết định sáng suốt.
Ultralytics YOLO11 : Hiệu quả và tính linh hoạt tiên tiến
Ultralytics YOLO11 , được biên soạn bởi Glenn Jocher và Jing Qiu từ Ultralytics và được phát hành vào ngày 27-09-2024, là phiên bản mới nhất trong YOLO loạt sản phẩm. Sản phẩm được thiết kế để phát hiện vật thể theo thời gian thực và có khả năng cân bằng tốc độ và độ chính xác trên nhiều ứng dụng khác nhau. YOLO11 xây dựng dựa trên trước đó YOLO mô hình, giới thiệu những cải tiến về mặt kiến trúc để nâng cao hiệu suất và tính linh hoạt trong các tác vụ như phân loại hình ảnh , phân đoạn trường hợp và ước tính tư thế .
Kiến trúc và các tính năng chính
YOLO11 duy trì mô hình phát hiện một giai đoạn, không có neo, ưu tiên tốc độ suy luận. Các tính năng kiến trúc chính bao gồm:
- Xương sống hiệu quả: Một xương sống hợp lý để trích xuất tính năng nhanh chóng.
- Khả năng mở rộng: Có nhiều kích cỡ (n, s, m, l, x) để phù hợp với các nhu cầu tính toán và môi trường triển khai khác nhau, từ các thiết bị biên như NVIDIA Jetson đến máy chủ đám mây.
- Tính linh hoạt: Hỗ trợ nhiều tác vụ thị giác máy tính khác nhau ngoài việc phát hiện đối tượng, cung cấp giải pháp linh hoạt trong Ultralytics hệ sinh thái.
Số liệu hiệu suất
YOLO11 thể hiện sự cân bằng mạnh mẽ giữa tốc độ và độ chính xác, phù hợp cho các ứng dụng thời gian thực.
- mAP: Đạt được Độ chính xác trung bình trung bình (mAP) hiện đại trên các tập dữ liệu như COCO. Tham khảo hướng dẫn YOLO Performance Metrics để biết chi tiết về mAP và các số liệu đánh giá khác.
- Tốc độ suy luận: Được tối ưu hóa để suy luận nhanh, rất quan trọng đối với nhu cầu xử lý thời gian thực như được thấy trong AI tầm nhìn trong các ứng dụng phát trực tuyến .
- Kích thước mô hình: Duy trì kích thước mô hình nhỏ gọn, tạo điều kiện triển khai trên các thiết bị có nguồn lực hạn chế.
Điểm mạnh và điểm yếu
Điểm mạnh:
- Đa năng và chính xác: Xuất sắc trong nhiều nhiệm vụ thị giác, mang lại độ chính xác và tốc độ cao.
- Hệ sinh thái thân thiện với người dùng: Tích hợp liền mạch trong Ultralytics hệ sinh thái, với tài liệu hướng dẫn sử dụng Python và CLI toàn diện.
- Triển khai có khả năng mở rộng: Nhiều kích cỡ mô hình đảm bảo khả năng thích ứng với các phần cứng khác nhau.
Điểm yếu:
- Nhu cầu tính toán: Các mô hình lớn hơn có thể cần nhiều tính toán, đòi hỏi phần cứng mạnh mẽ để có hiệu suất tối ưu theo thời gian thực.
- Độ phức tạp đối với người dùng mới: Mặc dù thân thiện với người dùng, việc tinh chỉnh và hiểu được các sắc thái của kiến trúc có thể tạo ra đường cong học tập cho người dùng mới về thị giác máy tính .
Các trường hợp sử dụng lý tưởng
YOLO11 rất phù hợp cho các ứng dụng đòi hỏi phát hiện đối tượng theo thời gian thực với độ chính xác cao:
- Phân tích video theo thời gian thực: Các ứng dụng như quản lý hàng đợi và hệ thống an ninh được hưởng lợi nhờ tốc độ và độ chính xác của nó.
- Triển khai AI biên: Hiệu quả khi xử lý trên thiết bị trên các nền tảng như Raspberry Pi .
- Hệ thống tự động: Lý tưởng cho xe tự lái và robot đòi hỏi nhận thức nhanh và chính xác, như được nêu bật trong AI thị giác trong các ứng dụng tự lái .
PP-YOLOE+: Tập trung vào độ chính xác và hiệu quả
PP-YOLOE+ (Chèo thuyền thực tế- YOLO với Evolved Enhancement), được phát triển bởi PaddlePaddle Các tác giả tại Baidu và phát hành vào ngày 2022-04-02, được thiết kế để phát hiện đối tượng có độ chính xác cao với hiệu quả hợp lý. Đây là phiên bản nâng cao của dòng PP-YOLOE, tập trung vào các ứng dụng công nghiệp, nơi độ chính xác là tối quan trọng. PP-YOLOE+ ưu tiên độ chính xác mà không làm giảm đáng kể tốc độ suy luận và là một phần của vườn thú mô hình PaddleDetection.
Kiến trúc và các tính năng chính
PP-YOLOE+ cũng áp dụng phương pháp không neo, nhấn mạnh vào độ chính xác và hiệu quả. Các tính năng chính bao gồm:
- Tập trung độ chính xác cao: Được tinh chỉnh về mặt kiến trúc để đạt được độ chính xác hàng đầu trong các nhiệm vụ phát hiện đối tượng.
- Thiết kế hiệu quả: Cân bằng giữa độ chính xác với tốc độ suy luận hiệu quả, phù hợp với các ứng dụng đòi hỏi khắt khe.
- Tích hợp PaddlePaddle : Tận dụng PaddlePaddle khuôn khổ học sâu, được hưởng lợi từ khả năng tối ưu hóa và hệ sinh thái của nó.
Số liệu hiệu suất
PP-YOLOE+ có độ chính xác vượt trội trong khi vẫn duy trì tốc độ cạnh tranh:
- mAP cao: Đạt được Độ chính xác trung bình (mAP) cao, thể hiện độ chính xác cao trên các tập dữ liệu chuẩn như COCO, như được nêu chi tiết trong tài liệu PP-YOLOE+ .
- Suy luận hiệu quả: Cung cấp sự cân bằng tốt giữa độ chính xác và tốc độ suy luận, phù hợp với các ứng dụng công nghiệp yêu cầu phân tích thời gian thực.
- Kích thước mô hình: Cung cấp nhiều kích thước mô hình khác nhau để phù hợp với nhiều tài nguyên tính toán khác nhau.
Điểm mạnh và điểm yếu
Điểm mạnh:
- Độ chính xác đặc biệt: Ưu tiên độ chính xác phát hiện cao, rất quan trọng đối với các ứng dụng đòi hỏi độ chính xác cao như kiểm tra chất lượng trong sản xuất .
- Tập trung vào công nghiệp: Phù hợp với môi trường công nghiệp đòi hỏi khả năng phát hiện vật thể đáng tin cậy và chính xác.
- Hệ sinh thái PaddlePaddle : Lợi ích từ PaddlePaddle hệ sinh thái và tối ưu hóa của khuôn khổ.
Điểm yếu:
- Khóa hệ sinh thái: Chủ yếu trong PaddlePaddle hệ sinh thái, có thể là một cân nhắc cho người dùng được nhúng sâu vào các khuôn khổ khác như PyTorch được sử dụng bởi Ultralytics YOLO .
- Ít linh hoạt hơn trong bối cảnh Ultralytics : Mặc dù có khả năng, nhưng nó không được tích hợp sẵn vào Ultralytics khuôn khổ nhiệm vụ linh hoạt như YOLO11 .
Các trường hợp sử dụng lý tưởng
PP-YOLOE+ lý tưởng cho các ứng dụng đòi hỏi độ chính xác cao:
- Kiểm soát chất lượng công nghiệp: Các ứng dụng yêu cầu phát hiện lỗi chính xác và đảm bảo chất lượng trong quy trình sản xuất như được thấy trong việc cải thiện sản xuất bằng công nghệ thị giác máy tính .
- Nông nghiệp chính xác: Các nhiệm vụ như theo dõi cây trồng và ước tính năng suất, trong đó việc phát hiện chính xác sẽ tác động đến việc ra quyết định, được chứng minh bằng AI thúc đẩy đổi mới trong nông nghiệp .
- Chụp ảnh chăm sóc sức khỏe: Phân tích hình ảnh y tế trong đó độ chính xác phát hiện là rất quan trọng để chẩn đoán, chẳng hạn như phát hiện khối u trong chụp ảnh y tế .
Bảng so sánh mô hình
Người mẫu | kích cỡ (điểm ảnh) |
giá trị mAP 50-95 |
Tốc độ CPU ONNX (bệnh đa xơ cứng) |
Tốc độ T4 TensorRT10 (bệnh đa xơ cứng) |
tham số (Nam) |
Thất bại (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Phần kết luận
Cả PP-YOLOE+ và YOLO11 là những mô hình phát hiện đối tượng mạnh mẽ, mỗi mô hình có những ưu điểm riêng. YOLO11 cung cấp một giải pháp linh hoạt, hiệu suất cao trong Ultralytics hệ sinh thái, lý tưởng cho các ứng dụng đòi hỏi sự cân bằng giữa tốc độ và độ chính xác trong nhiều nhiệm vụ thị giác khác nhau. PP-YOLOE+ vượt trội về độ chính xác và hiệu quả, đặc biệt có lợi cho người dùng trong PaddlePaddle khuôn khổ và những khuôn khổ ưu tiên độ chính xác trong môi trường công nghiệp.
Người dùng quan tâm đến việc khám phá các mô hình khác trong Ultralytics hệ sinh thái cũng có thể xem xét:
- YOLOv8 - Một mô hình rất linh hoạt và thân thiện với người dùng trong YOLO loạt.
- YOLOv9 - Được biết đến nhờ những tiến bộ về độ chính xác và hiệu quả.
- YOLO -NAS - Các mô hình được thiết kế thông qua Tìm kiếm kiến trúc thần kinh để tối ưu hóa hiệu suất.
- RT-DETR - Bộ chuyển đổi phát hiện thời gian thực, cung cấp phương pháp tiếp cận kiến trúc khác biệt.
- YOLOv7 , YOLOv6 và YOLOv5 - Các phiên bản trước trong YOLO gia đình, mỗi gia đình có đặc điểm hoạt động và thế mạnh riêng.