YOLOv5 so với PP-YOLOE+: So sánh kỹ thuật để phát hiện đối tượng
Việc lựa chọn mô hình phát hiện đối tượng tối ưu là một quyết định then chốt ảnh hưởng đến hiệu quả, độ chính xác và khả năng mở rộng của các dự án thị giác máy tính. Hướng dẫn toàn diện này so sánh Ultralytics YOLOv5 , một mô hình huyền thoại nổi tiếng về khả năng sử dụng và tốc độ, với PP-YOLOE+ , một mô hình có độ chính xác cao từ Baidu. PaddlePaddle hệ sinh thái. Bằng cách phân tích kiến trúc, số liệu hiệu suất và quy trình triển khai, chúng tôi mong muốn giúp các nhà phát triển và nhà nghiên cứu lựa chọn giải pháp tốt nhất cho nhu cầu cụ thể của họ.
Ultralytics YOLOv5 : Tiêu chuẩn về khả năng sử dụng và tốc độ
YOLOv5 , được phát hành bởi Ultralytics Vào năm 2020, công nghệ này đã thay đổi căn bản bối cảnh của AI thị giác bằng cách giúp mọi người đều có thể tiếp cận công nghệ phát hiện vật thể tiên tiến. Không giống như những phiên bản tiền nhiệm, đây là công nghệ đầu tiên YOLO Mô hình được triển khai gốc trong PyTorch , giúp đơn giản hóa quy trình đào tạo và triển khai cho cộng đồng khoa học dữ liệu toàn cầu. Triết lý thiết kế của nó ưu tiên sự cân bằng giữa tốc độ suy luận thời gian thực và độ chính xác cao, được tích hợp trong một hệ sinh thái cực kỳ thân thiện với người dùng.
Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 26-06-2020
GitHub: https://github.com/ ultralytics / yolov5
Tài liệu: https://docs. ultralytics .com/models/ yolov5 /
Điểm mạnh chính
- Dễ sử dụng: YOLOv5 được ca ngợi vì trải nghiệm "sẵn sàng sử dụng". Với API Python được sắp xếp hợp lý và các lệnh CLI trực quan, các nhà phát triển có thể bắt đầu đào tạo trên các tập dữ liệu tùy chỉnh chỉ trong vài phút.
- Hệ sinh thái được duy trì tốt: Được hỗ trợ bởi Ultralytics , nó được cập nhật thường xuyên và có một cộng đồng đông đảo, năng động. Điều này đảm bảo sự hỗ trợ lâu dài và nguồn kiến thức phong phú được chia sẻ trên các nền tảng như GitHub Issues .
- Cân bằng hiệu suất: Cung cấp tốc độ suy luận thời gian thực vượt trội, đặc biệt là trên các thiết bị biên như Raspberry Pi , mà không làm giảm độ chính xác đáng kể.
- Tính linh hoạt: Vượt xa khả năng phát hiện tiêu chuẩn, YOLOv5 hỗ trợ phân đoạn trường hợp và phân loại hình ảnh , giúp nó trở thành công cụ linh hoạt cho nhiều nhiệm vụ thị giác khác nhau.
PP-YOLOE+: Độ chính xác cao trong hệ sinh thái mái chèo
PP-YOLOE+ là sự phát triển của PP- YOLO Dòng sản phẩm này, được phát triển bởi các nhà nghiên cứu tại Baidu. Ra mắt năm 2022, nó đóng vai trò là mô hình chủ lực trong bộ công cụ PaddleDetection . Nó áp dụng kiến trúc không neo và các chiến lược đào tạo tiên tiến để vượt qua giới hạn độ chính xác trên các tập dữ liệu chuẩn như COCO .
Tác giả: PaddlePaddle Tác giả
Tổ chức: Baidu
Ngày: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/ PaddlePaddle /PaddleDetection/
Tài liệu: https://github.com/ PaddlePaddle /PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Kiến trúc và các tính năng
PP-YOLOE+ sử dụng xương sống CSPRepResNet và một đầu phát hiện độc đáo không cần nguyên mẫu. Là một bộ phát hiện không cần neo , nó giảm thiểu độ phức tạp của việc điều chỉnh siêu tham số liên quan đến hộp neo. Nó hoạt động hiệu quả trong các tình huống mà mục tiêu chính là tối đa hóa Độ chính xác Trung bình ( mAP ) , thường đạt điểm số cao hơn một chút so với các mô hình dựa trên neo tương đương, nhưng phải trả giá bằng độ phức tạp tính toán tăng lên. Tuy nhiên, sự phụ thuộc của nó vào PaddlePaddle khuôn khổ có thể trình bày một đường cong học tập cho các nhóm được chuẩn hóa trên PyTorch hoặc TensorFlow .
Phân tích hiệu suất: Số liệu và hiệu quả
Khi so sánh YOLOv5 và PP-YOLOE+, sự đánh đổi thường nằm giữa độ chính xác thô và hiệu quả hoạt động (tốc độ và tính dễ triển khai).
Tốc độ so với Độ chính xác
Các mô hình PP-YOLOE+ thường có điểm số cao hơn mAPval điểm số trên COCO tập dữ liệu, chứng minh sức mạnh của chúng trong khả năng phát hiện thuần túy. Ví dụ, PP-YOLOE+l đạt được số điểm đáng chú ý là 52,9 mAP Tuy nhiên, điều này thường đi kèm với độ trễ cao hơn trên phần cứng tiêu chuẩn so với YOLOv5 .
Ultralytics YOLOv5 tỏa sáng trong tốc độ suy luận. Các YOLOv5n Mô hình (Nano) cực kỳ nhẹ, đạt 28,0 mAP với thời gian suy luận cực nhanh 1,12 ms trên T4 GPU sử dụng TensorRT. Điều này làm cho YOLOv5 sự lựa chọn vượt trội cho ứng dụng AI biên trong đó độ trễ tính bằng mili giây là rất quan trọng.
Hiệu quả tính toán
YOLOv5 Các mô hình được thiết kế có tính đến hạn chế về bộ nhớ. Chúng thường yêu cầu ít CUDA Bộ nhớ trong quá trình đào tạo và suy luận so với các kiến trúc phức tạp không cần neo hoặc các mô hình dựa trên bộ biến đổi . Hiệu quả này giúp triển khai mượt mà hơn trên phần cứng hạn chế tài nguyên, chẳng hạn như các mô-đun NVIDIA Jetson , mà không cần nỗ lực tối ưu hóa sâu rộng.
| Mô hình | Kích thước (pixels) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Hệ sinh thái đào tạo và khả năng sử dụng
Các thước đo "mềm" về trải nghiệm của nhà phát triển thường quyết định sự thành công của một dự án. Ở đây, sự khác biệt giữa hai mô hình được thể hiện rõ nhất.
Ultralytics Hệ sinh thái
YOLOv5 được hưởng lợi từ hệ sinh thái Ultralytics tích hợp, giúp hợp lý hóa toàn bộ quy trình MLOps .
- PyTorch Native: Đang được xây dựng trên PyTorch đảm bảo khả năng tương thích với phần lớn các công cụ và thư viện nguồn mở.
- Tích hợp liền mạch: Hỗ trợ tích hợp cho Weights & Biases , Comet và ClearML giúp theo dõi thử nghiệm dễ dàng.
- Hiệu quả đào tạo: Trọng lượng được đào tạo sẵn có sẵn và được tải xuống tự động, cho phép chuyển giao học tập nhanh chóng.
- Triển khai: Chế độ xuất hỗ trợ chuyển đổi một cú nhấp chuột sang ONNX , CoreML , TFLite , v.v.
Đơn giản hóa quy trình làm việc với Ultralytics TRUNG TÂM
Bạn có thể đào tạo, xem trước và triển khai YOLOv5 tạo mô hình mà không cần viết một dòng mã nào bằng Ultralytics HUB . Nền tảng web này quản lý tập dữ liệu và các buổi đào tạo của bạn, giúp các nhóm ở mọi trình độ đều có thể tiếp cận AI thị giác.
PaddlePaddle Hệ sinh thái
PP-YOLOE+ dựa vào PaddlePaddle , khuôn khổ học sâu của Baidu. Mặc dù mạnh mẽ và phổ biến ở châu Á, nhưng nó lại có dấu ấn nhỏ hơn trong cộng đồng nghiên cứu phương Tây so với PyTorch . Việc áp dụng PP-YOLOE+ thường yêu cầu thiết lập một môi trường riêng biệt và tìm hiểu cú pháp dành riêng cho Paddle (paddle.io, paddle.nn). Trong khi tài liệu toàn diện, hệ sinh thái của các công cụ của bên thứ ba và hỗ trợ cộng đồng không rộng rãi bằng YOLOv5 .
Ví dụ mã: Sự đơn giản của YOLOv5
Sau đây là Python mã chứng minh việc tải một chương trình được đào tạo trước dễ dàng như thế nào YOLOv5 mô hình hóa và thực hiện suy luận bằng PyTorch Hub .
import torch
# Load a YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image source
img = "https://ultralytics.com/images/zidane.jpg"
# Run inference
results = model(img)
# Print results to console
results.print()
# Show the image with bounding boxes
results.show()
Các trường hợp sử dụng thực tế
Ở đâu YOLOv5 Xuất sắc
- Tự động hóa công nghiệp: Tốc độ cao cho phép phát hiện lỗi theo thời gian thực trên các dây chuyền lắp ráp chuyển động nhanh.
- Robot tự động: Chi phí bộ nhớ thấp khiến nó trở nên lý tưởng cho các robot có khả năng tính toán hạn chế, chẳng hạn như các robot được sử dụng trong hậu cần .
- Ứng dụng thành phố thông minh: Hiệu quả CPU hiệu suất cho phép triển khai trên diện rộng để giám sát lưu lượng trên cơ sở hạ tầng hiện có.
PP-YOLOE+ phù hợp ở đâu
- Nghiên cứu có độ chính xác cao: Các dự án học thuật trong đó khai thác 1% cuối cùng của mAP quan trọng hơn tốc độ suy luận.
- Môi trường lấy mái chèo làm trung tâm: Môi trường doanh nghiệp đã đầu tư mạnh vào cơ sở hạ tầng hệ sinh thái Baidu.
Kết luận: Mô hình nào phù hợp với bạn?
Đối với đại đa số các nhà phát triển và ứng dụng thương mại, Ultralytics YOLOv5 vẫn là lựa chọn được khuyến nghị. Tính dễ sử dụng vượt trội, hỗ trợ cộng đồng mạnh mẽ và tính linh hoạt trong triển khai khiến nó trở thành một giải pháp ít rủi ro, lợi nhuận cao. Khả năng triển khai trên hầu hết mọi nền tảng - từ điện thoại di động đến máy chủ đám mây - với ít trở ngại nhất mang lại cho nó lợi thế quyết định trong môi trường sản xuất.
PP-YOLOE+ là một giải pháp thay thế mạnh mẽ cho người dùng đặc biệt yêu cầu kiến trúc không có neo hoặc những kiến trúc đã được tích hợp vào PaddlePaddle quy trình làm việc. Độ chính xác cao của nó rất đáng khen ngợi, nhưng sự phân mảnh của hệ sinh thái có thể làm chậm quá trình phát triển đối với những người đã quen với tiêu chuẩn PyTorch quy trình làm việc.
Khám phá các Mô hình Khác
Thị giác máy tính phát triển nhanh chóng. Mặc dù việc so sánh các mô hình đã được thiết lập này rất có giá trị, chúng tôi khuyến khích bạn khám phá những tiến bộ mới nhất trong Ultralytics YOLO gia đình, cung cấp hiệu suất và tính năng thậm chí còn tuyệt vời hơn.
- YOLO11 : Mô hình tiên tiến nhất mang lại độ chính xác và hiệu quả vượt trội cho việc phát hiện, phân đoạn và ước tính tư thế.
- YOLOv8 : Một khuôn khổ thống nhất rất phổ biến hỗ trợ OBB và các tác vụ phân loại.
- RT-DETR : Máy dò dựa trên máy biến áp được tối ưu hóa cho hiệu suất thời gian thực.
Để có cái nhìn tổng quan hơn, hãy xem trang so sánh mô hình chính của chúng tôi để đánh giá các kiến trúc khác nhau theo yêu cầu cụ thể của bạn.