Chuyển đến nội dung

PP-YOLOE+ so với YOLOv8: So sánh kỹ thuật

Việc lựa chọn kiến trúc phát hiện đối tượng tối ưu là một bước then chốt trong việc phát triển các ứng dụng thị giác máy tính mạnh mẽ. Quyết định này thường liên quan đến việc cân nhắc giữa tốc độ suy luận, độ chính xác phát hiện và tính linh hoạt khi triển khai. Hướng dẫn này cung cấp so sánh kỹ thuật chuyên sâu giữa PP-YOLOE+ , một mô hình có độ chính xác cao từ Baidu. PaddlePaddle hệ sinh thái và Ultralytics YOLOv8 , một mô hình nổi tiếng thế giới được ca ngợi vì tính linh hoạt, tốc độ và hệ sinh thái thân thiện với nhà phát triển.

PP-YOLOE+: Độ chính xác trong PaddlePaddle Hệ sinh thái

PP-YOLOE+ là phiên bản cải tiến của PP-YOLOE, được phát triển bởi nhóm PaddleDetection tại Baidu. Nó đại diện cho một bước tiến đáng kể trong YOLO gia đình, được tối ưu hóa đặc biệt cho PaddlePaddle khung. Được phát hành để cải thiện các tiêu chuẩn hiện đại (SOTA) trước đây, nó tập trung nhiều vào việc tối ưu hóa sự đánh đổi giữa hiệu quả đào tạo và độ chính xác suy luận.

Chi tiết kỹ thuật: Tác giả: PaddlePaddle Tác giả
Tổ chức: Baidu
Ngày: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/ PaddlePaddle /PaddleDetection/
Tài liệu: https://github.com/ PaddlePaddle /PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

Tìm hiểu thêm về PP-YOLOE+

Kiến trúc và các tính năng cốt lõi

PP-YOLOE+ áp dụng kiến trúc không có mỏ neo hiện đại, giúp đơn giản hóa quá trình đào tạo bằng cách loại bỏ nhu cầu tính toán kích thước hộp neo tối ưu cho các tập dữ liệu cụ thể.

  • Backbone: Nó sử dụng backbone CSPRepResNet , kết hợp lợi ích của luồng gradient của CSPNet với khả năng tham số hóa lại của RepVGG. Điều này cho phép mô hình có cấu trúc phức tạp trong quá trình huấn luyện để học các đặc trưng phong phú nhưng lại có cấu trúc đơn giản và nhanh hơn trong quá trình suy luận.
  • Cổ: Mô hình sử dụng Mạng tổng hợp đường dẫn (PAN) để tăng cường khả năng hợp nhất tính năng trên nhiều tỷ lệ khác nhau, rất quan trọng để phát hiện các vật thể có kích thước khác nhau.
  • Đầu: Một cải tiến quan trọng là Đầu hiệu quả theo nhiệm vụ (ET-Head) . Cơ chế đầu tách biệt này tách biệt các đặc điểm phân loại và định vị, sử dụng Học căn chỉnh nhiệm vụ (TAL) để đảm bảo điểm số tin cậy cao nhất tương ứng với các hộp giới hạn chính xác nhất.

Điểm mạnh và hạn chế

Điểm mạnh: PP-YOLOE+ được thiết kế để đạt hiệu suất cao trên các chuẩn mực như tập dữ liệu COCO . Việc triển khai Varifocal Loss và Distribution Focal Loss góp phần tạo nên khả năng ấn tượng trong việc xử lý mất cân bằng lớp và sự mơ hồ về vị trí.

Điểm yếu: Hạn chế chính đối với nhiều nhà phát triển là sự phụ thuộc sâu sắc vào PaddlePaddle khuôn khổ. Mặc dù mạnh mẽ, PaddlePaddle có cộng đồng toàn cầu nhỏ hơn PyTorch , có khả năng gây khó khăn cho việc tích hợp vào các quy trình MLOps hiện có vốn dựa trên các công cụ tiêu chuẩn. Ngoài ra, PP-YOLOE+ chủ yếu tập trung vào phát hiện, thiếu khả năng đa nhiệm sẵn có trong các bộ công cụ toàn diện hơn.

Ultralytics YOLOv8 : Tiêu chuẩn về tính linh hoạt và hiệu suất

Ultralytics YOLOv8 đại diện cho một sự thay đổi lớn trong cách phát triển và triển khai các mô hình AI. Được thiết kế bởi Ultralytics , nó được thiết kế không chỉ như một mô hình mà còn là một khuôn khổ hoàn chỉnh có khả năng xử lý nhiều tác vụ thị giác máy tính , từ phát hiện đến phân tích không gian phức tạp.

Chi tiết kỹ thuật: Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu: https://docs. ultralytics .com/models/ yolov8 /

Tìm hiểu thêm về YOLOv8

Kiến trúc và Hệ sinh thái

YOLOv8 xây dựng dựa trên di sản của trước đó YOLO phiên bản có xương sống C2f được cải tiến, thay thế mô-đun C3 để cải thiện luồng gradient và hiệu quả trích xuất tính năng.

Các Ultralytics Lợi thế

YOLOv8 vượt trội về tính dễ sử dụng . Ultralytics Python gói này cho phép đào tạo, xác thực và dự đoán chỉ trong một vài dòng mã.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100)

Sự đơn giản này được hỗ trợ bởi một hệ sinh thái được bảo trì tốt . Người dùng được hưởng lợi từ việc tích hợp liền mạch với các công cụ như Ultralytics HUB để đào tạo trên nền tảng đám mây, TensorBoard để trực quan hóa và nhiều định dạng xuất dữ liệu khác nhau, bao gồm ONNX , TensorRT , Và OpenVINO . Điều này đảm bảo rằng các mô hình không chỉ là sản phẩm nghiên cứu mà còn sẵn sàng để triển khai trong thế giới thực.

Phân tích so sánh: Số liệu và Hiệu suất

Khi đánh giá các mô hình này, điều quan trọng là phải nhìn xa hơn độ chính xác hàng đầu và xem xét hiệu quả. Bảng dưới đây trình bày so sánh chi tiết các số liệu chính.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Tốc độ và hiệu quả

Các điểm nổi bật của dữ liệu YOLOv8 Hiệu suất vượt trội. Mô hình YOLOv8n (nano) là một sản phẩm nổi bật cho các ứng dụng AI biên , đạt tốc độ suy luận đáng kinh ngạc 1,47ms trên T4 GPU , nhanh hơn đáng kể so với PP-YOLOE+t nhỏ nhất. Hơn nữa, YOLOv8n chỉ cần 3,2 triệu tham số và 8,7 tỷ FLOP, khiến nó nhẹ hơn nhiều so với đối thủ của nó.

Độ chính xác so với Tài nguyên

Trong khi PP-YOLOE+x đạt được mức cao hơn một chút mAP 54,7, nó làm được điều đó với chi phí đáng kể: gần 100 triệu tham số. Ngược lại, YOLOv8x mang lại mức cạnh tranh 53,9 mAP với số lượng tham số ít hơn khoảng 30% (68,2M). Đối với hầu hết các ứng dụng thực tế, YOLOv8 cung cấp hiệu suất cân bằng hơn, mang lại độ chính xác SOTA mà không cần tốn quá nhiều chi phí tính toán.

Hiệu quả bộ nhớ

Ultralytics YOLO Các mô hình nổi tiếng với mức tiêu thụ bộ nhớ thấp trong cả quá trình đào tạo và suy luận. Không giống như một số mô hình dựa trên bộ biến đổi hoặc kiến trúc nặng, YOLOv8 được tối ưu hóa để chạy hiệu quả trên phần cứng tiêu dùng, giảm nhu cầu về tài nguyên điện toán đám mây đắt tiền.

Các trường hợp sử dụng và ứng dụng lý tưởng

Sự lựa chọn giữa các mô hình này thường phụ thuộc vào những hạn chế cụ thể của dự án của bạn.

Khi nào nên chọn YOLOv8

YOLOv8 là lựa chọn được khuyến nghị cho phần lớn các nhà phát triển vì tính linh hoạtdễ sử dụng .

  • Triển khai Edge: Với các mô hình nhẹ như YOLOv8n , nó hoàn hảo để triển khai trên Raspberry Pi, NVIDIA Jetson hoặc các thiết bị di động.
  • Đường ống đa nhiệm vụ: Nếu dự án của bạn yêu cầu theo dõi đối tượng cùng với phân đoạn hoặc ước tính tư thế (ví dụ: phân tích thể thao), YOLOv8 cung cấp tất cả các khả năng này trong một thư viện thống nhất duy nhất.
  • Nguyên mẫu nhanh: Việc cung cấp các trọng số được đào tạo trước và API đơn giản cho phép các nhóm chuyển từ khái niệm sang bằng chứng khái niệm chỉ trong vài giờ.
  • Hỗ trợ đa nền tảng: Hỗ trợ tuyệt vời cho ONNX , OpenVINO và CoreML đảm bảo mô hình của bạn có thể chạy ở bất cứ đâu.

Khi nào nên cân nhắc PP-YOLOE+

PP-YOLOE+ vẫn là ứng cử viên mạnh mẽ dành riêng cho những người dùng tích hợp sâu vào hệ sinh thái Baidu.

  • Quy trình làm việc PaddlePaddle : Các nhóm đã sử dụng PaddlePaddle bộ ứng dụng cho các tác vụ AI khác sẽ thấy PP-YOLOE+ phù hợp một cách tự nhiên với cơ sở hạ tầng hiện có của chúng.
  • Độ chính xác lý thuyết tối đa: Dành cho các cuộc thi nghiên cứu hoặc các tình huống mà mọi phân số của mAP Với số lượng và tài nguyên tính toán không giới hạn, các mô hình PP-YOLOE+ lớn nhất có khả năng rất cao.

Kết luận

Trong khi PP-YOLOE+ chứng minh khả năng của PaddlePaddle Với độ chính xác ấn tượng, Ultralytics YOLOv8 nổi bật là giải pháp thiết thực và mạnh mẽ hơn cho cộng đồng thị giác máy tính nói chung. Sự kết hợp hoàn hảo giữa tốc độ cao, hiệu quả tài nguyên và bộ tính năng phong phú—bao gồm hỗ trợ gốc cho phân đoạnước tính tư thế —khiến nó trở thành lựa chọn ưu việt cho phát triển AI hiện đại.

Được hỗ trợ bởi một cộng đồng nguồn mở năng động, tài liệu mở rộng và cập nhật liên tục, YOLOv8 đảm bảo rằng các nhà phát triển được trang bị các công cụ phù hợp với tương lai để giải quyết các vấn đề thực tế một cách hiệu quả.

Khám phá các Mô hình Khác

Nếu bạn muốn khám phá những tiến bộ mới nhất trong phát hiện đối tượng, hãy cân nhắc xem qua những so sánh liên quan sau:


Bình luận