Chuyển đến nội dung

YOLOv8 so với PP-YOLOE+: So sánh kỹ thuật

Việc lựa chọn kiến trúc phát hiện đối tượng tối ưu là một quyết định then chốt ảnh hưởng đến độ chính xác, tốc độ và tính linh hoạt khi triển khai các ứng dụng thị giác máy tính. Hướng dẫn này cung cấp phân tích kỹ thuật chuyên sâu về Ultralytics YOLOv8PP-YOLOE+ . Bằng cách xem xét những cải tiến về kiến trúc, điểm chuẩn hiệu suất và hỗ trợ hệ sinh thái của chúng, chúng tôi mong muốn giúp các nhà phát triển và nhà nghiên cứu lựa chọn công cụ phù hợp với nhu cầu thị giác máy tính cụ thể của họ.

Ultralytics YOLOv8: Tính linh hoạt và hiệu năng

Ultralytics YOLOv8 đại diện cho một bước tiến đáng kể trong YOLO gia đình, được thiết kế để trở thành một khuôn khổ thống nhất cho một loạt các nhiệm vụ thị giác. Được phát triển bởi Ultralytics , nó ưu tiên trải nghiệm người dùng liền mạch mà không ảnh hưởng đến hiệu suất hiện đại (SOTA).

Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu: https://docs. ultralytics .com/models/ yolov8 /

Kiến trúc và các tính năng chính

YOLOv8 giới thiệu đầu phát hiện không cần neo tiên tiến, giúp loại bỏ nhu cầu cấu hình hộp neo thủ công và cải thiện độ hội tụ. Xương sống sử dụng mô-đun C2f—thiết kế cổ chai một phần xuyên tầng—giúp tăng cường luồng gradient và hiệu quả trích xuất đặc trưng. Không giống như nhiều đối thủ cạnh tranh, YOLOv8 không giới hạn ở việc phát hiện đối tượng ; nó hỗ trợ phân đoạn trường hợp , phân loại hình ảnh , ước tính tư thếhộp giới hạn định hướng (OBB) .

Được xây dựng trên nền tảng PyTorch được áp dụng rộng rãi, YOLOv8 được hưởng lợi từ hệ sinh thái công cụ và thư viện khổng lồ. Thiết kế của nó tập trung vào hiệu quả đào tạo , yêu cầu ít bộ nhớ và thời gian hội tụ hơn đáng kể so với các mô hình dựa trên bộ biến đổi hoặc kiến trúc phát hiện cũ.

Điểm mạnh

  • Hệ sinh thái và khả năng sử dụng: Ultralytics cung cấp trải nghiệm "có pin" với API Python mạnh mẽ và CLI .
  • Hỗ trợ đa nhiệm vụ: Một khuôn khổ duy nhất để phát hiện, phân đoạn, phân loại và đặt ra nhiệm vụ giúp đơn giản hóa quy trình phát triển.
  • Tính linh hoạt khi triển khai: Xuất dữ liệu liền mạch sang các định dạng như ONNX , TensorRT , CoreML , Và OpenVINO đảm bảo khả năng tương thích với nhiều loại phần cứng khác nhau, từ thiết bị biên đến máy chủ đám mây.
  • Bảo trì tích cực: Cập nhật thường xuyên và cộng đồng năng động đảm bảo mô hình luôn phù hợp và lỗi được giải quyết nhanh chóng.

Tìm hiểu thêm về YOLOv8

PP-YOLOE+: Độ chính xác cao trong hệ sinh thái PaddlePaddle

PP-YOLOE+ là phiên bản nâng cấp của PP-YOLOE, được Baidu phát triển như một phần của bộ công cụ PaddleDetection . Công nghệ này tập trung vào việc đạt được độ chính xác và tốc độ suy luận cao, được tối ưu hóa đặc biệt cho nền tảng học sâu PaddlePaddle .

Tác giả: PaddlePaddle Tác giả
Tổ chức: Baidu
Ngày: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/ PaddlePaddle /PaddleDetection/
Tài liệu: https://github.com/ PaddlePaddle /PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

Kiến trúc và các tính năng chính

PP-YOLOE+ là một bộ phát hiện đơn tầng, không cần neo. Nó kết hợp xương sống CSPRepResNet và một mạng lưới tổng hợp đường dẫn (PAN) để hợp nhất các đặc điểm mạnh mẽ. Một tính năng nổi bật là Đầu tác vụ hiệu quả (ET-Head), sử dụng Học liên kết tác vụ (TAL) để đồng bộ hóa tốt hơn các dự đoán phân loại và định vị. Mặc dù mạnh mẽ, mô hình này đã ăn sâu vào hệ sinh thái Baidu, phụ thuộc rất nhiều vào PaddlePaddle -các toán tử và công cụ tối ưu hóa cụ thể.

Điểm mạnh và Điểm yếu

Điểm mạnh:

  • Độ chính xác cao: Các biến thể lớn nhất (ví dụ: PP-YOLOE+x) đạt được điểm mAP ấn tượng trên COCO tập dữ liệu.
  • Được tối ưu hóa cho phần cứng Paddle: Hoạt động cực kỳ tốt trên phần cứng được tối ưu hóa cho khuôn khổ của Baidu.

Điểm yếu:

  • Khóa khung: Sự phụ thuộc vào PaddlePaddle có thể là rào cản đối với các nhóm được chuẩn hóa PyTorch hoặc TensorFlow , hạn chế quyền truy cập vào các nguồn tài nguyên cộng đồng nguồn mở rộng hơn.
  • Cường độ tài nguyên: Như đã nêu chi tiết trong phần hiệu suất, các mô hình PP-YOLOE+ thường yêu cầu nhiều tham số và phép toán dấu phẩy động (FLOP) hơn để đạt được kết quả tương đương với YOLOv8 , tác động đến hiệu quả của các thiết bị AI biên có nguồn lực hạn chế.
  • Phạm vi nhiệm vụ hạn chế: Chủ yếu tập trung vào phát hiện, nó thiếu sự hỗ trợ tích hợp, sẵn dùng cho phân đoạn và ước tính tư thế được tìm thấy trong Ultralytics hệ sinh thái.

Tìm hiểu thêm về PP-YOLOE+

Phân tích chuẩn hiệu suất

Khi so sánh YOLOv8 và PP-YOLOE+, sự đánh đổi giữa tốc độ, độ chính xác và kích thước mô hình trở nên rõ ràng. YOLOv8 thể hiện hiệu quả kỹ thuật vượt trội, mang lại độ chính xác cạnh tranh hoặc cao hơn với ít tham số và FLOP hơn đáng kể. Hiệu quả này chuyển thành thời gian đào tạo nhanh hơn, tiêu thụ bộ nhớ thấp hơn và tốc độ suy luận nhanh hơn.

Ví dụ, YOLOv8n là ứng cử viên lý tưởng cho các ứng dụng di động và nhúng, mang lại hiệu suất thời gian thực với chi phí tính toán tối thiểu. Ngược lại, mặc dù các mô hình PP-YOLOE+ như biến thể 'x' vượt qua giới hạn về độ chính xác, nhưng chúng lại nặng hơn và chậm hơn, điều này có thể không khả thi đối với các luồng phân tích video thời gian thực.

Hiệu quả là quan trọng

Đối với môi trường sản xuất, kích thước và tốc độ mô hình thường quan trọng như độ chính xác thô. YOLOv8 Kiến trúc hiệu quả của cho phép triển khai trên phần cứng nhỏ hơn, ít tốn kém hơn mà không làm giảm đáng kể chất lượng phát hiện.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Đề xuất trường hợp sử dụng

  • Giám sát thời gian thực: Sử dụng YOLOv8 vì sự cân bằng giữa tốc độ và độ chính xác. Giải pháp này vượt trội trong các hệ thống giám sát giao thông và an ninh, nơi việc xử lý video FPS cao là rất quan trọng.
  • Kiểm tra công nghiệp: Cả hai mô hình đều phục vụ tốt ở đây, nhưng YOLOv8 Việc dễ dàng đào tạo trên các tập dữ liệu tùy chỉnh giúp thích ứng nhanh hơn với các loại lỗi sản xuất cụ thể.
  • Triển khai Edge: YOLOv8n Và YOLOv8s là những lựa chọn vượt trội để triển khai trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson vì kích thước nhỏ gọn của chúng.
  • Đường ống tầm nhìn phức tạp: Nếu dự án của bạn yêu cầu theo dõi hoặc phân đoạn đối tượng cùng với phát hiện, Ultralytics YOLOv8 cung cấp các khả năng này một cách tự nhiên, tránh việc phải ghép các mô hình riêng lẻ lại với nhau.

Sử dụng và triển khai

Một trong những lợi thế hấp dẫn nhất của Ultralytics YOLOv8 là API thân thiện với nhà phát triển. Trong khi PP-YOLOE+ yêu cầu điều hướng PaddlePaddle cấu hình hệ sinh thái, YOLOv8 có thể được thực hiện trong một vài dòng Python mã. Điều này làm giảm rào cản gia nhập cho người mới bắt đầu và đẩy nhanh quá trình tạo mẫu cho các chuyên gia.

Dưới đây là một ví dụ về cách đơn giản để tải một chương trình được đào tạo trước YOLOv8 mô hình và chạy suy luận:

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Đào tạo liền mạch

Việc đào tạo một mô hình tùy chỉnh cũng đơn giản không kém. Ultralytics tự động xử lý việc tăng cường dữ liệu, điều chỉnh siêu tham số và quản lý tập dữ liệu, cho phép bạn tập trung vào việc quản lý dữ liệu chất lượng cao.

Kết luận

Trong khi PP-YOLOE+ là một đối thủ đáng gờm, vượt qua mọi giới hạn về độ chính xác phát hiện trong hệ sinh thái Baidu, Ultralytics YOLOv8 nổi lên như một lựa chọn thiết thực và linh hoạt hơn cho cộng đồng nhà phát triển toàn cầu. Sự tích hợp của nó với PyTorch , hiệu quả vượt trội trên mỗi tham số và hỗ trợ toàn diện cho nhiều tác vụ thị giác khiến nó trở thành công cụ phổ biến cho các ứng dụng AI hiện đại.

Hệ sinh thái Ultralytics càng làm tăng thêm lợi thế này. Với các công cụ như Ultralytics HUB giúp đào tạo và quản lý mô hình dễ dàng, cùng tài liệu hướng dẫn chi tiết từng bước, YOLOv8 đảm bảo dự án của bạn chuyển từ ý tưởng sang triển khai với ít trở ngại nhất. Cho dù bạn đang xây dựng ứng dụng thành phố thông minh hay công cụ chẩn đoán y tế, YOLOv8 cung cấp sự cân bằng hiệu suất và dễ sử dụng cần thiết để thành công.

Khám phá các Mô hình Khác

Nếu bạn muốn mở rộng hiểu biết của mình về bối cảnh phát hiện đối tượng, hãy cân nhắc khám phá những so sánh khác sau:


Bình luận