Bỏ qua nội dung

So sánh mô hình: YOLOv8 so với YOLOX để phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng đối với nhiều ứng dụng thị giác máy tính. Trang này cung cấp so sánh kỹ thuật chi tiết giữa Ultralytics YOLOv8 và YOLOX, hai mô hình phổ biến và hiệu quả để phát hiện đối tượng. Chúng tôi sẽ khám phá các sắc thái kiến trúc, chuẩn mực hiệu suất và tính phù hợp của chúng cho các trường hợp sử dụng khác nhau để giúp bạn đưa ra quyết định sáng suốt.

Ultralytics YOLOv8 : Hiệu quả và tính linh hoạt

Ultralytics YOLOv8 là một mô hình tiên tiến nhất trong YOLO series, được biết đến với tốc độ và độ chính xác trong việc phát hiện vật thể và các nhiệm vụ thị giác khác. Được phát triển bởi Glenn Jocher, Ayush Chaurasia và Jing Qiu tại Ultralytics và phát hành vào ngày 2023-01-10 , YOLOv8 xây dựng dựa trên trước đó YOLO phiên bản với những cải tiến về kiến trúc tập trung vào hiệu quả và dễ sử dụng. Nó được thiết kế để linh hoạt, hoạt động tốt trong các nhiệm vụ phát hiện đối tượng, phân đoạn, ước tính tư thế và phân loại.

Kiến trúc và các tính năng chính:

YOLOv8 áp dụng phương pháp tiếp cận không có neo, đơn giản hóa kiến trúc và cải thiện khả năng khái quát hóa. Các tính năng chính bao gồm:

  • Backbone hợp lý : Trích xuất tính năng hiệu quả.
  • Đầu phát hiện không cần neo : Tăng tốc độ và tính đơn giản.
  • Chức năng mất mát tổng hợp : Được tối ưu hóa để có độ chính xác và đào tạo mạnh mẽ.

Điểm mạnh:

  • Hiệu suất tuyệt vời: YOLOv8 đạt được sự cân bằng mạnh mẽ giữa tốc độ và độ chính xác, làm cho nó phù hợp với nhiều ứng dụng khác nhau. Xem số liệu hiệu suất trong bảng so sánh bên dưới.
  • Thân thiện với người dùng: Ultralytics nhấn mạnh vào tính dễ sử dụng với tài liệu hướng dẫn rõ ràng và gói Python thân thiện với người dùng.
  • Tính linh hoạt của nhiều tác vụ: Hỗ trợ phát hiện đối tượng, phân đoạn trường hợp , ước tính tư thếphân loại hình ảnh .
  • Tích hợp hệ sinh thái: Tích hợp liền mạch với Ultralytics HUB để quản lý và triển khai mô hình, hợp lý hóa quy trình làm việc MLOps .

Điểm yếu:

  • Mặc dù rất hiệu quả đối với các thiết bị có nguồn lực hạn chế, các mẫu nhỏ hơn như YOLOX-Nano có thể cung cấp kích thước mẫu nhỏ hơn.

Các trường hợp sử dụng lý tưởng:

YOLOv8 Tính linh hoạt của nó làm cho nó trở nên lý tưởng cho các ứng dụng đòi hỏi sự cân bằng giữa độ chính xác cao và hiệu suất thời gian thực, chẳng hạn như:

Tìm hiểu thêm về YOLOv8

YOLOX: Hiệu suất cao và đơn giản

YOLOX , được giới thiệu bởi Zheng Ge, Songtao Liu, Feng Wang, Zeming Li và Jian Sun từ Megvii vào ngày 18-07-2021 , là một neo không có neo khác YOLO mô hình hướng đến hiệu suất cao với thiết kế đơn giản. YOLOX tập trung vào phát hiện đối tượng và được thiết kế để thu hẹp khoảng cách giữa nghiên cứu và ứng dụng công nghiệp.

Kiến trúc và các tính năng chính:

YOLOX cũng áp dụng phương pháp không có neo, đơn giản hóa quá trình đào tạo và suy luận. Các thành phần kiến trúc chính bao gồm:

  • Đầu tách rời : Tách biệt nhiệm vụ phân loại và định vị để cải thiện hiệu suất.
  • Gán nhãn SimOTA : Chiến lược gán nhãn nâng cao để tối ưu hóa quá trình đào tạo.
  • Tăng cường dữ liệu mạnh mẽ : Các kỹ thuật như MixUp và Mosaic được sử dụng để tăng cường tính mạnh mẽ.

Điểm mạnh:

  • Độ chính xác cao: YOLOX đạt được độ chính xác cạnh tranh, thường vượt trội hơn các loại khác YOLO mô hình, đặc biệt là ở kích thước mô hình nhỏ hơn. Tham khảo bảng so sánh để biết số liệu chi tiết.
  • Suy luận hiệu quả: Cung cấp tốc độ suy luận nhanh, phù hợp với các ứng dụng thời gian thực.
  • Xương sống linh hoạt: Hỗ trợ nhiều xương sống khác nhau, bao gồm Darknet53 và các tùy chọn nhẹ như Nano, cho phép tùy chỉnh dựa trên hạn chế về tài nguyên.
  • Nguồn mở : Megvii cung cấp nguồn mở hoàn toàn, khuyến khích cộng đồng đóng góp và sử dụng.

Điểm yếu:

  • Cộng đồng & Hệ sinh thái : Mặc dù là mã nguồn mở, nhưng nó có thể không có cùng mức độ tích hợp hệ sinh thái và công cụ như Ultralytics YOLOv8 , chẳng hạn như tích hợp liền mạch với các nền tảng như Ultralytics TRUNG TÂM.

Các trường hợp sử dụng lý tưởng:

YOLOX rất phù hợp cho các ứng dụng đòi hỏi độ chính xác cao và suy luận hiệu quả, chẳng hạn như:

  • Phát hiện đối tượng hiệu suất cao : Các tình huống yêu cầu độ chính xác cao nhất trong các tác vụ phát hiện đối tượng.
  • Triển khai biên : Các biến thể nhỏ hơn như YOLOX-Nano và YOLOX-Tiny rất phù hợp để triển khai trên các thiết bị biên có tài nguyên tính toán hạn chế.
  • Nghiên cứu và phát triển : Nhờ thiết kế dạng mô-đun và rõ ràng, đây là lựa chọn tốt cho nghiên cứu và phát triển thêm về phát hiện vật thể.

Tìm hiểu thêm về YOLOX

So sánh hiệu suất

Dưới đây là một so sánh của YOLOv8 và các mô hình YOLOX dựa trên số liệu hiệu suất trên tập dữ liệu COCO.

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOX là 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXLl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Phần kết luận

Cả hai YOLOv8 và YOLOX là những lựa chọn tuyệt vời để phát hiện đối tượng, mỗi lựa chọn đều có thế mạnh riêng. YOLOv8 nổi bật với tính linh hoạt, dễ sử dụng và hệ sinh thái mạnh mẽ, khiến nó trở thành mô hình toàn diện tuyệt vời cho nhiều nhiệm vụ tầm nhìn và kịch bản triển khai khác nhau. YOLOX nổi trội về độ chính xác và hiệu quả, đặc biệt là trong các tình huống đòi hỏi hiệu suất cao và khả năng thích ứng với các hạn chế về tài nguyên.

Đối với người dùng quan tâm đến việc khám phá các mô hình khác, Ultralytics cũng cung cấp một loạt các mẫu mã tiên tiến, bao gồm YOLOv5 , YOLOv7 , YOLOv9 , YOLOv10 và các mẫu YOLO11 mới nhất, mỗi mẫu được thiết kế cho các nhu cầu và ứng dụng cụ thể.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận