Chuyển đến nội dung

YOLOv10 so với YOLOv8: So sánh kỹ thuật để phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng cho sự thành công của bất kỳ dự án thị giác máy tính nào. Trang này cung cấp so sánh kỹ thuật chi tiết giữa YOLOv10 và Ultralytics YOLOv8, hai mô hình hiện đại trong lĩnh vực này. Chúng ta sẽ phân tích sự khác biệt về kiến trúc, số liệu hiệu suất và các ứng dụng lý tưởng của chúng để giúp bạn đưa ra quyết định sáng suốt dựa trên các nhu cầu cụ thể của bạn về tốc độ, độ chính xác và hiệu quả tài nguyên.

YOLOv10: Đẩy mạnh giới hạn của hiệu suất

Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Ngày: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Docs: https://docs.ultralytics.com/models/yolov10/

YOLOv10, được giới thiệu vào tháng 5 năm 2024, đại diện cho một bước tiến quan trọng hướng tới việc đạt được phát hiện đối tượng thời gian thực, đầu cuối thực sự. Đổi mới chính của nó là tập trung vào việc loại bỏ các tắc nghẽn xử lý hậu kỳ và tối ưu hóa kiến trúc mô hình để đạt hiệu quả tối đa. Một tính năng quan trọng là phương pháp đào tạo không cần NMS, sử dụng các gán kép nhất quán để loại bỏ sự cần thiết của Non-Maximum Suppression (NMS), do đó làm giảm độ trễ suy luận.

Kiến trúc và các tính năng chính

YOLOv10 giới thiệu một thiết kế mô hình hướng đến độ chính xác-hiệu quả toàn diện. Nó tối ưu hóa các thành phần khác nhau, chẳng hạn như triển khai một lớp phân loại nhẹ và sử dụng giảm mẫu tách rời không gian-kênh, để giảm sự dư thừa tính toán và tăng cường khả năng phát hiện. Mặc dù được phát triển bởi Đại học Thanh Hoa, YOLOv10 được xây dựng và tích hợp vào khung Ultralytics, giúp nó có thể truy cập và dễ sử dụng với Ultralytics API quen thuộc.

Điểm mạnh

  • Hiệu quả Nâng cao: Cung cấp tốc độ suy luận nhanh hơn và kích thước mô hình nhỏ hơn trong so sánh trực tiếp, điều này rất có lợi cho các môi trường bị hạn chế về tài nguyên như thiết bị biên.
  • Thiết kế không cần NMS: Đơn giản hóa quy trình triển khai bằng cách loại bỏ bước xử lý hậu kỳ NMS, dẫn đến độ trễ từ đầu đến cuối thấp hơn.
  • Hiệu suất vượt trội: Đạt được hiệu suất tuyệt vời, đặc biệt trong các điểm chuẩn tập trung vào độ trễ, thúc đẩy sự phát triển của các giải pháp tối ưu giữa tốc độ và độ chính xác.

Điểm yếu

  • Mô hình mới hơn: Vì là một bản phát hành gần đây hơn, nó có một cộng đồng nhỏ hơn và ít tích hợp của bên thứ ba hơn so với YOLOv8 đã được thiết lập tốt.
  • Chuyên biệt hóa tác vụ: YOLOv10 chủ yếu tập trung vào phát hiện đối tượng. Nó thiếu tính linh hoạt tích hợp cho các tác vụ thị giác khác như phân đoạnước tính tư thế vốn có trong YOLOv8.
  • Độ hoàn thiện của hệ sinh thái: Mặc dù được tích hợp vào hệ sinh thái Ultralytics, nhưng nó vẫn chưa có cùng độ sâu về tài nguyên và các ví dụ do cộng đồng điều khiển như YOLOv8.

Các trường hợp sử dụng lý tưởng

YOLOv10 đặc biệt phù hợp cho các ứng dụng mà hiệu suất thời gian thực và hiệu quả tài nguyên là ưu tiên hàng đầu tuyệt đối:

  • Edge AI: Lý tưởng để triển khai trên các thiết bị có sức mạnh tính toán hạn chế, chẳng hạn như điện thoại di động và các hệ thống nhúng như NVIDIA Jetson.
  • Xử Lý Tốc Độ Cao: Phù hợp cho các ứng dụng yêu cầu độ trễ rất thấp, chẳng hạn như máy bay không người lái tự hành và robot.
  • Phân tích theo thời gian thực: Hoàn hảo cho các môi trường có nhịp độ nhanh, cần phát hiện đối tượng ngay lập tức, như quản lý giao thông.

Tìm hiểu thêm về YOLOv10

Ultralytics YOLOv8: Tính Linh hoạt và Độ hoàn thiện

Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8, được ra mắt vào tháng 1 năm 2023, là một mô hình hoàn thiện và rất linh hoạt, xây dựng dựa trên thế mạnh của những người tiền nhiệm YOLO. Nó được thiết kế để có tốc độ, độ chính xác và tính dễ sử dụng trên một loạt các tác vụ AI thị giác. Điều này làm cho nó trở thành một lựa chọn mạnh mẽ và đáng tin cậy cho cả nhà phát triển và nhà nghiên cứu.

Kiến trúc và các tính năng chính

YOLOv8 có phương pháp dò tìm không neo, giúp đơn giản hóa kiến trúc mô hình và cải thiện khả năng tổng quát hóa. Backbone linh hoạt và các hàm mất mát được tối ưu hóa góp phần mang lại độ chính xác cao hơn và quá trình huấn luyện ổn định hơn. Tính năng nổi bật của YOLOv8 là hỗ trợ gốc cho nhiều tác vụ thị giác, bao gồm phát hiện đối tượng, phân đoạn thể hiện, phân loại ảnh, ước tính tư thế và hộp giới hạn định hướng (OBB).

Điểm mạnh

  • Trưởng thành và có tài liệu đầy đủ: Hưởng lợi từ tài liệu phong phú, một cộng đồng lớn và các tài nguyên có sẵn, làm cho nó thân thiện với người dùng và dễ triển khai thông qua giao diện PythonCLI đơn giản.
  • Linh hoạt và đa nhiệm: Hỗ trợ nhiều tác vụ thị giác ngay khi xuất xưởng, mang lại sự linh hoạt vô song cho các dự án phức tạp, đòi hỏi nhiều hơn là chỉ phát hiện.
  • Hệ sinh thái được duy trì tốt: Tích hợp liền mạch với Ultralytics HUB và các công cụ MLOps khác, hợp lý hóa quy trình làm việc từ huấn luyện đến triển khai. Hệ sinh thái này được hỗ trợ bởi quá trình phát triển tích cực và cập nhật thường xuyên.
  • Cân bằng hiệu suất: Cung cấp sự cân bằng tuyệt vời giữa tốc độ, độ chính xác và kích thước mô hình, phù hợp với nhiều tình huống triển khai thực tế.
  • Hiệu quả huấn luyện: Cung cấp quy trình huấn luyện hiệu quả và các weights đã được huấn luyện trước có sẵn, giúp tăng tốc chu kỳ phát triển. Nó cũng có yêu cầu bộ nhớ thấp hơn so với nhiều kiến trúc khác, đặc biệt là các mô hình dựa trên transformer.

Điểm yếu

  • Mặc dù rất hiệu quả, các mô hình mới hơn như YOLOv10 có thể mang lại những cải tiến nhỏ về các số liệu cụ thể như số lượng tham số hoặc độ trễ trong các tình huống bị hạn chế cao.

Các trường hợp sử dụng lý tưởng

Tính linh hoạt và dễ sử dụng của YOLOv8 khiến nó trở thành lựa chọn lý tưởng cho một loạt các ứng dụng:

  • Hệ thống an ninh: Tuyệt vời để phát hiện đối tượng theo thời gian thực trong hệ thống báo động an ninh.
  • Phân tích bán lẻ: Hữu ích trong bán lẻ thông minh để hiểu hành vi khách hàng và quản lý hàng tồn kho.
  • Kiểm soát chất lượng công nghiệp: Ứng dụng trong sản xuất để kiểm tra trực quan tự động.
  • Dự án đa nhiệm: Sự lựa chọn hoàn hảo cho các dự án yêu cầu phát hiện, phân đoạn và ước tính tư thế đồng thời từ một mô hình duy nhất, hiệu quả.

Tìm hiểu thêm về YOLOv8

Phân tích hiệu năng: YOLOv10 so với YOLOv8

Các số liệu hiệu năng trên tập dữ liệu COCO cho thấy những khác biệt chính giữa hai mô hình. YOLOv10 liên tục đạt được điểm mAP cao hơn với ít tham số và FLOP hơn so với các mô hình YOLOv8 có kích thước tương đương. Ví dụ: YOLOv10-S đạt 46.7% mAP với 7.2M tham số, trong khi YOLOv8-S đạt 44.9% mAP với 11.2M tham số. Điều này làm nổi bật hiệu quả kiến trúc vượt trội của YOLOv10.

Tuy nhiên, YOLOv8 duy trì tốc độ suy luận cực kỳ cạnh tranh, đặc biệt trên GPU. Mô hình nhỏ nhất, YOLOv8n, nhanh hơn một chút trên GPU T4 với TensorRT so với YOLOv10n (1,47ms so với 1,56ms). Hơn nữa, YOLOv8 cung cấp một bộ đầy đủ các điểm chuẩn CPU được thiết lập tốt, chứng minh hiệu suất mạnh mẽ và đáng tin cậy của nó cho các triển khai có thể không có quyền truy cập GPU.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Kết luận và Đề xuất

Cả YOLOv10 và YOLOv8 đều là những mô hình mạnh mẽ, nhưng chúng phục vụ cho các ưu tiên khác nhau. YOLOv10 vượt trội về hiệu quả thuần túy, mang lại hiệu suất hiện đại với độ trễ thấp hơn và ít tham số hơn, khiến nó trở thành một lựa chọn tuyệt vời cho các ứng dụng chuyên biệt, quan trọng về độ trễ.

Tuy nhiên, đối với phần lớn các nhà phát triển và nhà nghiên cứu, Ultralytics YOLOv8 là lựa chọn được khuyến nghị. Ưu điểm chính của nó nằm ở sự trưởng thành, tính linh hoạt và hệ sinh thái mạnh mẽ. Hỗ trợ gốc của YOLOv8 cho nhiều tác vụ (phát hiện, phân đoạn, tư thế, phân loại và OBB) mang lại một lợi thế đáng kể để xây dựng các giải pháp AI phức tạp, đa diện. Tài liệu phong phú, cộng đồng tích cực và tích hợp liền mạch với các công cụ như Ultralytics HUB tạo ra trải nghiệm phát triển vượt trội và hợp lý hơn. Nó cung cấp sự cân bằng vượt trội và đã được chứng minh về tốc độ và độ chính xác, đáng tin cậy cho phạm vi ứng dụng thực tế rộng nhất.

Khám phá các mô hình khác

Đối với người dùng quan tâm đến việc khám phá các mô hình hiện đại khác, Ultralytics cung cấp một bộ toàn diện bao gồm YOLOv5 nền tảng, YOLOv9 hiệu quả và YOLO11 mới nhất. Các so sánh chi tiết như YOLOv9 so với YOLOv8YOLOv5 so với YOLOv8 cũng có sẵn để giúp bạn chọn mô hình hoàn hảo cho dự án của mình.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận