YOLOv8 so với YOLOv10 : So sánh kỹ thuật toàn diện
Việc lựa chọn mô hình phát hiện đối tượng phù hợp là yếu tố then chốt cho sự thành công của bất kỳ dự án thị giác máy tính nào. Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết giữa Ultralytics YOLOv8 và YOLOv10 , phân tích những cải tiến về kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng của chúng. YOLOv10 giới thiệu các tối ưu hóa hiệu quả mới, Ultralytics YOLOv8 vẫn là một thế lực thống trị nhờ hệ sinh thái mạnh mẽ, tính linh hoạt vô song và độ tin cậy đã được chứng minh trong nhiều tình huống triển khai khác nhau.
Ultralytics YOLOv8 : Tiêu chuẩn đa năng
Ra mắt vào tháng 1 năm 2023, Ultralytics YOLOv8 đánh dấu một bước tiến vượt bậc trong dòng sản phẩm YOLO , được thiết kế không chỉ như một mô hình mà còn là một khuôn khổ toàn diện cho AI thị giác. Sản phẩm ưu tiên khả năng sử dụng và tính linh hoạt, trở thành lựa chọn hàng đầu cho các nhà phát triển, từ những người đam mê đến các kỹ sư doanh nghiệp.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2023-01-10
- GitHub: ultralytics / ultralytics
- Tài liệu: Tài liệu YOLOv8
Kiến trúc và Khả năng
YOLOv8 sử dụng cơ chế phát hiện không cần neo , giúp đơn giản hóa quá trình đào tạo bằng cách loại bỏ nhu cầu chỉ định hộp neo thủ công. Phương pháp này cải thiện khả năng khái quát hóa trên nhiều hình dạng vật thể khác nhau. Kiến trúc của nó bao gồm một đầu tách rời và một xương sống hiện đại, cân bằng giữa chi phí tính toán và độ chính xác cao.
Một đặc điểm xác định của YOLOv8 là hỗ trợ đa tác vụ gốc của nó. Không giống như nhiều mô hình chuyên biệt, YOLOv8 cung cấp các khả năng sẵn có cho:
- Phát Hiện Đối Tượng
- Phân đoạn thực thể
- Phân loại hình ảnh
- Ước tính tư thế
- Hộp giới hạn xoay (Oriented Bounding Boxes - OBB)
Ưu điểm chính
Hệ sinh thái được duy trì tốt xung quanh YOLOv8 là một lợi thế lớn. Nó tích hợp liền mạch với Ultralytics HUB để đào tạo và quản lý mô hình, đồng thời cung cấp các tùy chọn xuất mở rộng sang các định dạng như ONNX , TensorRT , Và CoreML Ngoài ra, yêu cầu về bộ nhớ trong quá trình đào tạo và suy luận thấp hơn đáng kể so với kiến trúc dựa trên bộ biến đổi, đảm bảo nó chạy hiệu quả trên phần cứng tiêu chuẩn.
YOLOv10 : Đẩy mạnh giới hạn hiệu quả
YOLOv10 , được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, tập trung chủ yếu vào việc tối ưu hóa quy trình suy luận bằng cách loại bỏ các điểm nghẽn liên quan đến hậu xử lý.
- Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
- Tổ chức: Đại học Thanh Hoa
- Ngày: 2024-05-23
- Arxiv: arXiv:2405.14458
- GitHub: THU-MIG/yolov10
- Tài liệu: Tài liệu YOLOv10
Đổi mới kiến trúc
Tính năng nổi bật của YOLOv10 là chiến lược đào tạo không cần NMS . Các bộ phát hiện đối tượng truyền thống dựa vào NMS (Non-Maximum Suppression) để lọc ra các hộp giới hạn chồng chéo trong quá trình suy luận, điều này có thể gây ra độ trễ. YOLOv10 sử dụng các phép gán kép nhất quán trong quá trình huấn luyện—kết hợp giám sát một-nhiều để có tín hiệu giám sát phong phú với phép so khớp một-một để suy luận hiệu quả. Điều này cho phép mô hình dự đoán các hộp giới hạn chính xác mà không cần NMS , do đó làm giảm độ trễ từ đầu đến cuối.
Kiến trúc này cũng bao gồm thiết kế hiệu quả-độ chính xác toàn diện, có đầu phân loại nhẹ và lấy mẫu hạ tần tách biệt kênh không gian để giảm độ dư thừa tính toán (FLOP) và số lượng tham số.
Chỉ số hiệu suất và phân tích
Khi so sánh hai mô hình này, điều cần thiết là phải nhìn xa hơn những con số về độ chính xác thuần túy. Trong khi YOLOv10 cho thấy hiệu quả ấn tượng về mặt thông số, YOLOv8 duy trì hiệu suất mạnh mẽ trên nhiều loại phần cứng và tác vụ khác nhau.
Bảng so sánh
Bảng dưới đây nêu bật hiệu suất trên tập dữ liệu COCO . YOLOv10 đạt được cao hơn mAP với ít tham số hơn trong một số trường hợp, nhưng YOLOv8 vẫn có tính cạnh tranh cao về tốc độ suy luận, đặc biệt là trên tiêu chuẩn CPU Và GPU chuẩn mực.
| Mô hình | Kích thước (pixels) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Phân tích quan trọng
- Cân bằng hiệu suất: YOLOv8 cung cấp sự cân bằng tuyệt vời giữa tốc độ và độ chính xác. Tốc độ của nó trên CPU (thông qua ONNX ) được ghi chép đầy đủ và tối ưu hóa, khiến nó trở thành lựa chọn đáng tin cậy cho các triển khai thiếu chuyên môn GPU phần cứng.
- Hiệu quả đào tạo: Ultralytics Các mô hình được biết đến với quy trình đào tạo hiệu quả. Người dùng thường có thể đạt được sự hội tụ nhanh hơn với YOLOv8 Các siêu tham số được tối ưu hóa và trọng số được đào tạo sẵn có.
- Độ trưởng thành của hệ sinh thái: Trong khi YOLOv10 mang lại hiệu quả lý thuyết cao hơn, YOLOv8 được hưởng lợi từ nhiều năm cải tiến trong Ultralytics hệ sinh thái. Điều này bao gồm hỗ trợ mở rộng cho việc tăng cường dữ liệu , gỡ lỗi cộng đồng tích cực và tích hợp với các công cụ như Weights & Biases và Comet .
Tính linh hoạt rất quan trọng
Nếu dự án của bạn yêu cầu nhiều hơn là chỉ các hộp giới hạn—chẳng hạn như hiểu ngôn ngữ cơ thể thông qua ước tính tư thế hoặc phân định ranh giới chính xác thông qua phân đoạn — YOLOv8 là người chiến thắng rõ ràng YOLOv10 hiện nay chủ yếu chuyên về phát hiện vật thể.
Các trường hợp sử dụng lý tưởng
Khi nào nên chọn Ultralytics YOLOv8
YOLOv8 là lựa chọn được khuyến nghị cho phần lớn các ứng dụng thực tế do tính linh hoạt và dễ sử dụng.
- Giải pháp AI đa diện: Hoàn hảo cho các dự án yêu cầu phân đoạn hoặc phân loại trường hợp cùng với phát hiện.
- Triển khai doanh nghiệp: Lý tưởng cho các doanh nghiệp cần một khuôn khổ ổn định, được hỗ trợ với các tùy chọn cấp phép rõ ràng và tích hợp vào các kênh MLOps hiện có.
- Bán lẻ thông minh: Khả năng xử lý nhiều tác vụ giúp giải pháp này phù hợp với các phân tích bán lẻ phức tạp như theo dõi kệ hàng và phân tích hành vi khách hàng.
- Tạo mẫu nhanh: Sự đơn giản Python API cho phép các nhà phát triển chuyển từ khái niệm sang mô hình đã được đào tạo chỉ trong vài phút.
Khi nào nên chọn YOLOv10
YOLOv10 tốt nhất là nên dành riêng cho những lĩnh vực cụ thể có hạn chế về phần cứng.
- AI biên quan trọng về độ trễ: Các ứng dụng trên bộ vi điều khiển hoặc hệ thống nhúng cũ, trong đó từng mili giây độ trễ suy luận đều có giá trị.
- Xử lý video thông lượng cao: Các tình huống như quản lý lưu lượng, trong đó việc giảm thời gian xử lý hậu kỳ cho mỗi khung hình có thể tiết kiệm đáng kể tài nguyên tính toán.
Triển khai mã
Một trong những đặc điểm nổi bật của Ultralytics hệ sinh thái là dễ sử dụng. Cả hai mô hình đều có thể được truy cập thông qua ultralytics Python gói, đảm bảo trải nghiệm nhất quán cho nhà phát triển.
Dưới đây là một ví dụ về cách chạy suy luận với YOLOv8 , chứng minh tính đơn giản của API.
from ultralytics import YOLO
# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")
# Perform object detection on a local image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Tương tự như vậy, bởi vì Ultralytics hỗ trợ hệ sinh thái rộng hơn, bạn thường có thể dễ dàng hoán đổi trọng số để thử nghiệm với các kiến trúc khác, miễn là chúng được hỗ trợ trong thư viện.
Xuất khẩu liền mạch
Ultralytics cung cấp lệnh một dòng để xuất các mô hình đã được đào tạo của bạn sang các định dạng dễ triển khai. Điều này hoạt động hoàn hảo với YOLOv8 để tạo ra các mô hình tối ưu cho sản xuất:
# Export YOLOv8 model to ONNX format
model.export(format="onnx")
Kết luận
Cả hai YOLOv8 Và YOLOv10 là những thành tựu ấn tượng của kỹ thuật thị giác máy tính. YOLOv10 đẩy mạnh phong bì trong hiệu quả kiến trúc với NMS -thiết kế miễn phí, khiến nó trở thành ứng cử viên sáng giá cho các nhiệm vụ phát hiện có độ nhạy cao và độ trễ lớn.
Tuy nhiên, đối với sự phát triển mạnh mẽ, linh hoạt và bền vững trong tương lai , Ultralytics YOLOv8 vẫn là lựa chọn hàng đầu. Khả năng xử lý phân loại , phân đoạn và ước lượng tư thế trong một khuôn khổ duy nhất mang lại giá trị vượt trội. Kết hợp với tài liệu hướng dẫn phong phú, hỗ trợ cộng đồng tích cực và tích hợp liền mạch với Ultralytics HUB , YOLOv8 cho phép các nhà phát triển xây dựng các giải pháp AI toàn diện nhanh hơn và đáng tin cậy hơn.
Đối với những người đang tìm kiếm hiệu suất mới nhất tuyệt đối, chúng tôi cũng khuyên bạn nên khám phá YOLO11 , được xây dựng dựa trên thế mạnh của YOLOv8 để mang lại độ chính xác và tốc độ cao hơn.