Ultralytics YOLOv8 so với YOLOv10 Sự tiến hóa của phát hiện thời gian thực
Lĩnh vực thị giác máy tính phát triển với tốc độ chóng mặt, với các kiến trúc mới liên tục định nghĩa lại trạng thái hiện đại của công nghệ. Hai cột mốc quan trọng trong dòng thời gian này là Ultralytics YOLOv8 và YOLOv10 . Mặc dù cả hai mô hình đều bắt nguồn từ dòng sản phẩm huyền thoại YOLOv8, nhưng cả hai đều có nguồn gốc từ dòng sản phẩm huyền thoại này. YOLO Dòng sản phẩm (You Only Look Once) thể hiện những triết lý thiết kế và sự tích hợp hệ sinh thái khác nhau.
Hướng dẫn này cung cấp một so sánh kỹ thuật chi tiết để giúp các nhà nghiên cứu và nhà phát triển lựa chọn công cụ phù hợp với nhu cầu cụ thể của họ, cân nhắc các yếu tố như độ trưởng thành của hệ sinh thái, tính linh hoạt trong thực hiện nhiệm vụ và sự đổi mới về kiến trúc.
Tóm tắt: Bạn nên chọn mô hình nào?
Trước khi đi sâu vào kiến trúc, đây là sự khác biệt tổng quan:
- Ultralytics YOLOv8 là công cụ mạnh mẽ, "đa năng" trong lĩnh vực thị giác máy tính. Đây là lựa chọn ưu tiên cho việc triển khai trong doanh nghiệp nhờ hệ sinh thái rộng lớn, hỗ trợ nhiều tác vụ (Phát hiện, Phân đoạn, Tư thế, OBB, Phân loại) và tích hợp liền mạch với Nền tảng Ultralytics .
- YOLOv10 là một mô hình phát hiện chuyên dụng được giới thiệu NMS - Đào tạo miễn phí cho toàn thế giới. Đây là công cụ tuyệt vời cho nghiên cứu và các tình huống chỉ phát hiện cụ thể, nơi mục tiêu chính là loại bỏ quá trình xử lý hậu kỳ.
Tiêu chuẩn mới nhất: YOLO26
Trong khi so sánh YOLOv8 Và YOLOv10 Nếu bạn đang tìm kiếm một trình soạn thảo văn bản có giá trị, thì YOLO26 là lựa chọn tốt nhất dành cho người dùng muốn trải nghiệm hiệu năng cao nhất. Được phát hành vào tháng 1 năm 2026, YOLO26 kết hợp... NMS - Thiết kế miễn phí tiên phong bởi YOLOv10 với hệ sinh thái mạnh mẽ và tính linh hoạt đa nhiệm của Ultralytics Nó cung cấp tốc độ nhanh hơn tới 43%. CPU suy luận và cải thiện khả năng phát hiện vật thể nhỏ.
Ultralytics YOLOv8: Tiêu chuẩn Hệ sinh thái
Được phát hành vào đầu năm 2023, YOLOv8 Nó nhanh chóng trở thành tiêu chuẩn ngành cho thị giác máy tính thực tiễn. Sức mạnh chính của nó không chỉ nằm ở các chỉ số thô, mà còn ở tính dễ sử dụng và tính linh hoạt .
Các tính năng chính
- Học tập đa nhiệm: Không giống như nhiều mô hình chuyên biệt, YOLOv8 Hỗ trợ sẵn các chức năng phát hiện đối tượng , phân đoạn đối tượng , ước lượng tư thế , hộp giới hạn định hướng (OBB) và phân loại hình ảnh .
- Phát hiện không cần neo: Phương pháp này sử dụng đầu phân tách không cần neo, giúp giảm số lượng dự đoán hộp và tăng tốc độ loại bỏ cực đại cục bộ (Non-Maximum Suppression). NMS ).
- Hệ sinh thái Ultralytics : Tích hợp đầy đủ các công cụ để chú thích dữ liệu , huấn luyện mô hình và triển khai.
Chi tiết mô hình
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2023-01-10
- Tài liệu:Tài liệu YOLOv8
YOLOv10 : Cái NMS -Free Pioneer
Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 Tập trung mạnh vào hiệu quả kiến trúc và loại bỏ các điểm nghẽn trong quá trình xử lý hậu kỳ.
Những đổi mới quan trọng
- Đào tạo toàn diện: YOLOv10 Phương pháp này sử dụng các phép gán kép nhất quán để loại bỏ nhu cầu sử dụng phương pháp loại bỏ cực đại không đồng nhất (Non-Maximum Suppression - NMS ) trong quá trình suy luận. Điều này giúp giảm sự biến động độ trễ trong các cảnh có nhiều dữ liệu.
- Thiết kế hiệu quả toàn diện: Kiến trúc này có các đầu phân loại nhẹ và lấy mẫu giảm không gian-kênh để giảm chi phí tính toán (FLOPs).
- Trọng tâm: Nó được thiết kế chủ yếu cho các tác vụ phát hiện đối tượng.
Chi tiết mô hình
- Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
- Tổ chức: Đại học Thanh Hoa
- Ngày: 2024-05-23
- Arxiv:2405.14458
- Tài liệu:Tài liệu YOLOv10
So sánh Kỹ thuật: Các chỉ số và Hiệu suất
Bảng sau đây so sánh hiệu năng của cả hai mô hình trên... COCO tập dữ liệu.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Phân tích Dữ liệu
- Độ chính xác so với hiệu quả: YOLOv10 thường đạt được kết quả cao hơn mAP val với số tham số và số phép tính FLOP ít hơn so với YOLOv8 Hiệu quả này có được là nhờ các khối kiến trúc được tối ưu hóa.
- Tốc độ suy luận: Trong khi YOLOv10 loại bỏ NMS , YOLOv8 Các mẫu máy (đặc biệt là phiên bản Nano) vẫn duy trì khả năng cạnh tranh đáng kinh ngạc về hiệu suất thô trên phần cứng tiêu chuẩn.
- Rèn luyện trí nhớ: Ultralytics YOLOv8 được tối ưu hóa cao về hiệu quả đào tạo , thường yêu cầu ít hơn. GPU có bộ nhớ lớn hơn so với các triển khai trong giới học thuật, cho phép kích thước lô lớn hơn trên phần cứng dành cho người tiêu dùng.
Kiến trúc và Triết lý Thiết kế
Sự khác biệt cốt lõi nằm ở cách các mô hình này xử lý các dự đoán cuối cùng.
Kiến trúc YOLOv8
YOLOv8 Nó sử dụng bộ phân công phù hợp với nhiệm vụ . Nó dự đoán các hộp giới hạn và điểm số lớp riêng biệt nhưng sẽ căn chỉnh chúng trong quá trình huấn luyện. Điều quan trọng là, nó dựa vào... NMS Xử lý hậu kỳ để lọc bỏ các hộp trùng lặp. Điều này làm cho mô hình trở nên mạnh mẽ và linh hoạt, cho phép dễ dàng thích ứng với việc phân đoạn và ước tính tư thế .
Kiến trúc YOLOv10
YOLOv10 Giới thiệu tính năng Gán nhãn kép . Trong quá trình huấn luyện, nó sử dụng đầu nối một-nhiều (như...). YOLOv8 ) cho các tín hiệu giám sát phong phú và một đầu nối một-đối-một để suy luận cuối cùng. Cấu trúc này cho phép mô hình học cách chọn hộp tốt nhất duy nhất cho một đối tượng, tạo ra NMS Lỗi thời.
Ý nghĩa triển khai
Loại bỏ NMS Giúp đơn giản hóa đáng kể quy trình triển khai. Khi xuất mô hình sang các định dạng như TensorRT hoặc OpenVINO , các kỹ sư không còn cần phải triển khai các thủ tục phức tạp nữa. NMS Các plugin, giúp giảm chi phí kỹ thuật.
Dễ sử dụng và hệ sinh thái
Đây là điểm mà sự khác biệt trở nên quan trọng nhất đối với các nhà phát triển.
Ultralytics YOLOv8 được hỗ trợ bởi một cộng đồng mã nguồn mở lớn mạnh và năng động. Nó có những lợi thế sau:
- Cập nhật thường xuyên: Các bản vá lỗi định kỳ, tính năng mới và sửa lỗi tương thích.
- Nền tảng Ultralytics : Quản lý dữ liệu và đào tạo trên nền tảng đám mây liền mạch.
- Tài liệu: Hướng dẫn toàn diện về mọi thứ, từ tinh chỉnh siêu tham số đến triển khai trên các thiết bị biên .
YOLOv10 , trong khi có sẵn thông qua Ultralytics Gói phần mềm này chủ yếu là một đóng góp mang tính học thuật. Nó có thể không nhận được tần suất bảo trì hoặc mở rộng tính năng (như hỗ trợ theo dõi hoặc OBB) như phần mềm cốt lõi. Ultralytics mô hình.
So sánh mã
Cả hai mô hình đều có thể được chạy bằng cách sử dụng giao diện thống nhất. Ultralytics API này thể hiện sự dễ sử dụng mà hệ sinh thái cung cấp.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model (Official Ultralytics)
model_v8 = YOLO("yolov8n.pt")
# Load a pretrained YOLOv10 model (Community supported)
model_v10 = YOLO("yolov10n.pt")
# Train YOLOv8 on a custom dataset
model_v8.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference with YOLOv10 on an image
results = model_v10("https://ultralytics.com/images/bus.jpg")
Các ứng dụng thực tế
Khi nào nên sử dụng YOLOv8
- Robot phức tạp: Nếu robot của bạn cần điều hướng (Phát hiện) và thao tác với các vật thể (Định vị/Phân đoạn), YOLOv8 Khả năng thực hiện nhiều nhiệm vụ cùng lúc là rất cần thiết.
- Sản phẩm thương mại: Đối với các sản phẩm yêu cầu bảo trì lâu dài, độ ổn định của sản phẩm là yếu tố quan trọng. Ultralytics Hệ sinh thái đảm bảo việc triển khai mô hình của bạn vẫn khả thi trong nhiều năm.
- Ảnh vệ tinh: Các mô hình OBB chuyên dụng trong YOLOv8 Chúng rất lý tưởng để phát hiện các vật thể xoay như tàu thuyền hoặc phương tiện giao thông trong ảnh chụp từ trên không.
Khi nào nên sử dụng YOLOv10
- Giao dịch dữ liệu hình ảnh tần suất cao: Trong những trường hợp mà từng micro giây biến động độ trễ đều quan trọng, việc loại bỏ NMS Bước này cung cấp thời gian suy luận xác định.
- Thiết bị nhúng có CPU hạn chế: Dành cho các thiết bị mà NMS tính toán trên CPU là một điểm nghẽn, YOLOv10 Thiết kế toàn diện của nó giúp giảm tải cho bộ xử lý.
Kết luận
Cả hai kiến trúc đều là những lựa chọn tuyệt vời. YOLOv8 vẫn là lựa chọn linh hoạt hàng đầu cho hầu hết các nhà phát triển, cung cấp một con đường an toàn, mạnh mẽ và giàu tính năng để đưa sản phẩm vào môi trường sản xuất. YOLOv10 mang đến một cái nhìn thú vị về tương lai của... NMS - Phát hiện miễn phí.
Tuy nhiên, lĩnh vực này đã có những bước tiến đáng kể. Đối với các nhà phát triển bắt đầu các dự án mới hiện nay, YOLO26 là lựa chọn được khuyến nghị. Nó áp dụng... NMS - những lợi ích miễn phí của YOLOv10 nhưng được tinh chỉnh bằng trình tối ưu hóa MuSGD và các hàm mất mát nâng cao (ProgLoss), mang lại những ưu điểm tốt nhất của cả hai thế giới: kiến trúc tiên tiến của nghiên cứu học thuật được hỗ trợ bởi sự hỗ trợ cấp công nghiệp. Ultralytics .
Đọc thêm
- Tài liệu hướng dẫn YOLO26
- Giải thích các chỉ số hiệu suất của YOLO
- Hướng dẫn về phát hiện đối tượng
- Bắt đầu nhanh với Nền tảng Ultralytics