YOLOv8 so với YOLOv5 So sánh kỹ thuật toàn diện
Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng đối với sự thành công của dự án. Hai cột mốc quan trọng nhất trong lịch sử này là YOLOv5 và YOLOv8 , cả hai đều được phát triển bởi Ultralytics . Trong khi đó, YOLOv5 Ngay từ khi ra mắt, sản phẩm đã thiết lập tiêu chuẩn ngành về tính dễ sử dụng và độ tin cậy. YOLOv8 Đã giới thiệu những đột phá về kiến trúc, định nghĩa lại hiệu năng tiên tiến nhất (SOTA).
Hướng dẫn này cung cấp phân tích kỹ thuật chuyên sâu về cả hai kiến trúc, so sánh các chỉ số hiệu năng, phương pháp đào tạo và các trường hợp sử dụng lý tưởng để giúp các nhà phát triển đưa ra quyết định sáng suốt.
Ultralytics YOLOv8: Tiêu chuẩn hiện đại
Được phát hành vào tháng 1 năm 2023, YOLOv8 đánh dấu một bước tiến lớn trong dòng sản phẩm YOLO . Nó kế thừa thành công của các phiên bản trước đó đồng thời giới thiệu một khung tổng thể thống nhất cho việc phát hiện đối tượng, phân đoạn đối tượng và ước tính tư thế .
Các Đổi Mới Kiến Trúc Chính
YOLOv8 Nó khác biệt so với thiết kế dựa trên neo của các phiên bản trước, áp dụng cơ chế phát hiện không cần neo . Sự thay đổi này đơn giản hóa độ phức tạp của mô hình bằng cách dự đoán trực tiếp tâm của đối tượng, giảm số lượng dự đoán hộp và tăng tốc quá trình loại bỏ cực đại không cần thiết (Non-Maximum Suppression - NMS ) .
- Mô-đun C2f: Hệ thống xương sống sử dụng mô-đun C2f mới, thay thế cho mô-đun C3 được tìm thấy trong... YOLOv5 Thiết kế mới này giúp tăng cường luồng gradient và cho phép mô hình thu thập được nhiều biểu diễn đặc trưng phong phú hơn mà không làm tăng đáng kể chi phí tính toán.
- Đầu tách rời: Không giống như đầu nối liền của các phiên bản trước, YOLOv8 Tách biệt nhiệm vụ phân loại và hồi quy thành các nhánh độc lập. Sự tách biệt này cho phép tối ưu hóa từng nhiệm vụ riêng lẻ, dẫn đến tốc độ hội tụ cao hơn và độ chính xác tốt hơn.
- Tăng cường khảm: Mặc dù cả hai mô hình đều sử dụng tăng cường khảm , YOLOv8 Tự động tắt chức năng này trong các giai đoạn huấn luyện cuối cùng để cải thiện độ chính xác.
Hiệu suất và Tính Đa năng
YOLOv8 Nó được thiết kế để đa năng . Nó hỗ trợ một loạt các tác vụ vượt xa việc chỉ phát hiện khung giới hạn đơn giản, khiến nó trở thành lựa chọn mạnh mẽ cho các ứng dụng phức tạp như xe tự hành và phân tích bán lẻ thông minh .
Thông tin chi tiết về YOLOv8 :
Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 10/01/2023
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv8
Ultralytics YOLOv5: Cỗ Máy Đáng Tin Cậy
Kể từ khi ra mắt vào tháng 6 năm 2020, YOLOv5 đã trở thành mô hình được các nhà phát triển trên toàn thế giới ưa chuộng nhờ tính ổn định vượt trội và sự đơn giản trong cách sử dụng. PyTorch Việc triển khai này đã dân chủ hóa quyền truy cập vào trí tuệ nhân tạo thị giác mạnh mẽ, giúp dễ dàng huấn luyện các mô hình trên các tập dữ liệu tùy chỉnh với cấu hình tối thiểu.
Kiến trúc và Di sản
YOLOv5 Nó sử dụng kiến trúc xương sống CSPDarknet và đầu phát hiện dựa trên anchor. Lớp lấy nét của nó (sau này được thay thế bằng phép tích chập 6x6) rất hiệu quả trong việc giảm kích thước ảnh mà vẫn bảo toàn thông tin.
- Dễ sử dụng: YOLOv5 Nó nổi tiếng với trải nghiệm "sẵn sàng sử dụng ngay". Cấu trúc kho lưu trữ trực quan và tích hợp liền mạch với các công cụ MLOps như Comet và ClearML .
- Hỗ trợ triển khai rộng rãi: Vì nó đã tồn tại lâu hơn, YOLOv5 Nền tảng này hỗ trợ rộng rãi hầu hết mọi mục tiêu triển khai, từ bộ xử lý di động thông qua TFLite đến các thiết bị biên như NVIDIA Jetson .
Thông tin chi tiết về YOLOv5 :
Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 26/06/2020
GitHub: ultralytics / yolov5
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv5
So sánh hiệu suất
Khi so sánh hai mô hình, YOLOv8 luôn vượt trội YOLOv5 về độ chính xác ( mAP và tốc độ suy luận, đặc biệt là trên các hệ thống hiện đại. GPU phần cứng. Bảng sau đây minh họa sự khác biệt về hiệu năng trên tập dữ liệu COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Phân tích các chỉ số
- Sự chính xác: YOLOv8 thể hiện một lợi thế đáng kể về Độ chính xác trung bình ( mAP ) . Ví dụ, biến thể Nano (n) của YOLOv8 đạt mức cao hơn gần 10% mAP So với YOLOv5n, nó vượt trội hơn hẳn trong các ứng dụng cần độ chính xác cao trên các mô hình nhỏ.
- Tốc độ: Trong khi YOLOv5 vẫn nhanh hơn một chút trên một số CPU các tiêu chuẩn đánh giá do số phép tính FLOP thấp hơn, YOLOv8 Mang lại sự cân bằng hiệu năng tốt hơn. Sự đánh đổi thường không đáng kể so với những cải thiện về độ chính xác, và YOLOv8 được tối ưu hóa cao cho GPU Suy luận sử dụng TensorRT .
- Kích thước người mẫu: YOLOv8 Các mô hình nhìn chung nhỏ gọn nhưng tích hợp nhiều tham số hơn vào kiến trúc Nano và Small để tăng cường khả năng học tập.
Phương pháp luận đào tạo và Hệ sinh thái
Cả hai mô hình đều được hưởng lợi từ Hệ sinh thái Ultralytics mạnh mẽ, nhưng quy trình làm việc đã phát triển đáng kể với... YOLOv8 .
Hiệu quả huấn luyện
Ultralytics Các mô hình này nổi tiếng về hiệu quả đào tạo . Chúng đòi hỏi ít thời gian và công sức hơn đáng kể. CUDA So với các kiến trúc dựa trên Transformer như RT-DETR , bộ nhớ của nó cho phép người dùng huấn luyện các lô dữ liệu lớn hơn trên các GPU tiêu chuẩn dành cho người tiêu dùng.
- YOLOv5 sử dụng cấu trúc kho lưu trữ độc lập, nơi quá trình huấn luyện được bắt đầu thông qua các tập lệnh như...
train.py. - YOLOv8 giới thiệu
ultralyticsPython gói này. CLI Và Python API giúp việc chuyển đổi giữa các tác vụ và xuất mô hình trở nên dễ dàng hơn.
Đào tạo được tối ưu hóa với Ultralytics
Hàm ultralytics Gói phần mềm này đơn giản hóa quy trình đào tạo cho YOLOv8 và các mô hình mới hơn như YOLO26. Bạn có thể tải mô hình, huấn luyện và kiểm tra tính hợp lệ của nó chỉ với ba dòng mã.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with efficient memory usage
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Cái Ultralytics Nền tảng
Người dùng cả hai mô hình đều có thể tận dụng Nền tảng Ultralytics (trước đây là HUB). Công cụ dựa trên web này giúp đơn giản hóa việc quản lý tập dữ liệu, gắn nhãn và trực quan hóa quá trình huấn luyện. Nó hỗ trợ xuất mô hình chỉ bằng một cú nhấp chuột sang các định dạng như ONNX và OpenVINO , giúp đơn giản hóa quá trình từ nguyên mẫu đến sản xuất.
Các trường hợp sử dụng lý tưởng
Khi nào nên chọn YOLOv8
YOLOv8 Đây là lựa chọn ưu tiên cho hầu hết các dự án mới trong năm 2026 không yêu cầu các tối ưu hóa cạnh cụ thể của YOLO26 mới hơn.
- Ứng dụng đa nhiệm: Nếu dự án của bạn liên quan đến việc phát hiện đối tượng OBB trong ảnh chụp từ trên không hoặc ước tính tư thế cho phân tích thể thao, YOLOv8 Hỗ trợ các tính năng này một cách tự nhiên.
- Yêu cầu độ chính xác cao: Đối với các nhiệm vụ quan trọng về an toàn như phát hiện khuyết tật , độ chính xác vượt trội là điều cần thiết. mAP của YOLOv8 Đảm bảo giảm thiểu số trường hợp âm tính giả.
Khi nào nên chọn YOLOv5
- Hệ thống kế thừa: Các dự án tích hợp sâu với các hệ thống cụ thể YOLOv5 Cấu trúc kho lưu trữ có thể dễ dàng duy trì hơn là chuyển đổi.
- Hạn chế cực độ ở vùng biên: Trên phần cứng có tài nguyên cực kỳ hạn chế, nơi mà mỗi mili giây của CPU Xét về thời gian, số FLOP thấp hơn một chút của YOLOv5n có thể mang lại lợi thế nhỏ, mặc dù các mẫu mới hơn như YOLO26 hiện đã thu hẹp khoảng cách này một cách hiệu quả.
Hướng tới tương lai: YOLO26
Trong khi YOLOv8 Và YOLOv5 Ultralytics YOLO26 là những công cụ tuyệt vời, và lĩnh vực thị giác máy tính đang phát triển rất nhanh. Đối với các nhà phát triển bắt đầu các dự án mới ngày nay, chúng tôi đặc biệt khuyên bạn nên xem xét sử dụng nó.
Tại sao nên nâng cấp lên YOLO26? YOLO26 kế thừa những ưu điểm của các phiên bản tiền nhiệm nhưng giới thiệu thiết kế hoàn chỉnh, không cần hệ thống quản lý mạng NMS , loại bỏ nhu cầu xử lý hậu kỳ và đơn giản hóa đáng kể quá trình triển khai.
- Suy luận CPU nhanh hơn 43%: Được tối ưu hóa đặc biệt cho các thiết bị biên, giúp nó nhanh hơn cả hai phương pháp kia. YOLOv5 Và YOLOv8 trên CPU.
- Bộ tối ưu hóa MuSGD: Một bộ tối ưu hóa lai lấy cảm hứng từ quá trình huấn luyện LLM nhằm đạt được sự hội tụ ổn định và nhanh chóng.
- Độ chính xác được nâng cao: Các hàm mất mát được cải tiến (ProgLoss + STAL) cung cấp khả năng phát hiện vật thể nhỏ tốt hơn.
Kết luận
Cả YOLOv8 và YOLOv5 đều là minh chứng cho điều đó. Ultralytics 'Cam kết cung cấp trí tuệ nhân tạo hiệu năng cao, dễ tiếp cận. YOLOv5 Đây vẫn là một lựa chọn đáng tin cậy và được hỗ trợ rộng rãi, đặc biệt là đối với các hệ thống cũ. Tuy nhiên, YOLOv8 Cung cấp sự cân bằng hiệu năng vượt trội, kiến trúc hiện đại và khả năng hỗ trợ nhiều tác vụ hơn, khiến nó trở thành lựa chọn tốt hơn cho hầu hết các ứng dụng tiêu chuẩn.
Đối với những ai tìm kiếm tốc độ và độ chính xác vượt trội nhất, đặc biệt là cho triển khai trên thiết bị di động và biên, YOLO26 mới ra mắt đã thiết lập một tiêu chuẩn mới. Bất kể lựa chọn của bạn là gì, tài liệu hướng dẫn chi tiết Ultralytics và cộng đồng người dùng năng động sẽ đảm bảo bạn có đủ nguồn lực cần thiết để thành công.
Để tìm hiểu thêm, bạn có thể tham khảo các mô hình chuyên dụng khác như YOLO11 hoặc YOLOv10 .