Ultralytics YOLOv8 So sánh kỹ thuật toàn diện với EfficientDet
Trong lĩnh vực phát hiện đối tượng đang phát triển nhanh chóng, việc lựa chọn kiến trúc mạng nơ-ron tối ưu là rất quan trọng để cân bằng độ chính xác, tốc độ suy luận và tính khả thi triển khai. Bài phân tích chuyên sâu này so sánh hai kiến trúc có ảnh hưởng lớn: Ultralytics YOLOv8 , một tiêu chuẩn đa năng trong hệ sinh thái thị giác máy tính hiện đại, và EfficientDet , một mô hình nền tảng từ... Google Nổi tiếng với chiến lược mở rộng quy mô theo từng giai đoạn.
Cho dù mục tiêu triển khai của bạn là các máy chủ đám mây hiệu năng cao hay các thiết bị biên có tài nguyên hạn chế, việc hiểu rõ các sắc thái kiến trúc của các mô hình này sẽ dẫn dắt dự án của bạn đến thành công.
Tổng quan kiến trúc
Cả hai mô hình đều tiếp cận thách thức xác định và định vị vật thể trong ảnh bằng cách sử dụng mạng nơ-ron tích chập, nhưng chúng sử dụng các phương pháp luận riêng biệt để đạt được trích xuất đặc trưng và hồi quy hộp giới hạn.
Ultralytics YOLOv8
Được phát hành bởi Ultralytics vào tháng 1 năm 2023, YOLOv8 đánh dấu một bước tiến lớn trong lĩnh vực này. YOLO Dòng sản phẩm này được phát triển bởi Glenn Jocher, Ayush Chaurasia và Jing Qiu, được thiết kế từ đầu để hỗ trợ liền mạch nhiều tác vụ thị giác, bao gồm phát hiện đối tượng , phân đoạn đối tượng , ước lượng tư thế và phân loại hình ảnh.
Kiến trúc này giới thiệu một đầu phát hiện không cần neo, giúp giảm đáng kể số lượng dự đoán hộp và tăng tốc quá trình loại bỏ cực đại cục bộ (Non-Maximum Suppression). NMS Cấu trúc cốt lõi của nó sử dụng mô-đun C2f (Cross-Stage Partial bottleneck with two convolutions) mới để cải thiện luồng gradient trong quá trình huấn luyện đồng thời duy trì dung lượng nhẹ. Điều này giúp YOLOv8 Đặc biệt hiệu quả khi được biên dịch sang các định dạng như NVIDIA TensorRT hoặc ONNX .
EfficientDet
Được biên soạn bởi Mingxing Tan, Ruoming Pang và Quoc V. Le tại Google và phát hành vào cuối năm 2019, EfficientDet tập trung vào hiệu quả có thể mở rộng. Được mô tả trong bài báo Arxiv chính thức của họ, mô hình này tận dụng mạnh mẽ hệ sinh thái AutoML.
Đặc điểm nổi bật của EfficientDet là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN) , cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng. Kết hợp với kiến trúc xương sống EfficientNet, kiến trúc này sử dụng phương pháp mở rộng tỷ lệ phức hợp, mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho tất cả các mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp cùng một lúc. Mặc dù điều này mang lại hiệu quả tham số tuyệt vời, nhưng cấu trúc mạng phức tạp thường gặp khó khăn trong việc đạt được tốc độ thời gian thực tối ưu trên các GPU tiêu chuẩn.
So sánh hiệu năng và số liệu
Khi so sánh các bộ phát hiện đối tượng, độ chính xác trung bình ( mAP ) và độ trễ suy luận là những tiêu chí đánh giá chính. Bảng dưới đây minh họa cách... YOLOv8 Các biến thể và họ EfficientDet (d0-d7) so sánh với nhau dựa trên các chỉ số tiêu chuẩn trên các tập dữ liệu như COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Phân tích cân bằng hiệu suất
Mặc dù EfficientDet đạt được độ chính xác đáng khen ngợi với số phép tính lý thuyết ít hơn, Ultralytics YOLOv8 lại vượt trội hơn trong thực tế. GPU tốc độ suy luận. Ví dụ, YOLOv8x đạt được mức cao hơn một chút mAP (53,9) hơn EfficientDet-d7 (53,7) nhưng xử lý hình ảnh nhanh hơn đáng kể trên T4 GPU (14,37ms so với 128,07ms), tạo ra YOLOv8 Đây là sự lựa chọn hiển nhiên cho phân tích video thời gian thực.
Phương pháp luận đào tạo và Hệ sinh thái
Trải nghiệm của nhà phát triển là yếu tố then chốt khi lựa chọn kiến trúc máy học. Đây chính là điểm khác biệt thực sự giữa sự hỗ trợ của cộng đồng mã nguồn mở và các công cụ trong hệ sinh thái của các mô hình này.
EfficientDet phụ thuộc rất nhiều vào TensorFlow và các pipeline AutoML chuyên dụng. Mặc dù hiệu quả cho việc huấn luyện đám mây phân tán quy mô lớn, việc thiết lập môi trường, điều chỉnh các anchor và phân tích các tệp cấu hình phức tạp trong kho lưu trữ GitHub của EfficientDet có thể gây khó khăn cho các nhóm kỹ thuật làm việc nhanh chóng.
Ngược lại, Ultralytics YOLOv8 được xây dựng nguyên bản trên PyTorch , mang lại sự dễ sử dụng vượt trội. Các nhà phát triển có thể khởi tạo các vòng lặp huấn luyện phức tạp chỉ với một dòng lệnh duy nhất. Python mã hoặc CLI lệnh. Hơn nữa, yêu cầu về bộ nhớ của mô hình trong quá trình huấn luyện được tối ưu hóa rất nhiều; YOLOv8 Cho phép các nhà phát triển sử dụng GPU tiêu dùng tầm trung huấn luyện các mô hình mạnh mẽ mà không gặp phải lỗi hết bộ nhớ (OOM) thường xuyên xảy ra với các kiến trúc nặng về transformer.
Việc tích hợp liền mạch với Nền tảng Ultralytics đưa điều này tiến thêm một bước nữa, cung cấp giao diện không cần lập trình để chú thích dữ liệu, huấn luyện mô hình và triển khai đám mây chỉ bằng một cú nhấp chuột. Các tính năng như tự động điều chỉnh siêu tham số đảm bảo bạn luôn đạt được độ chính xác tốt nhất có thể cho các tập dữ liệu tùy chỉnh của mình.
Python Ví dụ mã: YOLOv8 Suy luận
Việc chạy một trình dò hiện đại sử dụng kho lưu trữ GitHub của Ultralytics vô cùng đơn giản:
from ultralytics import YOLO
# Initialize the YOLOv8 model natively in PyTorch
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 example dataset
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image URL
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes
inference_results[0].show()
Thế hệ tiếp theo: Nâng cấp lên Ultralytics YOLO26
Trong khi YOLOv8 Ultralytics YOLO26 vẫn là một mô hình sản xuất có khả năng cao, các nhà nghiên cứu và phát triển đang tìm kiếm hiệu năng AI tiên tiến nhất nên đánh giá sản phẩm này, dự kiến ra mắt vào tháng 1 năm 2026.
YOLO26 định nghĩa lại mô hình phát hiện đối tượng bằng cách giới thiệu thiết kế không sử dụng NMS Non-Maximum Suppression) từ đầu đến cuối . Bằng cách loại bỏ nhu cầu sử dụng NMS trong quá trình xử lý hậu kỳ—một nút thắt cổ chai đã tồn tại từ những năm đầu. YOLO với nhiều phiên bản khác nhau, sự biến thiên độ trễ hầu như được loại bỏ. Đây là một bước đột phá trong việc triển khai trên các thiết bị tiêu thụ điện năng thấp.
Hơn nữa, YOLO26 tích hợp một số cải tiến đột phá trong đào tạo:
- Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến, sự kết hợp giữa SGD và Muon này đảm bảo quá trình huấn luyện rất ổn định và tốc độ hội tụ được tăng tốc đáng kể.
- Tăng tốc suy luận trên CPU lên đến 43%: Nhờ việc loại bỏ NMS và một backbone được tối ưu hóa mạnh mẽ, YOLO26 đạt tốc độ chưa từng có trên các thiết bị biên chỉ dùng CPU mà không cần dựa vào NPU chuyên dụng.
- ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại một bước nhảy vọt đáng kể về độ chính xác nhận diện vật thể nhỏ, khiến YOLO26 trở nên không thể thiếu đối với hình ảnh trên không và các cảm biến IoT chính xác.
- Loại bỏ DFL: Distribution Focal Loss đã được loại bỏ hoàn toàn để đơn giản hóa đáng kể quy trình xuất sang các định dạng như OpenVINO và CoreML.
Các trường hợp sử dụng và Khuyến nghị
Việc lựa chọn giữa các kiến trúc này cuối cùng phụ thuộc vào các ràng buộc triển khai và yêu cầu hệ thống cũ của bạn.
- Chọn Ultralytics YOLOv8 nếu: Bạn đang xây dựng các ứng dụng thị giác máy tính hiện đại, đa năng đòi hỏi độ chính xác cao, suy luận GPU thời gian thực và trải nghiệm phát triển không ma sát. Hiệu suất mạnh mẽ của nó trên các tác vụ phân loại, segment và detect làm cho nó trở thành một công cụ đa năng mạnh mẽ cho phân tích bán lẻ, robot và hệ thống an ninh.
- Chọn EfficientDet nếu: Bạn đang bị ràng buộc bởi các quy trình làm việc TensorFlow cũ và mối quan tâm chính của bạn là giảm thiểu số lượng tham số và FLOPs lý thuyết, có thể cho mục đích nghiên cứu hơn là triển khai công nghiệp thời gian thực nghiêm ngặt.
- Chọn Ultralytics YOLO26 nếu: Bạn đang bắt đầu một dự án mới và yêu cầu những gì tốt nhất tuyệt đối. Kiến trúc NMS-free end-to-end nguyên bản của nó làm cho nó trở thành lựa chọn tối ưu cho cả triển khai biên cực nhanh và xử lý đám mây nặng.
Nếu bạn đang tìm hiểu các framework có khả năng cao khác trong phạm vi này Ultralytics Trong hệ sinh thái này, bạn cũng có thể cân nhắc Ultralytics YOLO11 để có hiệu năng cân bằng cho hệ thống cũ hoặc RT-DETR để có cách tiếp cận dựa trên bộ chuyển đổi để phát hiện thời gian thực.