Ultralytics YOLOv8 So sánh kỹ thuật toàn diện với EfficientDet
Trong lĩnh vực phát hiện đối tượng đang phát triển nhanh chóng, việc lựa chọn kiến trúc mạng nơ-ron tối ưu là rất quan trọng để cân bằng độ chính xác, tốc độ suy luận và tính khả thi triển khai. Bài phân tích chuyên sâu này so sánh hai kiến trúc có ảnh hưởng lớn: Ultralytics YOLOv8 , một tiêu chuẩn đa năng trong hệ sinh thái thị giác máy tính hiện đại, và EfficientDet , một mô hình nền tảng từ... Google Nổi tiếng với chiến lược mở rộng quy mô theo từng giai đoạn.
Cho dù mục tiêu triển khai của bạn là các máy chủ đám mây hiệu năng cao hay các thiết bị biên có tài nguyên hạn chế, việc hiểu rõ các sắc thái kiến trúc của các mô hình này sẽ dẫn dắt dự án của bạn đến thành công.
Tổng quan kiến trúc
Cả hai mô hình đều tiếp cận thách thức xác định và định vị các đối tượng trong ảnh bằng cách sử dụng mạng nơ-ron tích chập , nhưng chúng sử dụng các phương pháp khác nhau để thực hiện trích xuất đặc trưng và hồi quy hộp giới hạn.
Ultralytics YOLOv8
Được phát hành bởi Ultralytics vào tháng 1 năm 2023, YOLOv8 đánh dấu một bước tiến lớn trong lĩnh vực này. YOLO Dòng sản phẩm này được phát triển bởi Glenn Jocher, Ayush Chaurasia và Jing Qiu, được thiết kế từ đầu để hỗ trợ liền mạch nhiều tác vụ thị giác, bao gồm phát hiện đối tượng , phân đoạn đối tượng , ước lượng tư thế và phân loại hình ảnh.
Kiến trúc này giới thiệu một đầu phát hiện không cần neo, giúp giảm đáng kể số lượng dự đoán hộp và tăng tốc quá trình loại bỏ cực đại cục bộ (Non-Maximum Suppression). NMS Cấu trúc cốt lõi của nó sử dụng mô-đun C2f (Cross-Stage Partial bottleneck with two convolutions) mới để cải thiện luồng gradient trong quá trình huấn luyện đồng thời duy trì dung lượng nhẹ. Điều này giúp YOLOv8 Đặc biệt hiệu quả khi được biên dịch sang các định dạng như NVIDIA TensorRT hoặc ONNX .
EfficientDet
Bài viết được chấp bút bởi Mingxing Tan, Ruoming Pang và Quoc V. Le. Google Được phát hành vào cuối năm 2019, EfficientDet tập trung vào hiệu quả có thể mở rộng. Được mô tả trong bài báo chính thức trên Arxiv , mô hình này tận dụng tối đa hệ sinh thái AutoML .
Đặc điểm nổi bật của EfficientDet là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN) , cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng. Kết hợp với kiến trúc xương sống EfficientNet, kiến trúc này sử dụng phương pháp mở rộng tỷ lệ phức hợp, mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho tất cả các mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp cùng một lúc. Mặc dù điều này mang lại hiệu quả tham số tuyệt vời, nhưng cấu trúc mạng phức tạp thường gặp khó khăn trong việc đạt được tốc độ thời gian thực tối ưu trên các GPU tiêu chuẩn.
So sánh hiệu năng và số liệu
Khi so sánh các bộ phát hiện đối tượng, độ chính xác trung bình ( mAP ) và độ trễ suy luận là những tiêu chí đánh giá chính. Bảng dưới đây minh họa cách... YOLOv8 Các biến thể và họ EfficientDet (d0-d7) so sánh với nhau dựa trên các chỉ số tiêu chuẩn trên các tập dữ liệu như COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Phân tích cân bằng hiệu suất
Mặc dù EfficientDet đạt được độ chính xác đáng khen ngợi với số phép tính lý thuyết ít hơn, Ultralytics YOLOv8 lại vượt trội hơn trong thực tế. GPU tốc độ suy luận. Ví dụ, YOLOv8x đạt được mức cao hơn một chút mAP (53,9) hơn EfficientDet-d7 (53,7) nhưng xử lý hình ảnh nhanh hơn đáng kể trên T4 GPU (14,37ms so với 128,07ms), tạo ra YOLOv8 Đây là sự lựa chọn hiển nhiên cho phân tích video thời gian thực.
Phương pháp luận đào tạo và Hệ sinh thái
Trải nghiệm của nhà phát triển là yếu tố then chốt khi lựa chọn kiến trúc máy học. Đây chính là điểm khác biệt thực sự giữa sự hỗ trợ của cộng đồng mã nguồn mở và các công cụ trong hệ sinh thái của các mô hình này.
EfficientDet phụ thuộc rất nhiều vào TensorFlow và các pipeline AutoML chuyên dụng. Mặc dù hiệu quả cho việc huấn luyện đám mây phân tán quy mô lớn, việc thiết lập môi trường, điều chỉnh các anchor và phân tích các tệp cấu hình phức tạp trong kho lưu trữ GitHub của EfficientDet có thể gây khó khăn cho các nhóm kỹ thuật làm việc nhanh chóng.
Ngược lại, Ultralytics YOLOv8 được xây dựng nguyên bản trên PyTorch , mang lại sự dễ sử dụng vượt trội. Các nhà phát triển có thể khởi tạo các vòng lặp huấn luyện phức tạp chỉ với một dòng lệnh duy nhất. Python mã hoặc CLI lệnh. Hơn nữa, yêu cầu về bộ nhớ của mô hình trong quá trình huấn luyện được tối ưu hóa rất nhiều; YOLOv8 Cho phép các nhà phát triển sử dụng GPU tiêu dùng tầm trung huấn luyện các mô hình mạnh mẽ mà không gặp phải lỗi hết bộ nhớ (OOM) thường xuyên xảy ra với các kiến trúc nặng về transformer.
Việc tích hợp liền mạch với Nền tảng Ultralytics đưa điều này tiến thêm một bước nữa, cung cấp giao diện không cần lập trình để chú thích dữ liệu, huấn luyện mô hình và triển khai đám mây chỉ bằng một cú nhấp chuột. Các tính năng như tự động điều chỉnh siêu tham số đảm bảo bạn luôn đạt được độ chính xác tốt nhất có thể cho các tập dữ liệu tùy chỉnh của mình.
Python Ví dụ mã: YOLOv8 Suy luận
Việc chạy một trình dò hiện đại sử dụng kho lưu trữ GitHub của Ultralytics vô cùng đơn giản:
from ultralytics import YOLO
# Initialize the YOLOv8 model natively in PyTorch
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 example dataset
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image URL
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes
inference_results[0].show()
Thế hệ tiếp theo: Nâng cấp lên Ultralytics YOLO26
Trong khi YOLOv8 Ultralytics YOLO26 vẫn là một mô hình sản xuất có khả năng cao, các nhà nghiên cứu và phát triển đang tìm kiếm hiệu năng AI tiên tiến nhất nên đánh giá sản phẩm này, dự kiến ra mắt vào tháng 1 năm 2026.
YOLO26 định nghĩa lại mô hình phát hiện đối tượng bằng cách giới thiệu thiết kế không sử dụng NMS Non-Maximum Suppression) từ đầu đến cuối . Bằng cách loại bỏ nhu cầu sử dụng NMS trong quá trình xử lý hậu kỳ—một nút thắt cổ chai đã tồn tại từ những năm đầu. YOLO với nhiều phiên bản khác nhau, sự biến thiên độ trễ hầu như được loại bỏ. Đây là một bước đột phá trong việc triển khai trên các thiết bị tiêu thụ điện năng thấp.
Hơn nữa, YOLO26 tích hợp một số cải tiến đột phá trong đào tạo:
- MuSGD Optimizer: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến, đây là sự kết hợp của... SGD và Muon đảm bảo quá trình huấn luyện cực kỳ ổn định và tốc độ hội tụ được đẩy nhanh đáng kể.
- Tốc độ suy luận CPU nhanh hơn tới 43%: Nhờ vào... NMS Nhờ việc loại bỏ các thành phần không cần thiết và tối ưu hóa mạnh mẽ kiến trúc xương sống, YOLO26 đạt được tốc độ chưa từng có trên... CPU -Chỉ dành cho các thiết bị biên mà không cần dựa vào các bộ xử lý thần kinh chuyên dụng.
- ProgLoss + STAL: Các hàm suy hao tiên tiến này mang lại bước tiến đáng kể về độ chính xác nhận dạng vật thể nhỏ, giúp YOLO26 trở nên không thể thiếu đối với ảnh chụp từ trên không và các cảm biến IoT chính xác.
- Loại bỏ DFL: Hiện tượng mất tiêu điểm phân phối (Distribution Focal Loss - DFL) đã được loại bỏ hoàn toàn để đơn giản hóa đáng kể quá trình xuất sang các định dạng như OpenVINO và... CoreML .
Các trường hợp sử dụng và Khuyến nghị
Việc lựa chọn giữa các kiến trúc này cuối cùng phụ thuộc vào các ràng buộc triển khai và yêu cầu hệ thống cũ của bạn.
- Hãy chọn Ultralytics YOLOv8 nếu: Bạn đang xây dựng các ứng dụng thị giác máy tính hiện đại, đa năng, đòi hỏi độ chính xác cao và thời gian thực. GPU Khả năng suy luận và trải nghiệm phát triển mượt mà. Hiệu năng mạnh mẽ trong các tác vụ phân loại, phân đoạn và phát hiện biến nó thành một công cụ đa năng mạnh mẽ cho phân tích bán lẻ, robot và hệ thống an ninh.
- Hãy chọn EfficientDet nếu: Bạn đang bị ràng buộc bởi hệ thống cũ. TensorFlow Các quy trình làm việc và mối quan tâm chính của bạn là giảm thiểu số lượng tham số và số phép tính lý thuyết (FLOPs), có lẽ là cho mục đích nghiên cứu hơn là triển khai công nghiệp thực tế theo thời gian thực.
- Hãy chọn Ultralytics YOLO26 nếu: Bạn đang bắt đầu một dự án mới và cần những giải pháp tốt nhất. Nó tích hợp giải pháp đầu cuối hoàn chỉnh từ đầu đến cuối. NMS Kiến trúc không phụ thuộc vào thư viện nào khiến nó trở thành lựa chọn tối ưu cho cả việc triển khai mạng biên siêu nhanh và xử lý đám mây nặng.
Nếu bạn đang tìm hiểu các framework có khả năng cao khác trong phạm vi này Ultralytics Trong hệ sinh thái này, bạn cũng có thể cân nhắc Ultralytics YOLO11 để có hiệu năng cân bằng cho hệ thống cũ hoặc RT-DETR để có cách tiếp cận dựa trên bộ chuyển đổi để phát hiện thời gian thực.