So sánh EfficientDet với... YOLOv10 Sự tiến hóa của phát hiện đối tượng thời gian thực

Lĩnh vực thị giác máy tính đã thay đổi đáng kể kể từ khi ra mắt. Google EfficientDet của năm 2019 và của Đại học Thanh Hoa YOLOv10 Năm 2024. Đối với các nhà phát triển và nhà nghiên cứu, việc hiểu được lộ trình từ việc mở rộng quy mô phức tạp đến các kiến trúc đầu cuối được tinh gọn là rất quan trọng để lựa chọn công cụ phù hợp cho công việc. Phân tích này so sánh độ chính xác truyền thống của EfficientDet với sự đổi mới về độ trễ thấp của YOLOv10 , đồng thời nêu bật cách các giải pháp hiện đại như Ultralytics YOLO26 đang thiết lập các tiêu chuẩn mới cho môi trường sản xuất.

EfficientDet: Di sản của sự tăng trưởng theo cấp số nhân

Được phát hành bởi Google Nhóm nghiên cứu Brain, với dự án EfficientDet, đã đánh dấu một cột mốc quan trọng trong việc tối ưu hóa hiệu quả mạng nơ-ron. Dự án này đã giới thiệu khái niệm Mở rộng Tỷ lệ Kết hợp (Compound Scaling ), cho phép mở rộng đồng đều độ phân giải, độ sâu và độ rộng của cấu trúc mạng, thay vì chỉ điều chỉnh một chiều duy nhất.

Thông số kỹ thuật của EfficientDet:

Tác giả: Mingxing Tan, Ruoming Pang, và Quoc V. Le
Tổ chức:Google Research
Ngày: 2019-11-20
Arxiv:EfficientDet: detect Đối tượng Hiệu quả và Có khả năng Mở rộng
GitHub:google/automl

Cốt lõi của EfficientDet là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN) . Không giống như các FPN truyền thống cộng các đặc trưng từ các thang đo khác nhau, BiFPN cho phép kết hợp các đặc trưng phức tạp, có trọng số, giúp mô hình học được tầm quan trọng của các đặc trưng đầu vào khác nhau. Mặc dù kiến trúc này đã đạt được Độ chính xác trung bình ( mAP ) hàng đầu trên tập dữ liệu COCO vào thời điểm đó, nhưng các kết nối phức tạp giữa các lớp BiFPN dẫn đến chi phí tính toán đáng kể, khiến quá trình suy luận—đặc biệt là trên các thiết bị biên—chậm hơn so với các kiến trúc hiện đại.

YOLOv10: Cuộc cách mạng End-to-End

YOLOv10 Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, giải quyết được nút thắt cổ chai chính của các giải pháp trước đây. YOLO các phiên bản: Ức chế không tối đa ( NMS ) . Bằng cách áp dụng chiến lược phân công kép nhất quán trong quá trình huấn luyện, YOLOv10 học cách dự đoán một hộp giới hạn tối ưu duy nhất cho mỗi đối tượng, về cơ bản trở thành một NMS -Công cụ dò tìm miễn phí, hoạt động từ đầu đến cuối.

YOLOv10 Thông số kỹ thuật:

Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức:Đại học Thanh Hoa
Ngày: 2024-05-23
Arxiv:YOLOv10: Real-Time End-to-End Object Detection
GitHub:THU-MIG/yolov10

Sự thay đổi về kiến trúc này cho phép giảm đáng kể độ trễ suy luận . Mô hình cũng giới thiệu một thiết kế toàn diện hướng đến hiệu quả và độ chính xác, sử dụng các phép tích chập nhân lớn và cơ chế tự chú ý một phần để cải thiện hiệu suất mà không gây ra hiện tượng phình to tham số như ở các mô hình cũ.

Tìm hiểu thêm về YOLOv10

So sánh Hiệu suất: Tốc độ so với Độ chính xác

Khoảng cách hiệu năng giữa hai thế hệ mô hình này rất rõ rệt, đặc biệt là về tốc độ suy luận. Trong khi EfficientDet-d7 đạt độ chính xác cao, nó lại phải trả giá bằng độ trễ rất lớn (trên 100ms), trong khi đó YOLOv10 Các biến thể khác đạt được độ chính xác tương tự hoặc tốt hơn trong vòng vài mili giây.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

Phân tích kiến trúc

Xử lý hậu kỳ: EfficientDet phụ thuộc rất nhiều vào... NMS để lọc các hộp chồng chéo. Trong các cảnh phức tạp, bước xử lý hậu kỳ này trở nên rất quan trọng. CPU tắc nghẽn, làm tăng tổng độ trễ bất kể GPU tốc độ. YOLOv10 Thiết kế không cần NMS của 's loại bỏ hoàn toàn bước này.
Mức sử dụng bộ nhớ: EfficientDet, đặc biệt là các hệ số nhân cao hơn như d7, tiêu tốn một lượng VRAM đáng kể do cấu trúc BiFPN. YOLOv10 Được tối ưu hóa để giảm thiểu dung lượng bộ nhớ sử dụng, giúp nó phù hợp hơn cho các ứng dụng AI biên .
Tối ưu hóa: EfficientDet được xây dựng trên TensorFlow và có thể phức tạp khi xuất sang các định dạng như ONNX hoặc TensorRT so với phiên bản gốc. PyTorch Việc triển khai các nguyên tắc YOLO hiện đại.

Lợi thế Hệ sinh thái Ultralytics

Trong khi YOLOv10 Cung cấp những tiến bộ kiến trúc ấn tượng, việc tận dụng nó trong hệ sinh thái Ultralytics sẽ khuếch đại tiện ích của nó. Các nhà phát triển thường gặp khó khăn với sự phân mảnh của các kho lưu trữ học thuật. Ultralytics Giải quyết vấn đề này bằng cách thống nhất các mô hình dưới một hệ thống duy nhất, được bảo trì tốt. Python bưu kiện.

Tại sao nên chọn Ultralytics Hệ sinh thái?

Dễ sử dụng: Chuyển đổi giữa YOLOv8 , YOLOv10 , YOLO11 và YOLO26 chỉ với một dòng mã.
Hiệu quả huấn luyện: Các siêu tham số được tinh chỉnh trước và khả năng xử lý kích thước lô tự động đảm bảo sử dụng tài nguyên tối ưu.
Sẵn sàng triển khai: Xuất chỉ với một cú nhấp chuột. TFLite , CoreML , OpenVINO , Và ONNX .
Nền tảng Ultralytics : Quản lý tập dữ liệu một cách liền mạch, huấn luyện trên đám mây và triển khai mô hình thông qua Nền tảng Ultralytics .

Ví dụ mã

Thực hiện suy luận với Ultralytics Được thiết kế theo phong cách Python và đơn giản. Dưới đây là cách bạn có thể tải một tệp tin... YOLOv10 Mô hình và chạy dự đoán:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image from the internet
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Khuyến nghị sản xuất: Nâng cấp lên YOLO26

Trong khi EfficientDet đóng vai trò là một chuẩn mực lịch sử quan trọng và YOLOv10 giới thiệu NMS -Không phụ thuộc vào mô hình, mẫu Ultralytics YOLO26 đại diện cho đỉnh cao của sự tiến hóa này trong lĩnh vực sản xuất.

Ra mắt vào tháng 1 năm 2026, YOLO26 được xây dựng dựa trên nền tảng của... NMS - bước đột phá miễn phí của YOLOv10 Nhưng nó được tinh chỉnh để đảm bảo độ bền vững trong thực tế. Nó tích hợp tính năng loại bỏ suy hao tiêu điểm phân tán (Distribution Focal Loss - DFL) , giúp đơn giản hóa đồ thị mô hình để dễ dàng xuất khẩu và tương thích tốt hơn với các thiết bị biên công suất thấp.

Hơn nữa, YOLO26 tích hợp trình tối ưu hóa MuSGD , một sự kết hợp giữa... SGD và Muon (lấy cảm hứng từ những cải tiến trong huấn luyện LLM), đảm bảo sự hội tụ nhanh hơn và quá trình huấn luyện ổn định. Với các tối ưu hóa như ProgLoss và STAL (Shape-aware Task Alignment Loss), YOLO26 cung cấp khả năng phát hiện vật thể nhỏ vượt trội và nhanh hơn tới 43% trên CPU so với các thế hệ trước.

Tìm hiểu thêm về YOLO26

Các trường hợp sử dụng thực tế

Việc lựa chọn mô hình phù hợp phụ thuộc vào những yêu cầu cụ thể của bạn:

EfficientDet: Phù hợp nhất cho nghiên cứu học thuật , nơi cần nghiên cứu về khả năng mở rộng phức hợp hoặc kiến trúc BiFPN. Nó cũng được tìm thấy trong các hệ thống cũ, nơi chi phí chuyển đổi vượt quá lợi ích về hiệu năng của các mô hình mới hơn.
YOLOv10 / YOLO26: Sự lựa chọn lý tưởng cho ứng dụng thời gian thực.
- Robot học: NMS Thiết kế không có bộ nhớ đệm giúp giảm độ trễ, điều này rất quan trọng đối với việc điều hướng và tránh chướng ngại vật.
- Giám sát lưu lượng: Tốc độ xử lý cao cho phép xử lý nhiều luồng video trên một thiết bị duy nhất. GPU Sử dụng tính năng theo dõi đối tượng .
- Ứng dụng di động: Số lượng tham số và mức sử dụng bộ nhớ thấp hơn khiến các mô hình này trở nên hoàn hảo để triển khai trên các thiết bị di động. iOS Và Android thiết bị.

Đối với các nhà phát triển đang tìm kiếm sự cân bằng tốt nhất giữa tốc độ, độ chính xác và tính dễ triển khai, việc chuyển sang Ultralytics YOLO26 hoặc YOLO11 là con đường được khuyến nghị.