Chuyển đến nội dung

So sánh EfficientDet với YOLOv10 Phân tích sự tiến hóa của các mô hình phát hiện đối tượng

Trong lĩnh vực thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn kiến ​​trúc phát hiện đối tượng phù hợp là rất quan trọng để cân bằng độ chính xác, độ trễ và hiệu quả tính toán. Hướng dẫn kỹ thuật toàn diện này so sánh hai mô hình có ảnh hưởng lớn: Google EfficientDet của Google và YOLOv10 của Đại học Thanh Hoa. Mặc dù cả hai mô hình đều thể hiện những bước tiến đáng kể trong phát hiện đối tượng, nhưng chúng tiếp cận thiết kế kiến ​​trúc và tối ưu hóa mô hình từ những góc độ hoàn toàn khác nhau.

Chúng ta sẽ cùng tìm hiểu kiến ​​trúc cốt lõi của chúng, xem xét các tiêu chuẩn hiệu năng trên các tập dữ liệu chuẩn như COCO , và thảo luận về cách chúng tích hợp vào các quy trình học máy hiện đại, đặc biệt nhấn mạnh những lợi thế của hệ sinh thái Ultralytics toàn diện.

EfficientDet: Người tiên phong về mở rộng hợp chất

Được giới thiệu vào cuối năm 2019, EfficientDet đã thiết lập một chuẩn mực mới cho việc phát hiện đối tượng có khả năng mở rộng và độ chính xác cao bằng cách đưa ra một phương pháp tiếp cận có nguyên tắc để mở rộng kích thước mạng.

Những đổi mới và kiến ​​trúc quan trọng

EfficientDet được xây dựng trên nền tảng EfficientNet, tận dụng Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN) tiên tiến. Không giống như các Mạng Kim tự tháp Đặc trưng (FPN) truyền thống cộng các đặc trưng mà không phân biệt tầm quan trọng của chúng, BiFPN sử dụng trọng số có thể học được để kết hợp các đặc trưng đa tỷ lệ. Điều này cho phép mạng học hiệu quả các đặc trưng ở độ phân giải nào đóng góp nhiều nhất vào dự đoán cuối cùng. Hơn nữa, EfficientDet sử dụng phương pháp mở rộng tỷ lệ phức hợp, mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho nền tảng, mạng đặc trưng và mạng dự đoán hộp/lớp cùng một lúc.

Trong khi đó, EfficientDet vẫn là một lựa chọn đáng tin cậy cho các hệ thống cũ được tích hợp sâu với các hệ thống cũ hơn. TensorFlow Các pipeline này đòi hỏi lượng bộ nhớ đáng kể trong quá trình huấn luyện và dựa trên một hệ sinh thái cũ, có thể cồng kềnh so với các framework hiện đại, năng động.

Tìm hiểu thêm về EfficientDet

YOLOv10 : Cái NMS - Nhà sáng tạo tự do

Ra mắt vào giữa năm 2024, YOLOv10 đã thay đổi căn bản mô hình phát hiện đối tượng thời gian thực bằng cách loại bỏ nhu cầu về phương pháp loại bỏ cực đại cục bộ (Non-Maximum Suppression) ( NMS ) trong quá trình xử lý hậu kỳ, giúp giảm đáng kể độ trễ suy luận .

Những đổi mới và kiến ​​trúc quan trọng

YOLOv10 giới thiệu một chiến lược phân công kép nhất quán cho NMS - huấn luyện miễn phí. Bằng cách sử dụng cả gán nhãn một-nhiều và một-một trong quá trình huấn luyện, mạng học cách tạo ra các hộp giới hạn khớp duy nhất mà không cần dựa vào NMS Để lọc bỏ các bản sao. Thiết kế mô hình toàn diện hướng đến hiệu quả và độ chính xác này giúp giảm thiểu sự dư thừa trong tính toán, biến nó trở thành ứng cử viên xuất sắc cho điện toán biên và các ứng dụng truyền phát video độ trễ thấp. Nó tích hợp liền mạch vào... Ultralytics hệ sinh thái, cho phép các nhà phát triển truy cập vào một môi trường cực kỳ đơn giản. Python API.

Tìm hiểu thêm về YOLOv10

NMS -Tác động miễn phí

Bằng cách loại bỏ NMS bước chân, YOLOv10 Đảm bảo tốc độ suy luận ổn định bất kể có bao nhiêu đối tượng được phát hiện trong một cảnh, loại bỏ hiện tượng tăng đột biến độ trễ thường thấy trong các ứng dụng thị giác máy tính có nhiều đối tượng.

So sánh hiệu năng: Độ chính xác, tốc độ và hiệu quả

Khi triển khai các mô hình trong các tình huống thực tế, các nhà phát triển phải cân nhắc giữa độ chính xác trung bình ( mAP ) với số lượng tham số và số phép toán (FLOPs). Bảng dưới đây trình bày chi tiết các chỉ số này trên các biến thể mở rộng của cả hai mô hình.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Lưu ý: Biến thể YOLOv10n yêu cầu ít tham số hơn đáng kể (2,3 triệu) và đạt được hiệu suất vượt trội hơn hẳn. TensorRT tốc độ (1,56ms) so với các phiên bản EfficientDet trước đó, giúp nó khả thi hơn nhiều cho việc suy luận thời gian thực trong môi trường sản xuất.

Tại sao nên chọn Ultralytics Để triển khai mô hình?

Mặc dù cả hai mô hình đều có ý nghĩa lịch sử và cấu trúc, việc tích hợp chúng vào các quy trình hiện đại có thể là một thách thức. Đây là điểm mạnh của Nền tảng Ultralytics . Bằng cách cung cấp một hệ sinh thái thống nhất, Ultralytics Giúp đơn giản hóa toàn bộ vòng đời – từ chú thích dữ liệu đến triển khai.

  1. Dễ sử dụng: Ultralytics Python Gói phần mềm này cung cấp một giao diện duy nhất để huấn luyện, xác thực và xuất mô hình , thay thế hàng trăm dòng mã lặp đi lặp lại bằng các lệnh ngắn gọn.
  2. Hệ sinh thái và tính linh hoạt: Mặc dù EfficientDet chuyên biệt hóa cao cho việc phát hiện, Ultralytics YOLO Các mô hình này tự nhiên mở rộng sang Phân đoạn đối tượng , Ước tính tư thế , Hộp giới hạn định hướng (OBB) và Phân loại.
  3. Hiệu quả đào tạo: Tận dụng các kỹ thuật tiên tiến như phân nhóm tự động và đào tạo phân tán, Ultralytics Các mô hình được huấn luyện nhanh hơn và tiêu thụ ít năng lượng hơn đáng kể. CUDA bộ nhớ lớn hơn máy biến áp công suất lớn hoặc máy biến áp đa nhánh cũ hơn TF kiến trúc.

Ví dụ mã: Huấn luyện YOLOv10

Triển khai YOLOv10 với Ultralytics Điều này vô cùng đơn giản. Đoạn mã sau đây minh họa cách khởi tạo, huấn luyện và đánh giá một mô hình. YOLOv10 mạng hoàn toàn nằm trong Python API.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Evaluate the model on the validation set
metrics = model.val()

# Export the model to ONNX for production deployment
model.export(format="onnx")

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa EfficientDet và YOLOv10 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn EfficientDet

EfficientDet là một lựa chọn mạnh mẽ cho:

  • Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
  • Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
  • Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.

Khi nào nên chọn YOLOv10

YOLOv10 được khuyến nghị cho:

  • NMS - Phát hiện thời gian thực không cần hệ thống quản lý truy cập (NMS): Các ứng dụng được hưởng lợi từ khả năng phát hiện toàn diện mà không cần hệ thống loại bỏ truy cập không tối đa (Non-Maximum Suppression), giúp giảm độ phức tạp khi triển khai.
  • Cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng tốt giữa tốc độ suy luận và độ chính xác phát hiện trên nhiều quy mô mô hình khác nhau.
  • Ứng dụng độ trễ ổn định: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như robot hoặc hệ thống tự hành.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Tương lai đã đến: Hãy bước vào! Ultralytics YOLO26

Trong khi YOLOv10 giới thiệu cuộc cách mạng NMS Với thiết kế không giới hạn, công nghệ đã phát triển. Được phát hành vào tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho công nghệ tiên tiến nhất hiện nay trong lĩnh vực trí tuệ nhân tạo thị giác. Nó kết hợp những khía cạnh tốt nhất của các kiến ​​trúc trước đó—như khả năng đa nhiệm của YOLO11 và độ ổn định RT-DETR —thành một hệ thống mạnh mẽ, được tối ưu hóa cao.

Lợi thế của YOLO26

Nếu bạn đang bắt đầu một dự án mới, chúng tôi đặc biệt khuyên bạn nên nâng cấp lên YOLO26 . Nó cung cấp tính linh hoạt và dễ sử dụng vượt trội thông qua Nền tảng Ultralytics .

Những bước đột phá quan trọng tại YOLO26:

  • Hệ NMS từ đầu đến cuối - Thiết kế miễn phí: Xây dựng dựa trên nền tảng đã được thiết lập bởi YOLOv10 YOLO26 là giải pháp end-to-end toàn diện, đơn giản hóa logic triển khai xuống mức tối thiểu.
  • Suy luận CPU nhanh hơn tới 43%: Với việc loại bỏ Distribution Focal Loss (DFL), YOLO26 giảm đáng kể chi phí tính toán, trở thành "ông vua" không thể tranh cãi dành cho các thiết bị AI biên .
  • Trình tối ưu hóa MuSGD: YOLO26 kế thừa những cải tiến từ quá trình huấn luyện Mô hình Ngôn ngữ Lớn (LLM). Bằng cách kết hợp tính ổn định của SGD Với tốc độ của Muon, nó hội tụ nhanh hơn và đáng tin cậy hơn bất kỳ công nghệ tiền nhiệm nào.
  • ProgLoss + STAL: Các công thức suy hao vượt trội giải quyết hiệu quả các vấn đề tồn đọng lâu nay trong việc phát hiện vật thể nhỏ, một lĩnh vực mà EfficientDet thường gặp khó khăn.

Tìm hiểu thêm về YOLO26

Kết luận: Phù hợp hóa mô hình với các trường hợp sử dụng

Việc lựa chọn giữa các mạng này cuối cùng phụ thuộc vào các hạn chế triển khai của bạn:

  • EfficientDet vẫn là một chủ đề được giới học thuật quan tâm liên quan đến khả năng mở rộng phức hợp và phù hợp với các nhà nghiên cứu đang duy trì các hệ thống TensorFlow hiện có, nơi kích thước trọng lượng mô hình (trên ổ đĩa) quan trọng hơn tốc độ thực thi.
  • YOLOv10 cực kỳ hiệu quả cho các ứng dụng đòi hỏi độ trễ cực thấp, chẳng hạn như theo dõi đa đối tượng tốc độ cao và giám sát giao thông, nhờ vào công nghệ tiên phong của nó. NMS - Kiến trúc tự do.
  • Tuy nhiên, YOLO26 là sự lựa chọn tối ưu nhất cho các dự án thị giác máy tính hiện đại, mang lại sự cân bằng hiệu năng cao nhất giữa độ chính xác, dung lượng bộ nhớ tối thiểu và khả năng đa nhiệm linh hoạt được hỗ trợ bởi nền tảng mạnh mẽ. Ultralytics hệ sinh thái.

Bình luận