Chuyển đến nội dung

YOLO11 So sánh kỹ thuật toàn diện giữa EfficientDet và EfficientDet

Việc lựa chọn mạng nơ-ron tối ưu cho các dự án thị giác máy tính đòi hỏi sự hiểu biết sâu sắc về các kiến ​​trúc hiện có. Hướng dẫn này cung cấp sự so sánh kỹ thuật chuyên sâu giữa Ultralytics YOLO11 và Google EfficientDet của 's. Chúng ta sẽ cùng tìm hiểu những khác biệt về kiến ​​trúc, các chỉ số hiệu suất , hiệu quả huấn luyện và các kịch bản triển khai lý tưởng để giúp bạn đưa ra quyết định sáng suốt cho khối lượng công việc học máy của mình.

Thông tin nền và thông số kỹ thuật của mô hình

Cả hai mô hình đều đã tác động đáng kể đến lĩnh vực học sâu , mặc dù chúng xuất phát từ các triết lý thiết kế và thời kỳ phát triển trí tuệ nhân tạo khác nhau.

YOLO11 Chi tiết

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 27/09/2024
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu yolo11 ultralytics

Tìm hiểu thêm về YOLO11

Chi tiết EfficientDet

Tác giả: Mingxing Tan, Ruoming Pang, và Quốc V. Lê
Tổ chức: Google
Ngày: 20/11/2019
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: google
Tài liệu: google

Tìm hiểu thêm về EfficientDet

Lợi thế hệ sinh thái

Khi làm việc với các mô hình thị giác máy tính, hệ sinh thái xung quanh cũng quan trọng không kém gì chính mô hình đó. Hệ sinh thái Ultralytics cung cấp trải nghiệm phát triển vượt trội, với tài liệu đầy đủ, hỗ trợ cộng đồng tích cực và khả năng xuất dữ liệu liền mạch sang các định dạng như ONNXTensorRT .

Đổi mới Kiến trúc

EfficientDet: BiFPN và mở rộng quy mô phức hợp

Được giới thiệu vào cuối năm 2019, EfficientDet hướng đến mục tiêu tối đa hóa độ chính xác đồng thời giảm thiểu chi phí tính toán. Nó đạt được điều này chủ yếu thông qua hai cơ chế. Thứ nhất, nó sử dụng kiến ​​trúc xương sống EfficientNet giúp mở rộng độ sâu, chiều rộng và độ phân giải một cách nhất quán. Thứ hai, nó giới thiệu Mạng kim tự tháp đặc trưng hai chiều (BiFPN), cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng.

Mặc dù rất hiệu quả vào thời điểm đó, sự phụ thuộc của EfficientDet vào... TensorFlow Thư viện AutoML có thể khiến nó trở nên cứng nhắc. Các nhà nghiên cứu thường thấy việc cắt tỉa mô hình và tùy chỉnh sửa đổi khó khăn hơn so với các phương pháp hiện đại, có tính mô-đun cao. PyTorch các khuôn khổ dựa trên.

YOLO11 Khả năng trích xuất tính năng được nâng cao và tính linh hoạt

YOLO11 Nó đại diện cho một bước tiến đáng kể trong kiến ​​trúc phát hiện đối tượng . Nó được xây dựng dựa trên những thành công của các thế hệ trước, giới thiệu các khối C3k2 được tinh chỉnh và mô-đun Spatial Pyramid Pooling được cải tiến. Những cải tiến này dẫn đến khả năng trích xuất đặc trưng vượt trội, cho phép YOLO11 Để ghi lại những họa tiết hình ảnh phức tạp với độ rõ nét vượt trội.

Một lợi thế lớn của YOLO11 Đó là tính linh hoạt của nó. Mặc dù EfficientDet là một mô hình phát hiện đối tượng thuần túy, YOLO11 Hỗ trợ sẵn các chức năng phân đoạn đối tượng , phân loại hình ảnh , ước lượng tư thếhộp giới hạn định hướng (OBB) . Hơn nữa, YOLO11 Nó sở hữu yêu cầu bộ nhớ cực thấp trong cả quá trình huấn luyện và suy luận, khiến nó vượt trội hơn hẳn so với các mô hình cũ và các bộ chuyển đổi hình ảnh cồng kềnh khi triển khai trong môi trường AI biên có tài nguyên hạn chế.

Hiệu năng và điểm chuẩn

Sự cân bằng giữa độ chính xác, được đo bằng Độ chính xác trung bình ( mAP ) , và tốc độ suy luận là yếu tố quyết định quan trọng đối với các triển khai thực tế. Bảng dưới đây minh họa hiệu năng thô của cả hai nhóm mô hình trên tập dữ liệu COCO tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Như hình minh họa, YOLO11 Đạt được sự cân bằng hiệu suất rất thuận lợi. YOLO11x đạt độ chính xác tổng thể cao nhất (54,7). mAP ), trong khi nhỏ hơn YOLO11 Các biến thể chiếm ưu thế tuyệt đối trong GPU tốc độ suy luận (thấp nhất là 1,5ms trên T4 sử dụng) TensorRT ).

Hiệu quả huấn luyện và hệ sinh thái

Một trong những đặc điểm xác định của Ultralytics Ưu điểm của các mô hình này là tính dễ sử dụng . Việc huấn luyện một mô hình EfficientDet thường đòi hỏi phải điều hướng qua các giao diện phức tạp. TensorFlow cấu hình đồ thị và quản lý các chuỗi phụ thuộc phức tạp. Ngược lại hoàn toàn, YOLO11 Được xây dựng trên nền tảng PyTorch sạch sẽ và hiện đại.

Hệ sinh thái được duy trì tốt này có nghĩa là các nhà phát triển có thể cài đặt gói, tải mô hình đã được huấn luyện sẵn và bắt đầu huấn luyện trên tập dữ liệu tùy chỉnh chỉ với một vài dòng mã.

Ví dụ mã Python

Dưới đây là một ví dụ hoàn chỉnh có thể chạy được, minh họa sự đơn giản của... Ultralytics API. Tập lệnh này tải xuống một mô hình đã được huấn luyện trước. YOLO11 Mô hình, huấn luyện nó và chạy một dự đoán nhanh.

from ultralytics import YOLO

# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")

# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the output bounding boxes
prediction[0].show()

Hướng tới tương lai: Lợi thế của YOLO26

Trong khi YOLO11 Với sức mạnh vượt trội, các nhóm bắt đầu các dự án mới hoàn toàn nên cân nhắc kỹ Ultralytics YOLO26 , được phát hành vào tháng 1 năm 2026. YOLO26 đại diện cho một bước đột phá về sự đơn giản trong triển khai và hiệu năng tại biên.

Các cải tiến quan trọng của YOLO26 bao gồm:

  • Thiết kế không có NMS từ đầu đến cuối: Bằng cách loại bỏ hiện tượng triệt tiêu cực đại không tối đa (Non-Maximum Suppression) NMS Trong quá trình xử lý hậu kỳ, YOLO26 đảm bảo độ trễ cực thấp và ổn định, điều rất quan trọng đối với robot tốc độ cao và lái xe tự hành.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Đối với các hệ thống không có GPU chuyên dụng, YOLO26 được tối ưu hóa đặc biệt để tối đa hóa hiệu suất trên các bộ xử lý tiêu chuẩn.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ Kimi K2 của Moonshot AI, bộ tối ưu hóa lai này mang lại sự ổn định trong quá trình huấn luyện LLM cho thị giác máy tính, cho phép hội tụ nhanh hơn.
  • ProgLoss + STAL: Các hàm mất mát được cải tiến này giúp tăng cường đáng kể khả năng nhận diện các vật thể nhỏ, vốn thường là điểm yếu trong phân tích ảnh vệ tinh và ảnh chụp từ máy bay không người lái.
  • Loại bỏ DFL: Việc loại bỏ Suy hao tiêu điểm phân tán giúp đơn giản hóa quá trình xuất mô hình sang các thiết bị biên.

Các mô hình thay thế để khám phá

Nếu dự án của bạn có những yêu cầu rất cụ thể, bạn cũng có thể muốn so sánh hiệu năng của mô hình RT-DETR để phát hiện dựa trên bộ chuyển đổi, hoặc YOLOv8 được sử dụng rộng rãi, vốn vẫn là một công cụ thiết yếu trong nhiều triển khai doanh nghiệp truyền thống.

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLO11 Và EfficientDet phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích hệ sinh thái của bạn.

Khi nào nên chọn YOLO11

YOLO11 là một lựa chọn tốt cho:

  • Triển khai tại biên môi trường sản xuất: Các ứng dụng thương mại trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson , nơi độ tin cậy và bảo trì thường xuyên là yếu tố tối quan trọng.
  • Ứng dụng thị giác đa nhiệm: Các dự án yêu cầu phát hiện , phân đoạn , ước lượng tư thếOBB trong một khung thống nhất duy nhất.
  • Tạo mẫu và triển khai nhanh chóng: Các nhóm cần chuyển nhanh từ thu thập dữ liệu sang sản xuất bằng cách sử dụng API Python Ultralytics được tối ưu hóa.

Khi nào nên chọn EfficientDet

EfficientDet được khuyến nghị sử dụng cho:

  • Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
  • Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
  • Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Kết luận

EfficientDet là một kiến ​​trúc tiên phong đã chứng minh tính khả thi của việc mở rộng quy mô phức hợp trong phát hiện đối tượng. Tuy nhiên, tốc độ phát triển nhanh chóng của nghiên cứu AI đã tạo ra những mô hình mạnh mẽ hơn, dễ tích hợp hơn và chạy nhanh hơn.

Với khả năng đa nhiệm mạnh mẽ, đáng kinh ngạc! GPU Với tốc độ suy luận nhanh chóng và API thân thiện với nhà phát triển nhất trong ngành, YOLO11 rõ ràng là lựa chọn thắng thế cho các hệ thống xử lý hình ảnh hiện đại. Đối với những ai hướng đến công nghệ tiên tiến nhất—đặc biệt là các triển khai ưu tiên thiết bị biên—nâng cấp lên YOLO26 sẽ mang đến sự kết hợp tối ưu giữa... NMS - Tốc độ nhanh chóng và độ chính xác vượt trội.


Bình luận