Chuyển đến nội dung

YOLOv6 -3.0 so với EfficientDet: So sánh kỹ thuật toàn diện

Việc lựa chọn kiến ​​trúc tối ưu cho các dự án thị giác máy tính đòi hỏi sự hiểu biết sâu sắc về sự đánh đổi giữa tốc độ, độ chính xác và tính khả thi triển khai. Trang so sánh này cung cấp phân tích chuyên sâu về hai mô hình phát hiện đối tượng khác nhau: YOLOv6 -3.0 và EfficientDet. Mặc dù cả hai mô hình đều đóng góp đáng kể cho lĩnh vực này, nhưng việc triển khai ở biên mạng hiện đại và tạo mẫu nhanh thường được hưởng lợi từ các khung công tác thống nhất hơn như Nền tảng Ultralytics .

Dưới đây là biểu đồ tương tác minh họa sự khác biệt về hiệu năng giữa các mô hình này, giúp bạn hiểu rõ hơn về độ trễ và độ chính xác tương ứng của chúng.

YOLOv6 -3.0: Thông lượng cấp công nghiệp

YOLOv6 -3.0 được Meituan thiết kế đặc biệt để hoạt động như một khung phát hiện đối tượng hiệu suất cao, một giai đoạn duy nhất, chuyên biệt cho các ứng dụng công nghiệp. Nó tập trung mạnh vào việc tối đa hóa thông lượng trên... GPU Phần cứng mạnh mẽ, biến nó thành ứng cử viên sáng giá cho các dây chuyền sản xuất tốc độ cao và phân tích video ngoại tuyến.

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
  • Tổ chức: Meituan
  • Ngày: 13/01/2023
  • Arxiv: 2301.05586
  • GitHub: meituan/ YOLOv6

Điểm nổi bật về kiến trúc

Cái YOLOv6 Kiến trúc -3.0 dựa trên mô-đun Ghép nối hai chiều (Bi-directional Concatenation - BiC) để cải thiện việc kết hợp các đặc trưng trên các quy mô khác nhau. Để đảm bảo tốc độ suy luận cao, nó tận dụng kiến ​​trúc xương sống EfficientRep, được tối ưu hóa cao cho... GPU thực thi. Hơn nữa, nó sử dụng chiến lược Huấn luyện Hỗ trợ Neo (AAT), kết hợp những lợi ích của cả bộ dò dựa trên neo và không dựa trên neo trong giai đoạn huấn luyện, đồng thời duy trì quy trình suy luận không dựa trên neo để giảm độ trễ.

Điểm mạnh và Điểm yếu

YOLOv6 -3.0 tỏa sáng trong môi trường cần sự chuyên dụng. GPU Phần cứng hiện có sẵn, cung cấp khả năng suy luận thời gian thực cực nhanh bằng cách sử dụng TensorRT Tuy nhiên, việc phụ thuộc quá nhiều vào các tối ưu hóa phần cứng cụ thể có thể dẫn đến hiệu suất không tối ưu. CPU -chỉ các thiết bị AI biên . Ngoài ra, mặc dù hỗ trợ một số lượng tử hóa, hệ sinh thái này thiếu sự đơn giản tổng thể được tìm thấy trong các hệ thống hiện đại. Ultralytics khuôn khổ.

Tìm hiểu thêm về YOLOv6

EfficientDet: Kiến trúc AutoML có khả năng mở rộng

Được phát triển bởi Google Trong nghiên cứu này, EfficientDet áp dụng một phương pháp hoàn toàn khác. Thay vì tự tay thiết kế mạng nơ-ron, các tác giả đã sử dụng Học máy tự động (AutoML) để thiết kế một kiến ​​trúc có khả năng mở rộng, cân bằng giữa các tham số, số phép tính FLOP và độ chính xác.

Điểm nổi bật về kiến trúc

EfficientDet giới thiệu Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN), cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng. Kết hợp với phương pháp mở rộng tỷ lệ phức hợp giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho tất cả các mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp, các mô hình EfficientDet có kích thước từ d0 rất nhỏ gọn đến d7 khổng lồ.

Điểm mạnh và Điểm yếu

EfficientDet rất hiệu quả về mặt tham số. Nó đạt được độ chính xác trung bình ( mAP ) cao với số lượng tham số tương đối ít so với các bộ phát hiện đối tượng cũ hơn. Tuy nhiên, kiến ​​trúc của nó vẫn còn khá lỗi thời. TensorFlow Điều này dẫn đến việc quản lý phụ thuộc phức tạp, chu kỳ huấn luyện chậm hơn và yêu cầu bộ nhớ cao hơn trong quá trình huấn luyện so với các hệ sinh thái được tối ưu hóa. PyTorch Hơn nữa, tốc độ suy luận của nó trên các GPU hiện đại chậm hơn đáng kể so với các triển khai hiện đại. YOLO kiến trúc.

Tìm hiểu thêm về EfficientDet

So sánh hiệu suất chi tiết

Bảng dưới đây so sánh các thông số kỹ thuật của YOLOv6 -3.0 và EfficientDet trên nhiều chỉ số khác nhau. Lưu ý cách YOLOv6 -3.0 chiếm ưu thế trong GPU tốc độ, trong khi EfficientDet có thể mở rộng lên mức cao hơn. mAP với cái giá phải trả là độ trễ đáng kể.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Độ trễ so với Thông lượng

Khi so sánh các mô hình, hãy nhớ rằng số phép tính FLOP và số lượng tham số không phải lúc nào cũng tương quan hoàn hảo với độ trễ thực tế. YOLOv6 -3.0 được tối ưu hóa cho TensorRT Đạt được tốc độ xử lý trong mili giây mặc dù có số lượng phép tính FLOP cao hơn so với các mẫu EfficientDet cấp thấp hơn.

Lợi thế Hệ sinh thái Ultralytics

Trong khi YOLOv6 -3.0 và EfficientDet phục vụ các phân khúc cụ thể, các dự án thị giác máy tính hiện đại đòi hỏi tính linh hoạt, dễ sử dụng và một hệ sinh thái được duy trì tốt. Đây chính là điểm mạnh thực sự của các mô hình Ultralytics YOLO .

Dễ sử dụng và Hiệu quả huấn luyện

Không giống như EfficientDet, vốn yêu cầu điều hướng qua các cấu trúc phức tạp. TensorFlow cấu hình, Ultralytics các mô hình được xây dựng dựa trên trực giác PyTorch nền tảng. Nền tảng Ultralytics cung cấp API được tối ưu hóa, giúp đơn giản hóa toàn bộ vòng đời học máy. Huấn luyện một Ultralytics mô hình này yêu cầu ít hơn đáng kể CUDA giúp tăng bộ nhớ, đẩy nhanh quá trình thử nghiệm và giảm chi phí tính toán.

Tính Đa Năng Vượt Trội

YOLOv6 -3.0 và EfficientDet chủ yếu được dùng để phát hiện đối tượng . Ngược lại, các thuật toán hiện đại Ultralytics Các kiến ​​trúc này vốn dĩ mang tính đa phương thức. Một giao diện duy nhất cho phép bạn huấn luyện các mô hình cho các tác vụ Phân đoạn đối tượng , Ước lượng tư thế , Phân loại hình ảnhHộp giới hạn định hướng (OBB) .

Giới thiệu Ultralytics YOLO26

Đối với các nhà phát triển đang tìm kiếm sự cân bằng hiệu năng tối ưu, Ultralytics YOLO26 đại diện cho một bước chuyển mình đột phá. Được phát hành vào tháng 1 năm 2026, sản phẩm này giới thiệu một số cải tiến mang tính đột phá vượt trội so với cả các sản phẩm trước đó. YOLOv6 và EfficientDet:

  • Thiết kế không cần NMS từ đầu đến cuối: YOLO26 loại bỏ hoàn toàn nhu cầu về Non-Maximum Suppression (NMS) một cách tự nhiên. NMS Xử lý hậu kỳ, giúp giảm đáng kể sự biến động độ trễ và đơn giản hóa logic triển khai trên các thiết bị biên.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM, bộ tối ưu hóa lai này đảm bảo quá trình huấn luyện ổn định và tốc độ hội tụ cực nhanh.
  • Suy luận CPU nhanh hơn tới 43%: Với việc loại bỏ tổn thất tiêu điểm phân tán (DFL), YOLO26 hiệu quả hơn đáng kể trên CPU và các thiết bị IoT công suất thấp so với các mô hình cũ.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến vượt bậc trong việc nhận dạng vật thể nhỏ, giúp YOLO26 trở nên lý tưởng cho các ứng dụng chụp ảnh từ máy bay không người lái và ảnh chụp trên không.

Tìm hiểu thêm về YOLO26

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLOv6 Và EfficientDet phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích hệ sinh thái của bạn.

Khi nào nên chọn YOLOv6

YOLOv6 là một lựa chọn tốt cho:

  • Triển khai có nhận thức về phần cứng công nghiệp: Các kịch bản trong đó thiết kế có nhận thức về phần cứng của mô hình và việc tái tham số hiệu quả cung cấp hiệu suất tối ưu trên phần cứng mục tiêu cụ thể.
  • Phát hiện nhanh chóng trong một giai đoạn duy nhất: Các ứng dụng ưu tiên tốc độ suy luận thô trên GPU Dùng để xử lý video thời gian thực trong môi trường được kiểm soát.
  • Tích hợp hệ sinh thái Meituan: Các nhóm hiện đang làm việc trong hệ sinh thái công nghệ và cơ sở hạ tầng triển khai của Meituan .

Khi nào nên chọn EfficientDet

EfficientDet được khuyến nghị sử dụng cho:

  • Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
  • Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
  • Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Ví dụ thực hiện: Huấn luyện YOLO26

Đoạn mã sau đây minh họa sự đơn giản của... Ultralytics hệ sinh thái. Việc huấn luyện một mô hình hiện đại dễ dàng như việc tải các trọng số và trỏ đến dữ liệu của bạn.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Các mô hình khác để xem xét

Nếu bạn đang tìm hiểu sâu hơn về các mô hình thị giác máy tính, hãy xem xét những lựa chọn thay thế sau:

  • YOLO11 : Phiên bản tiền nhiệm rất thành công của YOLO26, cung cấp khả năng đa nhiệm mạnh mẽ và sự hỗ trợ cộng đồng rộng lớn.
  • YOLOv10 : Phiên bản đầu tiên YOLO kiến trúc để giới thiệu NMS - Đào tạo miễn phí, mở đường cho việc phát hiện toàn diện hiện đại.
  • RT-DETR : Dành cho các trường hợp ưu tiên kiến ​​trúc dựa trên Transformer và cơ chế chú ý hơn so với mạng CNN truyền thống.

Kết luận

Trong khi YOLOv6 -3.0 cung cấp các tính năng công nghiệp tuyệt vời GPU Cả throughput và EfficientDet đều thể hiện tiềm năng của AutoML trong việc tạo ra các mạng có khả năng mở rộng và tiết kiệm tham số, tuy nhiên cả hai mô hình đều có những hạn chế về tính dễ triển khai và khả năng xử lý đa nhiệm hiện đại.

Đối với phần lớn các ứng dụng thực tế—từ triển khai thiết bị di động đến phân tích dựa trên đám mây— hệ sinh thái Ultralytics mang lại sự cân bằng hiệu suất vượt trội. Bằng cách áp dụng YOLO26 , các nhà phát triển có được quyền truy cập vào công nghệ tiên tiến nhất. NMS - Suy luận không cần tài nguyên, các hàm mất mát nâng cao dành cho các đối tượng nhỏ và một quy trình huấn luyện thống nhất, được ghi chép đầy đủ, giúp tăng tốc đáng kể quá trình từ nguyên mẫu đến sản phẩm hoàn chỉnh.


Bình luận