YOLOv6 -3.0 so với EfficientDet: So sánh kỹ thuật toàn diện
Việc lựa chọn kiến trúc tối ưu cho các dự án thị giác máy tính đòi hỏi sự hiểu biết sâu sắc về các đánh đổi giữa tốc độ, độ chính xác và khả năng triển khai. Trang so sánh này cung cấp một phân tích chuyên sâu về hai mô hình detect đối tượng khác biệt: YOLOv6-3.0 và EfficientDet. Mặc dù cả hai mô hình đều đã đóng góp đáng kể vào lĩnh vực này, nhưng các triển khai biên hiện đại và tạo mẫu nhanh thường được hưởng lợi từ các khung công tác thống nhất hơn như Nền tảng Ultralytics.
Dưới đây là biểu đồ tương tác trực quan hóa sự khác biệt về hiệu suất giữa các mô hình này để giúp bạn hiểu rõ hồ sơ độ trễ và độ chính xác tương ứng của chúng.
YOLOv6 -3.0: Thông lượng cấp công nghiệp
YOLOv6 -3.0 được Meituan thiết kế đặc biệt để hoạt động như một khung phát hiện đối tượng hiệu suất cao, một giai đoạn duy nhất, chuyên biệt cho các ứng dụng công nghiệp. Nó tập trung mạnh vào việc tối đa hóa thông lượng trên... GPU Phần cứng mạnh mẽ, biến nó thành ứng cử viên sáng giá cho các dây chuyền sản xuất tốc độ cao và phân tích video ngoại tuyến.
- Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
- Tổ chức: Meituan
- Ngày: 13-01-2023
- Arxiv: 2301.05586
- GitHub: meituan/ YOLOv6
Điểm nổi bật về kiến trúc
Cái YOLOv6 Kiến trúc -3.0 dựa trên mô-đun Ghép nối hai chiều (Bi-directional Concatenation - BiC) để cải thiện việc kết hợp các đặc trưng trên các quy mô khác nhau. Để đảm bảo tốc độ suy luận cao, nó tận dụng kiến trúc xương sống EfficientRep, được tối ưu hóa cao cho... GPU thực thi. Hơn nữa, nó sử dụng chiến lược Huấn luyện Hỗ trợ Neo (AAT), kết hợp những lợi ích của cả bộ dò dựa trên neo và không dựa trên neo trong giai đoạn huấn luyện, đồng thời duy trì quy trình suy luận không dựa trên neo để giảm độ trễ.
Điểm mạnh và Điểm yếu
YOLOv6 -3.0 tỏa sáng trong môi trường cần sự chuyên dụng. GPU Phần cứng hiện có sẵn, cung cấp khả năng suy luận thời gian thực cực nhanh bằng cách sử dụng TensorRT Tuy nhiên, việc phụ thuộc quá nhiều vào các tối ưu hóa phần cứng cụ thể có thể dẫn đến hiệu suất không tối ưu. CPU -chỉ các thiết bị AI biên . Ngoài ra, mặc dù hỗ trợ một số lượng tử hóa, hệ sinh thái này thiếu sự đơn giản tổng thể được tìm thấy trong các hệ thống hiện đại. Ultralytics khuôn khổ.
EfficientDet: Kiến trúc AutoML có khả năng mở rộng
Được phát triển bởi Google Research, EfficientDet áp dụng một cách tiếp cận khác biệt cơ bản. Thay vì thiết kế mạng thủ công, các tác giả đã sử dụng Học máy tự động (AutoML) để thiết kế một kiến trúc có thể mở rộng, cân bằng giữa các tham số, FLOPs và độ chính xác.
- Tác giả: Mingxing Tan, Ruoming Pang, và Quốc V. Lê
- Tổ chức: Google Brain
- Ngày: 20/11/2019
- Arxiv: 1911.09070
- GitHub: google /automl
Điểm nổi bật về kiến trúc
EfficientDet giới thiệu Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN), cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng. Kết hợp với phương pháp mở rộng tỷ lệ phức hợp giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho tất cả các mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp, các mô hình EfficientDet có kích thước từ d0 rất nhỏ gọn đến d7 khổng lồ.
Điểm mạnh và Điểm yếu
EfficientDet rất hiệu quả về mặt tham số. Nó đạt được độ chính xác trung bình ( mAP ) cao với số lượng tham số tương đối ít so với các bộ phát hiện đối tượng cũ hơn. Tuy nhiên, kiến trúc của nó vẫn còn khá lỗi thời. TensorFlow Điều này dẫn đến việc quản lý phụ thuộc phức tạp, chu kỳ huấn luyện chậm hơn và yêu cầu bộ nhớ cao hơn trong quá trình huấn luyện so với các hệ sinh thái được tối ưu hóa. PyTorch Hơn nữa, tốc độ suy luận của nó trên các GPU hiện đại chậm hơn đáng kể so với các triển khai hiện đại. YOLO kiến trúc.
So sánh hiệu suất chi tiết
Bảng dưới đây so sánh các thông số kỹ thuật của YOLOv6 -3.0 và EfficientDet trên nhiều chỉ số khác nhau. Lưu ý cách YOLOv6 -3.0 chiếm ưu thế trong GPU tốc độ, trong khi EfficientDet có thể mở rộng lên mức cao hơn. mAP với cái giá phải trả là độ trễ đáng kể.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Độ trễ so với Thông lượng
Khi so sánh các mô hình, hãy nhớ rằng số phép tính FLOP và số lượng tham số không phải lúc nào cũng tương quan hoàn hảo với độ trễ thực tế. YOLOv6 -3.0 được tối ưu hóa cho TensorRT Đạt được tốc độ xử lý trong mili giây mặc dù có số lượng phép tính FLOP cao hơn so với các mẫu EfficientDet cấp thấp hơn.
Lợi thế Hệ sinh thái Ultralytics
Trong khi YOLOv6 -3.0 và EfficientDet phục vụ các phân khúc cụ thể, các dự án thị giác máy tính hiện đại đòi hỏi tính linh hoạt, dễ sử dụng và một hệ sinh thái được duy trì tốt. Đây chính là điểm mạnh thực sự của các mô hình Ultralytics YOLO .
Dễ sử dụng và Hiệu quả huấn luyện
Không giống như EfficientDet, vốn yêu cầu điều hướng qua các cấu trúc phức tạp. TensorFlow cấu hình, Ultralytics các mô hình được xây dựng dựa trên trực giác PyTorch nền tảng. Nền tảng Ultralytics cung cấp API được tối ưu hóa, giúp đơn giản hóa toàn bộ vòng đời học máy. Huấn luyện một Ultralytics mô hình này yêu cầu ít hơn đáng kể CUDA giúp tăng bộ nhớ, đẩy nhanh quá trình thử nghiệm và giảm chi phí tính toán.
Tính Đa Năng Vượt Trội
YOLOv6 -3.0 và EfficientDet chủ yếu được dùng để phát hiện đối tượng . Ngược lại, các thuật toán hiện đại Ultralytics Các kiến trúc này vốn dĩ mang tính đa phương thức. Một giao diện duy nhất cho phép bạn huấn luyện các mô hình cho các tác vụ Phân đoạn đối tượng , Ước lượng tư thế , Phân loại hình ảnh và Hộp giới hạn định hướng (OBB) .
Giới thiệu Ultralytics YOLO26
Đối với các nhà phát triển đang tìm kiếm sự cân bằng hiệu năng tối ưu, Ultralytics YOLO26 đại diện cho một bước chuyển mình đột phá. Được phát hành vào tháng 1 năm 2026, sản phẩm này giới thiệu một số cải tiến mang tính đột phá vượt trội so với cả các sản phẩm trước đó. YOLOv6 và EfficientDet:
- Thiết kế End-to-End không NMS: YOLO26 loại bỏ hoàn toàn nhu cầu hậu xử lý Non-Maximum Suppression (NMS), giảm đáng kể biến động độ trễ và đơn giản hóa logic triển khai trên các thiết bị biên.
- Trình tối ưu hóa MuSGD: Lấy cảm hứng từ huấn luyện LLM, trình tối ưu hóa lai này đảm bảo huấn luyện ổn định và hội tụ cực nhanh.
- Suy luận trên CPU nhanh hơn tới 43%: Với việc loại bỏ Distribution Focal Loss (DFL), YOLO26 hiệu quả hơn đáng kể trên CPU và các thiết bị IoT công suất thấp so với các mô hình cũ.
- ProgLoss + STAL: These advanced loss functions deliver massive improvements in small object recognition, making YOLO26 ideal for drone and aerial imagery applications.
Các trường hợp sử dụng và Khuyến nghị
Việc lựa chọn giữa YOLOv6 và EfficientDet phụ thuộc vào các yêu cầu dự án cụ thể, ràng buộc triển khai và sở thích hệ sinh thái của bạn.
Khi nào nên chọn YOLOv6
YOLOv6 là một lựa chọn tốt cho:
- Triển khai công nghiệp nhận biết phần cứng: Các kịch bản mà thiết kế nhận biết phần cứng và tái tham số hóa hiệu quả của mô hình mang lại hiệu suất tối ưu trên phần cứng mục tiêu cụ thể.
- Phát hiện một giai đoạn nhanh: Các ứng dụng ưu tiên tốc độ suy luận thô trên GPU để xử lý video thời gian thực trong môi trường được kiểm soát.
- Tích hợp hệ sinh thái Meituan: Các nhóm đã làm việc trong ngăn xếp công nghệ và cơ sở hạ tầng triển khai của Meituan.
Khi nào nên chọn EfficientDet
EfficientDet được khuyến nghị sử dụng cho:
- Hệ thống Google Cloud và TPU Pipelines: Các hệ thống được tích hợp sâu với API Google Cloud Vision hoặc cơ sở hạ tầng TPU, nơi EfficientDet có tối ưu hóa gốc.
- Nghiên cứu về Compound Scaling: Đánh giá chuẩn học thuật tập trung vào việc nghiên cứu ảnh hưởng của việc mở rộng quy mô độ sâu, chiều rộng và độ phân giải mạng cân bằng.
- Triển khai di động qua TFLite: Các dự án yêu cầu cụ thể xuất TensorFlow Lite cho thiết bị Android hoặc Linux nhúng.
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- Triển khai biên không NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của xử lý hậu kỳ Non-Maximum Suppression.
- Môi trường chỉ có CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi khả năng suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
- Detect đối tượng nhỏ: Các kịch bản đầy thách thức như hình ảnh từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các đối tượng rất nhỏ.
Ví dụ thực hiện: Huấn luyện YOLO26
Đoạn mã sau đây minh họa sự đơn giản của... Ultralytics hệ sinh thái. Việc huấn luyện một mô hình hiện đại dễ dàng như việc tải các trọng số và trỏ đến dữ liệu của bạn.
from ultralytics import YOLO
# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")
Các mô hình khác để xem xét
Nếu bạn đang tìm hiểu sâu hơn về các mô hình thị giác máy tính, hãy xem xét những lựa chọn thay thế sau:
- YOLO11: Tiền thân rất thành công của YOLO26, cung cấp khả năng đa tác vụ mạnh mẽ và hỗ trợ cộng đồng rộng rãi.
- YOLOv10: Kiến trúc YOLO đầu tiên giới thiệu huấn luyện không NMS, mở đường cho phát hiện end-to-end hiện đại.
- RT-DETR: Dành cho các kịch bản mà kiến trúc dựa trên transformer và cơ chế chú ý được ưu tiên hơn các mạng CNN truyền thống.
Kết luận
Trong khi YOLOv6 -3.0 cung cấp các tính năng công nghiệp tuyệt vời GPU Cả throughput và EfficientDet đều thể hiện tiềm năng của AutoML trong việc tạo ra các mạng có khả năng mở rộng và tiết kiệm tham số, tuy nhiên cả hai mô hình đều có những hạn chế về tính dễ triển khai và khả năng xử lý đa nhiệm hiện đại.
Đối với phần lớn các ứng dụng thực tế—từ triển khai thiết bị di động đến phân tích dựa trên đám mây— hệ sinh thái Ultralytics mang lại sự cân bằng hiệu suất vượt trội. Bằng cách áp dụng YOLO26 , các nhà phát triển có được quyền truy cập vào công nghệ tiên tiến nhất. NMS - Suy luận không cần tài nguyên, các hàm mất mát nâng cao dành cho các đối tượng nhỏ và một quy trình huấn luyện thống nhất, được ghi chép đầy đủ, giúp tăng tốc đáng kể quá trình từ nguyên mẫu đến sản phẩm hoàn chỉnh.