Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet so với YOLOv8#

Lĩnh vực computer vision không ngừng phát triển, với các kiến trúc mới liên tục mở rộng giới hạn của những gì có thể làm được. Việc lựa chọn kiến trúc mạng thần kinh phù hợp là rất quan trọng để cân bằng giữa độ chính xác, độ trễ và mức tiêu thụ tài nguyên. Trong phân tích kỹ thuật toàn diện này, chúng tôi sẽ so sánh hai mô hình mạnh mẽ trong lĩnh vực phát hiện đối tượng: EfficientDet của Google và Ultralytics YOLOv8.

Cho dù mục tiêu của bạn là triển khai các mô hình trên các thiết bị edge computing bị hạn chế về tài nguyên hay chạy các phân tích quy mô lớn trên máy chủ đám mây, việc hiểu rõ các điểm khác biệt giữa các mô hình này sẽ hướng dẫn bạn đưa ra lựa chọn tối ưu.

Link to this sectionTổng quan và nguồn gốc mô hình#

Hiểu rõ triết lý kiến trúc đằng sau mỗi mô hình cung cấp bối cảnh quan trọng về các đặc điểm hiệu suất của chúng.

Link to this sectionEfficientDet: Độ chính xác có khả năng mở rộng#

Được phát triển bởi các nhà nghiên cứu tại Google, EfficientDet được giới thiệu như một framework phát hiện đối tượng có khả năng mở rộng cao. Nó tập trung vào việc tối đa hóa độ chính xác trong khi quản lý cẩn thận các phép tính dấu phẩy động (FLOPs) và số lượng tham số.

Tìm hiểu thêm về EfficientDet

EfficientDet dựa trên backbone EfficientNet và giới thiệu Bi-directional Feature Pyramid Network (BiFPN). Điều này cho phép hợp nhất các tính năng đa quy mô một cách dễ dàng và nhanh chóng. Ngoài ra, nó sử dụng phương pháp mở rộng hợp chất (compound scaling) để mở rộng đồng nhất độ phân giải, độ sâu và chiều rộng cho tất cả các mạng backbone, mạng tính năng và mạng dự đoán box/class cùng một lúc. Mặc dù hiệu quả, việc phụ thuộc nặng nề vào hệ sinh thái TensorFlow đôi khi có thể làm phức tạp việc triển khai trong các môi trường tập trung vào PyTorch.

Link to this sectionUltralytics YOLOv8: Tiêu chuẩn linh hoạt#

Được ra mắt vào đầu năm 2023, Ultralytics YOLOv8 đại diện cho một sự thay đổi mô hình trong dòng YOLO, được thiết kế không chỉ để phát hiện bounding box mà còn là một framework thống nhất có khả năng xử lý vô số tác vụ thị giác.

Tìm hiểu thêm về YOLOv8

YOLOv8 giới thiệu một detection head anchor-free, loại bỏ nhu cầu cấu hình thủ công anchor boxes dựa trên phân phối tập dữ liệu. Điều này đơn giản hóa đáng kể quá trình huấn luyện. Kiến trúc của nó có mô-đun C2f được tối ưu hóa cao giúp cải thiện dòng gradient và cho phép mô hình học các biểu diễn đặc trưng phong phú hơn. Quan trọng nhất, YOLOv8 yêu cầu ít GPU memory hơn đáng kể trong quá trình huấn luyện so với các mô hình dựa trên Transformer hạng nặng, giúp dân chủ hóa việc tiếp cận nghiên cứu AI cao cấp.

Khả năng đa tác vụ

Không giống như EfficientDet, vốn được thiết kế nghiêm ngặt cho bounding boxes, YOLOv8 tự hào về sự linh hoạt cực độ. Ngay khi triển khai, nó hỗ trợ object detection, instance segmentation, image classification, pose estimation, và oriented bounding boxes (OBB).

Link to this sectionHiệu năng và Benchmark#

Khi đánh giá các mô hình này trên các tiêu chuẩn như COCO dataset, sự đánh đổi giữa tốc độ và độ chính xác trở nên rõ ràng. Bảng dưới đây so sánh họ EfficientDet (d0-d7) với loạt YOLOv8 (n-x).

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Link to this sectionPhân tích dữ liệu#

Dữ liệu benchmark làm nổi bật sự cân bằng hiệu suất mà các kỹ sư Ultralytics đưa vào kiến trúc của họ. Trong khi EfficientDet-d0 cung cấp độ trễ CPU ONNX cực thấp, YOLOv8 lại chiếm ưu thế trong các môi trường tăng tốc bằng GPU. Mô hình YOLOv8n thực thi với tốc độ chóng mặt 1.47 ms trên NVIDIA T4 sử dụng TensorRT, làm cho nó vượt trội hơn hẳn cho các luồng phân tích video thời gian thực.

Hơn nữa, YOLOv8x đạt được độ chính xác tổng thể cao nhất với 53.9 mAP ấn tượng, vượt qua EfficientDet-d7 khổng lồ trong khi yêu cầu ít FLOPs hơn đáng kể (257.8B so với 325.0B). Hiệu suất tham số này chuyển trực tiếp thành yêu cầu bộ nhớ thấp hơn và chi phí năng lượng giảm trong quá trình triển khai doanh nghiệp.

Link to this sectionHệ sinh thái và tính dễ sử dụng#

Yếu tố khác biệt thực sự đối với nhiều đội ngũ kỹ thuật hiện đại không chỉ là tốc độ thuần túy của một mô hình mà là hệ sinh thái bao quanh nó.

Việc triển khai của EfficientDet phụ thuộc nhiều vào các thư viện AutoML cũ, điều này có thể gây ra lộ trình học tập khó khăn và các chuỗi phụ thuộc mong manh cho các nhà phát triển đã quen với các quy trình làm việc PyTorch hiện đại.

Ngược lại, Ultralytics mang đến sự dễ sử dụng tuyệt vời. Hệ sinh thái được duy trì tốt cung cấp một Python API nhất quán giúp đơn giản hóa đáng kể vòng đời học máy. Nó cung cấp sự tích hợp liền mạch với Ultralytics Platform mạnh mẽ, xử lý mọi thứ từ tự động gán nhãn đến huấn luyện trên đám mây và giám sát thời gian thực.

Link to this sectionVí dụ mã: Huấn luyện và Suy luận với YOLOv8#

Sự hiệu quả trong huấn luyện của hệ sinh thái Ultralytics được thể hiện rõ nhất qua mã nguồn. Việc bắt đầu chỉ cần vài dòng Python:

from ultralytics import YOLO

# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run inference on a remote image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for production deployment
export_path = model.export(format="onnx")

Cách tiếp cận tinh gọn này tự động xử lý việc tải xuống tập dữ liệu, data augmentation và phân bổ phần cứng, cho phép các nhà nghiên cứu tập trung vào kết quả thay vì mã boilerplate.

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa EfficientDet và YOLOv8 phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn EfficientDet#

EfficientDet là một lựa chọn mạnh mẽ cho:

  • Google Cloud và các đường ống TPU: Các hệ thống được tích hợp sâu với API Google Cloud Vision hoặc hạ tầng TPU, nơi EfficientDet có sự tối ưu hóa gốc.
  • Nghiên cứu về Compound Scaling: Các nghiên cứu học thuật tập trung vào việc đánh giá tác động của độ sâu mạng, chiều rộng và khả năng mở rộng độ phân giải cân bằng.
  • Triển khai trên di động qua TFLite: Các dự án yêu cầu cụ thể việc xuất TensorFlow Lite cho Android hoặc các thiết bị Linux nhúng.

Link to this sectionKhi nào nên chọn YOLOv8#

YOLOv8 được khuyến nghị cho:

  • Triển khai đa tác vụ linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh cho việc phát hiện, phân đoạn, phân loạiước tính tư thế trong hệ sinh thái Ultralytics.
  • Hệ thống sản xuất đã thiết lập: Các môi trường sản xuất hiện có đã được xây dựng trên kiến trúc YOLOv8 với các pipeline triển khai ổn định, đã được kiểm thử tốt.
  • Hỗ trợ cộng đồng và hệ sinh thái rộng lớn: Các ứng dụng được hưởng lợi từ các hướng dẫn mở rộng, tích hợp bên thứ ba và tài nguyên cộng đồng tích cực của YOLOv8.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionHướng tới tương lai: Lợi thế của YOLO26#

Mặc dù YOLOv8 là một mô hình mục đích chung tuyệt vời, bối cảnh thị giác máy tính vẫn tiếp tục tiến bộ. Đối với người dùng đang đánh giá các kiến trúc hiện nay, chúng tôi thực sự khuyên bạn nên khám phá Ultralytics YOLO26 mới ra mắt, đại diện cho đỉnh cao của phát hiện đối tượng hiện đại.

Ra mắt vào tháng 1 năm 2026, YOLO26 xây dựng dựa trên sự thành công của những người tiền nhiệm (bao gồm YOLO11YOLOv10) với các tính năng đột phá:

  • Thiết kế End-to-End NMS-Free: YOLO26 loại bỏ hoàn toàn nhu cầu hậu xử lý Non-Maximum Suppression (NMS), đơn giản hóa đáng kể logic triển khai và giảm biến động độ trễ.
  • Trình tối ưu hóa MuSGD: Tích hợp các cải tiến từ quá trình huấn luyện Large Language Model (LLM), trình tối ưu hóa lai này đảm bảo quá trình huấn luyện ổn định hơn và hội tụ nhanh chóng.
  • Suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa kỹ lưỡng cho các kịch bản edge AI thiếu GPU chuyên dụng.
  • ProgLoss + STAL: Các hàm mất mát nâng cao này mang lại những cải tiến đáng chú ý trong việc nhận diện đối tượng nhỏ, vốn là điểm yếu lịch sử của nhiều trình phát hiện thời gian thực.

Link to this sectionKết luận#

EfficientDet vẫn là một kiến trúc thanh lịch về mặt toán học, tiên phong trong các kỹ thuật mở rộng hợp chất. Tuy nhiên, đối với các ứng dụng sẵn sàng cho sản xuất, Ultralytics YOLOv8 cung cấp trải nghiệm nhà phát triển vượt trội, sự linh hoạt cao hơn trên các tác vụ thị giác và tốc độ suy luận vô đối trên phần cứng GPU hiện đại.

Đối với các đội ngũ bắt đầu dự án mới, việc tận dụng hệ sinh thái Ultralytics đảm bảo quyền truy cập vào quá trình phát triển tích cực, tài liệu phong phú và lộ trình nâng cấp rõ ràng lên các mô hình tiên tiến như YOLO26.

Người đóng góp

Bình luận