Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ so với YOLOv6-3.0#

Lĩnh vực computer vision thời gian thực đã mở rộng nhanh chóng, dẫn đến các kiến trúc chuyên biệt cao được tối ưu hóa cho nhiều kịch bản triển khai khác nhau. Các nhà phát triển thường so sánh PP-YOLOE+YOLOv6-3.0 khi xây dựng các ứng dụng đòi hỏi sự cân bằng giữa lưu lượng xử lý cao và độ chính xác tin cậy. Cả hai model đều mang đến những cải tiến kiến trúc đáng kể khi ra mắt, tập trung vào việc tăng cường tốc độ suy luận cho các ứng dụng công nghiệp và biên.

Trước khi đi sâu vào phân tích kiến trúc chi tiết, hãy khám phá biểu đồ bên dưới để hình dung cách các model này thực hiện so với nhau về tốc độ và độ chính xác.

Link to this sectionPP-YOLOE+: Điểm mạnh và điểm yếu về kiến trúc#

Được phát triển bởi PaddlePaddle Authors, PP-YOLOE+ là một anchor-free detector nổi bật, dựa trên các phiên bản tiền nhiệm để mang lại hiệu suất mạnh mẽ trên nhiều yêu cầu về quy mô khác nhau.

Link to this sectionĐiểm nổi bật về kiến trúc#

PP-YOLOE+ giới thiệu một số cải tiến quan trọng so với thiết kế PP-YOLOE ban đầu. Nó tận dụng backbone CSPRepResNet mạnh mẽ, giúp cân bằng hiệu quả chi phí tính toán với khả năng trích xuất đặc trưng. Hơn nữa, nó kết hợp feature pyramid network (FPN) tiên tiến cùng với Path Aggregation Network (PAN) để đảm bảo khả năng hợp nhất đặc trưng đa quy mô. Một trong những tính năng nổi bật của nó là ET-head (Efficient Task-aligned head), giúp cải thiện đáng kể sự phối hợp giữa phân loại và định vị trong quá trình object detection.

Mặc dù PP-YOLOE+ đạt được mean average precision (mAP) ấn tượng, nhưng việc phụ thuộc vào hệ sinh thái PaddlePaddle đôi khi gây ra rào cản học tập đáng kể cho các nhà nghiên cứu đã quen với quy trình làm việc nguyên bản trên PyTorch. Điều này có thể làm phức tạp đôi chút quy trình model deployment khi nhắm mục tiêu vào các thiết bị biên không đồng nhất thiếu hỗ trợ suy luận trực tiếp từ Paddle.

Bối cảnh triển khai

PP-YOLOE+ được tối ưu hóa cao để triển khai trong stack công nghệ của Baidu, khiến nó trở thành một lựa chọn tuyệt vời nếu môi trường sản xuất của bạn phụ thuộc nhiều vào các công cụ suy luận Paddle.

Tìm hiểu thêm về PP-YOLOE+

Link to this sectionYOLOv6-3.0: Thông lượng công nghiệp#

Được phát hành bởi Meituan Vision AI Department, YOLOv6-3.0 được thiết kế rõ ràng để trở thành một trình phát hiện đối tượng thế hệ mới cho các ứng dụng công nghiệp, ưu tiên lưu lượng xử lý cực lớn trên phần cứng GPU.

Link to this sectionĐiểm nổi bật về kiến trúc#

YOLOv6-3.0 sở hữu backbone EfficientRep được thiết kế riêng để tối đa hóa hiệu suất sử dụng phần cứng, đặc biệt là trên các GPU NVIDIA sử dụng TensorRT. Bản cập nhật v3.0 mang đến module Bi-directional Concatenation (BiC) vào phần neck, giúp tăng cường khả năng giữ lại đặc trưng không gian mà không làm tăng đáng kể số lượng tham số. Ngoài ra, nó còn giới thiệu chiến lược Anchor-Aided Training (AAT) kết hợp lợi ích của tính ổn định dựa trên anchor trong quá trình model training trong khi vẫn duy trì kiến trúc anchor-free nhanh chóng trong real-time inference.

Tuy nhiên, vì YOLOv6-3.0 được tối ưu hóa cao cho các GPU cấp máy chủ, lợi ích về độ trễ của nó đôi khi giảm đi khi triển khai trên các thiết bị biên chỉ dùng CPU bị hạn chế tài nguyên nghiêm trọng. Sự chuyên biệt hóa này có nghĩa là nó vượt trội trong các môi trường như phân tích video ngoại tuyến nhưng có thể tụt hậu so với các model được tối ưu hóa linh hoạt trên phần cứng nhỏ hơn và cục bộ hơn.

Tìm hiểu thêm về YOLOv6

Link to this sectionBảng so sánh hiệu suất#

Bảng sau đây làm nổi bật các chỉ số hiệu suất chính, so sánh trực tiếp các biến thể quy mô khác nhau của cả hai kiến trúc.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa PP-YOLOE+ và YOLOv6 phụ thuộc vào yêu cầu cụ thể của dự án, hạn chế triển khai và sở thích về hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn PP-YOLOE+#

PP-YOLOE+ là lựa chọn mạnh mẽ cho:

  • Tích hợp hệ sinh thái PaddlePaddle: Các tổ chức có cơ sở hạ tầng hiện có được xây dựng trên framework và công cụ PaddlePaddle của Baidu.
  • Triển khai Paddle Lite Edge: Triển khai lên phần cứng với các kernel suy luận được tối ưu hóa cao dành riêng cho Paddle Lite hoặc engine suy luận Paddle.
  • Nhận diện phía máy chủ có độ chính xác cao: Các kịch bản ưu tiên độ chính xác nhận diện tối đa trên các máy chủ GPU mạnh mẽ, nơi sự phụ thuộc vào framework không phải là vấn đề.

Link to this sectionKhi nào nên chọn YOLOv6#

YOLOv6 được khuyến nghị cho:

  • Triển khai chú trọng phần cứng công nghiệp: Các kịch bản mà thiết kế chú trọng phần cứng của mô hình và khả năng tái tham số hóa hiệu quả mang lại hiệu năng tối ưu trên phần cứng mục tiêu cụ thể.
  • Phát hiện single-stage nhanh: Các ứng dụng ưu tiên tốc độ inference thô trên GPU để xử lý video thời gian thực trong các môi trường được kiểm soát.
  • Tích hợp hệ sinh thái Meituan: Các đội ngũ đã và đang làm việc trong hệ sinh thái công nghệ và hạ tầng triển khai của Meituan.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionLợi thế của Ultralytics: Tiến xa hơn các model kế thừa#

Trong khi PP-YOLOE+ và YOLOv6-3.0 cung cấp các giải pháp có mục tiêu, quá trình phát triển AI hiện đại đòi hỏi các quy trình linh hoạt và tiết kiệm bộ nhớ. Đây là nơi Ultralytics Platform mang lại trải nghiệm nhà phát triển vô song. Với một Python API thống nhất, bạn có thể huấn luyện, xác thực và triển khai các model tiên tiến một cách liền mạch mà không gặp phải chi phí cấu hình khổng lồ thường thấy trong các kho lưu trữ nghiên cứu cũ.

Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.

Link to this sectionKhám phá YOLO26: Tiêu chuẩn mới#

Đối với các tổ chức đang tìm cách triển khai các model thị giác hiện đại nhất, Ultralytics YOLO26 (phát hành vào tháng 1 năm 2026) xác định lại các ranh giới hiệu suất. Nó vượt trội đáng kể so với các thế hệ cũ với một vài cải tiến quan trọng:

  • End-to-End NMS-Free Design: Building on concepts from YOLOv10, YOLO26 completely eliminates Non-Maximum Suppression (NMS) post-processing. This natively end-to-end approach guarantees predictable, ultra-low latency inference, crucial for real-time safety systems.
  • Suy luận CPU nhanh hơn tới 43%: Thông qua việc loại bỏ Distribution Focal Loss (DFL) khỏi kiến trúc, YOLO26 được tối ưu hóa mạnh mẽ cho điện toán biên và các môi trường thiếu tăng tốc GPU chuyên dụng.
  • MuSGD Optimizer: Tích hợp tính ổn định huấn luyện LLM vào các model thị giác, bộ tối ưu hóa lai này (lấy cảm hứng từ Moonshot AI) cho phép hội tụ nhanh chóng và các phiên custom training cực kỳ ổn định.
  • ProgLoss + STAL: Các công thức hàm mất mát nâng cao này mang lại những cải tiến đáng kể trong việc nhận dạng vật thể nhỏ, rất quan trọng cho các ứng dụng như aerial drone imagery và phân tích các cảnh đông đúc.
Đảm bảo tương lai cho các pipeline của bạn

Nếu bạn đang xây dựng một dự án mới hôm nay, chúng tôi đặc biệt khuyến nghị bỏ qua các kiến trúc cũ và áp dụng YOLO26. Hiệu quả bộ nhớ và tốc độ không cần NMS của nó giúp việc chuyển giao sang sản xuất dễ dàng hơn đáng kể.

Link to this sectionTriển khai liền mạch#

Việc huấn luyện và xuất các model hiện đại bằng Ultralytics Python package cực kỳ đơn giản. Ví dụ sau đây minh họa cách huấn luyện model YOLO26 mới nhất và xuất nó sang ONNX để triển khai biên nhanh chóng:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

Đối với các đội ngũ đã tích hợp sâu vào các quy trình làm việc cũ nhưng đang tìm kiếm sự ổn định hiện đại, việc khám phá Ultralytics YOLO11 cũng là một bước chuyển tiếp tuyệt vời, cung cấp sự linh hoạt tác vụ toàn diện được hỗ trợ bởi toàn bộ hệ sinh thái Ultralytics.

Những người đóng góp

Bình luận