Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 so với YOLO26#

Sự phát triển của thị giác máy tính đã được định hình bởi nỗ lực không ngừng nhằm tạo ra các mô hình nhanh hơn, chính xác hơn và dễ tiếp cận hơn. Khi so sánh Ultralytics YOLOv5 với Ultralytics YOLO26 tiên tiến, chúng ta đang chứng kiến một bước chuyển dịch mô hình giúp xóa bỏ khoảng cách giữa các hệ thống cũ mạnh mẽ và các công nghệ triển khai AI hiện đại nhất.

Hướng dẫn này cung cấp một phân tích kỹ thuật toàn diện về cả hai kiến trúc, làm nổi bật các chỉ số hiệu suất, sự khác biệt về cấu trúc và các kịch bản triển khai lý tưởng.

Link to this sectionTổng quan về mô hình#

Link to this sectionYOLOv5: Ngựa thồ của ngành công nghiệp#

Được phát hành vào năm 2020, YOLOv5 đã cách mạng hóa khả năng tiếp cận của nhận diện đối tượng. Bằng cách chuyển đổi kiến trúc sang khung PyTorch, nó mang đến cho các nhà phát triển trải nghiệm "từ con số không đến chuyên gia" chưa từng có.

YOLOv5 đã đặt nền móng cho hệ sinh thái Ultralytics được duy trì chặt chẽ. Nó giới thiệu các kỹ thuật tăng cường dữ liệu mạnh mẽ, các vòng lặp huấn luyện hiệu quả và các đường dẫn xuất mô hình được tối ưu hóa cao sang các định dạng biên như CoreMLONNX. Sự dễ sử dụng và yêu cầu bộ nhớ thấp trong quá trình huấn luyện đã biến nó thành lựa chọn chủ đạo cho các startup và nhà nghiên cứu trên toàn thế giới.

Tìm hiểu thêm về YOLOv5

Link to this sectionYOLO26: Tiêu chuẩn Vision AI thế hệ mới#

Hướng tới tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho đỉnh cao của Vision AI thời gian thực. Nó tích hợp nguyên bản các bài học kinh nghiệm từ các thế hệ trung gian như YOLOv8YOLO11, đồng thời giới thiệu những đột phá lớn được lấy cảm hứng từ việc huấn luyện Mô hình Ngôn ngữ Lớn (LLM).

YOLO26 thiết lập một chuẩn mực mới về sự cân bằng hiệu suất, mang lại độ chính xác hiện đại đồng thời được thiết kế đặc biệt để chiếm ưu thế trong các kịch bản điện toán biên.

Tìm hiểu thêm về YOLO26

Các mô hình Ultralytics khác

Nếu bạn đang chuyển đổi một cơ sở mã cũ, bạn có thể cũng quan tâm đến việc so sánh YOLOv5 với YOLO11, mô hình thế hệ trước đã giới thiệu hỗ trợ ban đầu cho các tác vụ đa dạng như Pose Estimation và Oriented Bounding Boxes (OBB).

Link to this sectionNhững đột phá về kiến trúc trong YOLO26#

Trong khi YOLOv5 dựa vào các đầu dò nhận diện (detection heads) dựa trên anchor và các hàm mất mát tiêu chuẩn, YOLO26 đại tu hoàn toàn các cơ chế bên trong để loại bỏ các điểm nghẽn khi triển khai.

  1. Thiết kế End-to-End không cần NMS: Sự khác biệt đáng kể nhất là kiến trúc end-to-end nguyên bản của YOLO26. Không giống như YOLOv5, vốn yêu cầu Non-Maximum Suppression (NMS) thủ công để lọc các bbox trùng lặp, YOLO26 loại bỏ hoàn toàn bước hậu xử lý này. Điều này đảm bảo độ trễ suy luận có tính tất định và đơn giản hóa đáng kể quá trình tích hợp vào C++ hoặc phần cứng nhúng.
  2. Loại bỏ DFL: YOLO26 loại bỏ Distribution Focal Loss (DFL). Lựa chọn kiến trúc này giúp đơn giản hóa đáng kể việc xuất mô hình và tăng cường khả năng tương thích với các thiết bị biên công suất thấp và vi điều khiển vốn thường gặp khó khăn với các toán tử phức tạp.
  3. Trình tối ưu hóa MuSGD: Lấy cảm hứng từ Kimi K2 của Moonshot AI, YOLO26 sử dụng Trình tối ưu hóa MuSGD, một mô hình lai giữa SGD và Muon. Điều này mang lại sự ổn định và tốc độ hội tụ nhanh chóng như trong huấn luyện LLM vào thị giác máy tính, dẫn đến việc sử dụng bộ nhớ thấp hơn và chu kỳ huấn luyện nhanh hơn so với các mô hình nặng về Transformer.
  4. ProgLoss + STAL: YOLO26 sử dụng các hàm ProgLoss và STAL tinh vi, cải thiện đáng kể khả năng phát hiện các đối tượng nhỏ và dày đặc—một thách thức lịch sử đối với YOLOv5.

Link to this sectionSo sánh hiệu năng#

Khi so sánh các mô hình trên bộ dữ liệu COCO, YOLO26 thể hiện những cải tiến to lớn về độ chính xác (mAP) trong khi đồng thời giảm số lượng tham số và tốc độ suy luận trên CPU.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Lưu ý: YOLO26 Nano (YOLO26n) đạt được 40.9 mAP đáng kinh ngạc so với 28.0 mAP của YOLOv5n, tất cả trong khi vẫn cung cấp tốc độ suy luận CPU nhanh hơn tới 43% nhờ việc loại bỏ DFL và đầu dò không cần NMS.

Link to this sectionTính linh hoạt và Hỗ trợ tác vụ#

YOLOv5 chủ yếu nổi tiếng về nhận diện đối tượng. Trong khi các bản cập nhật sau đó đã giới thiệu phân đoạn cơ bản, YOLO26 được xây dựng ngay từ đầu để trở thành một công cụ đa tác vụ thống nhất.

YOLO26 hỗ trợ nguyên bản:

  • Instance Segmentation: Với các protos đa quy mô dành riêng cho tác vụ và hàm mất mát phân đoạn ngữ nghĩa.
  • Pose Estimation: Sử dụng Residual Log-Likelihood Estimation (RLE) để phát hiện điểm mấu chốt với độ chính xác cao.
  • Oriented Bounding Boxes (OBB): Bao gồm hàm mất mát góc chuyên biệt để giải quyết các vấn đề gián đoạn ranh giới, rất quan trọng đối với phân tích ảnh vệ tinh.
  • Image Classification: Phân loại toàn bộ hình ảnh tiêu chuẩn.
Tích hợp hệ sinh thái

Cả hai mô hình đều được hưởng lợi từ Ultralytics Platform, cung cấp khả năng chú thích dữ liệu liền mạch, tinh chỉnh siêu tham số tự động và triển khai trên đám mây chỉ bằng một cú nhấp chuột. Tuy nhiên, YOLO26 tận dụng tối đa các cấu trúc API hiện đại.

Link to this sectionCách sử dụng và ví dụ về mã#

Ultralytics Python API giúp việc chuyển đổi giữa các mô hình trở nên vô cùng đơn giản. Vì cả hai mô hình đều chia sẻ cùng một hệ sinh thái được duy trì tốt, việc cập nhật pipeline YOLOv5 cũ sang YOLO26 chỉ yêu cầu thay đổi tệp trọng số (weights).

Link to this sectionVí dụ Python#

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this sectionVí dụ CLI#

Bạn có thể triển khai YOLO26 trực tiếp qua dòng lệnh bằng cách sử dụng tích hợp TensorRT để đạt thông lượng GPU tối đa:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Link to this sectionCác trường hợp sử dụng lý tưởng#

Link to this sectionKhi nào nên chọn YOLO26#

Đối với bất kỳ dự án thị giác máy tính hiện đại nào, YOLO26 là lựa chọn không cần bàn cãi.

  • Edge AI và IoT: Tốc độ suy luận CPU nhanh hơn 43% và việc loại bỏ DFL khiến nó trở nên hoàn hảo để triển khai trên Raspberry Pi hoặc các thiết bị di động.
  • Pipeline tốc độ cao: Kiến trúc không cần NMS đảm bảo độ trễ ổn định, có thể dự đoán được, điều này rất quan trọng đối với robot tự hành và hệ thống báo động an ninh thời gian thực.
  • Các kịch bản phức tạp: Nếu ứng dụng của bạn yêu cầu theo dõi các đối tượng nhỏ (ví dụ: giám sát bằng drone) hoặc các đối tượng xoay (OBB), các hàm mất mát tiên tiến của YOLO26 (ProgLoss + STAL) mang lại lợi thế chính xác rất lớn.

Link to this sectionKhi nào nên chọn YOLOv5#

  • Các hệ thống cũ: Nếu môi trường sản xuất của bạn có các phụ thuộc được mã hóa cứng vào logic tạo anchor hoặc phân tích NMS cụ thể của YOLOv5, việc di chuyển có thể yêu cầu một giai đoạn refactor ngắn.
  • Các chuẩn tham chiếu học thuật cụ thể: Các nhà nghiên cứu thường sử dụng YOLOv5 như một chuẩn tham chiếu cổ điển để chứng minh sự tiến triển lịch sử của các kiến trúc nhận diện đối tượng.

Link to this sectionTóm tắt#

Sự chuyển đổi từ YOLOv5 sang YOLO26 không chỉ là một bản cập nhật lặp đi lặp lại; đó là một bước nhảy vọt cơ bản trong cách các mô hình nhận diện đối tượng được huấn luyện và triển khai. Bằng cách tận dụng trình tối ưu hóa MuSGD, loại bỏ hậu xử lý phức tạp thông qua thiết kế không cần NMS và tăng tốc độ CPU đáng kể, Ultralytics YOLO26 mang lại sự cân bằng không thỏa hiệp giữa tốc độ và độ chính xác.

Mặc dù YOLOv5 sẽ luôn được nhớ đến như mô hình đã dân chủ hóa thị giác AI, các nhà phát triển đang tìm cách xây dựng các ứng dụng mạnh mẽ, sẵn sàng cho sản xuất và bền vững với tương lai nên tự tin xây dựng dựa trên YOLO26.

Người đóng góp

Bình luận