Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 so với YOLO26: Bước nhảy vọt về thế hệ trong nhận diện đối tượng thời gian thực#

Sự phát triển của thị giác máy tính đã đạt được những cột mốc quan trọng, và việc so sánh các kiến trúc cũ với các mô hình hiện đại tiên tiến nhất mang lại nhiều hiểu biết giá trị cho các kỹ sư ML. Bài so sánh kỹ thuật này đi sâu vào sự khác biệt giữa YOLOv7 đầy ảnh hưởng và Ultralytics YOLO26 mang tính cách mạng, làm nổi bật những cải tiến về kiến trúc, phương pháp huấn luyện và hiệu quả triển khai.

Link to this sectionYOLOv7: Người tiên phong của "Bag-of-Freebies"#

Được giới thiệu vào giữa năm 2022, YOLOv7 đã đẩy xa các giới hạn về hiệu năng trên phần cứng GPU bằng cách đưa vào nhiều tối ưu hóa kiến trúc giúp cải thiện độ chính xác mà không làm tăng chi phí suy luận.

Chi tiết mô hình

YOLOv7 giới thiệu khái niệm "bag-of-freebies" có thể huấn luyện, tận dụng mạnh mẽ các kỹ thuật tái tham số hóa và mạng tập hợp lớp hiệu quả mở rộng (E-ELAN). Điều này cho phép mô hình học được các đặc trưng đa dạng hơn và liên tục cải thiện khả năng học của mạng mà không phá hủy lộ trình gradient ban đầu. Mặc dù đạt được tiêu chuẩn công nghiệp ấn tượng trên COCO vào thời điểm đó, kiến trúc của nó vẫn phụ thuộc nặng nề vào các đầu ra dựa trên anchor và yêu cầu hậu xử lý Non-Maximum Suppression (NMS) phức tạp, điều này có thể gây ra hiện tượng nghẽn độ trễ trong quá trình triển khai.

Tìm hiểu thêm về YOLOv7

Link to this sectionYOLO26: Tiêu chuẩn Vision AI hướng tới Edge#

Được phát hành vào tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho một sự thay đổi mô hình, tư duy lại hoàn toàn quy trình phát hiện để ưu tiên sự dễ dàng trong triển khai, độ ổn định khi huấn luyện và hiệu quả phần cứng.

Chi tiết mô hình

YOLO26 được xây dựng từ đầu để giải quyết các thách thức kỹ thuật hiện đại. Kiến trúc của nó mang đến nhiều đổi mới quan trọng vượt xa các phiên bản tiền nhiệm:

  • Thiết kế End-to-End không cần NMS: YOLO26 loại bỏ hậu xử lý NMS một cách tự nhiên, một phương pháp đột phá được tiên phong lần đầu trong YOLOv10. Điều này mang lại quy trình triển khai nhanh hơn, đơn giản hơn nhiều, tránh được độ trễ biến đổi thường xảy ra trong các cảnh đông đúc.
  • Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss (DFL), mô hình được đơn giản hóa triệt để để xuất dữ liệu, mang lại khả năng tương thích vượt trội với các thiết bị edge và phần cứng IoT tiêu thụ điện năng thấp.
  • Suy luận trên CPU nhanh hơn tới 43%: Nhờ các đơn giản hóa về kiến trúc và cắt tỉa cấu trúc, YOLO26 được tối ưu hóa đặc biệt cho tính toán biên và các thiết bị không có GPU chuyên dụng, dễ dàng vượt qua các kiến trúc cũ trên các bộ vi xử lý tiêu chuẩn.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện mô hình ngôn ngữ lớn (cụ thể là Kimi K2 của Moonshot AI), YOLO26 sử dụng bộ tối ưu hóa MuSGD—một sự kết hợp giữa Stochastic Gradient Descent và Muon. Điều này mang lại độ ổn định huấn luyện chưa từng có và khả năng hội tụ nhanh hơn cho các tác vụ thị giác máy tính.
  • ProgLoss + STAL: Việc giới thiệu các hàm loss tiên tiến này mang lại những cải tiến đáng chú ý trong việc nhận diện đối tượng nhỏ, điều này rất quan trọng đối với ảnh chụp từ trên không, robot và kiểm tra chất lượng tự động.
  • Cải tiến theo tác vụ: Ngoài nhận diện đối tượng tiêu chuẩn, YOLO26 còn giới thiệu các proto đa quy mô và loss phân đoạn ngữ nghĩa chuyên dụng cho các tác vụ phân đoạn, Ước tính log-likelihood dư (RLE) cho ước tính tư thế và các thuật toán loss góc chuyên dụng để giải quyết các vấn đề về biên trong Hộp bao định hướng (OBB).

Tìm hiểu thêm về YOLO26

Di chuyển sang YOLO26

Việc nâng cấp từ kiến trúc cũ lên YOLO26 đơn giản như việc thay đổi chuỗi mô hình trong mã Python của bạn thành yolo26n.pt. Gói Ultralytics xử lý toàn bộ quá trình chuyển đổi, bao gồm tải trọng lượng tự động và mở rộng cấu hình.

Link to this sectionSo sánh Hiệu năng và Chỉ số#

Khi so sánh dấu chân tính toán, YOLO26 cho thấy sự vượt trội rõ ràng trong việc cân bằng hiệu suất và yêu cầu bộ nhớ. Các mô hình dựa trên Transformer hoặc các kiến trúc nặng nề cũ thường yêu cầu cấp phát bộ nhớ CUDA khổng lồ, nhưng YOLO26 huấn luyện hiệu quả trên các GPU cấp người tiêu dùng.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Như đã thấy ở trên, mô hình YOLO26m đạt độ chính xác tương đương (53.1 mAP) với YOLOv7x khổng lồ, nhưng làm được điều đó với ít hơn một phần ba số lượng tham số (20.4M so với 71.3M) và thời gian suy luận cực nhanh thông qua TensorRT.

Link to this sectionLợi thế từ hệ sinh thái Ultralytics#

Việc triển khai các mô hình cũ thường đi kèm với việc xử lý các kho lưu trữ bên thứ ba phức tạp, vấn đề phụ thuộc và các tập lệnh xuất thủ công. Ngược lại, Ultralytics Platform cung cấp một hệ sinh thái gắn kết, được bảo trì tốt giúp hợp lý hóa toàn bộ vòng đời học máy.

  • Dễ sử dụng: Với API Python trực quan và tài liệu đầy đủ, bạn có thể chú thích, huấn luyện và triển khai mô hình trong vài phút. Việc xuất sang các định dạng như ONNX hoặc CoreML chỉ cần một dòng mã.
  • Yêu cầu bộ nhớ: Các mô hình Ultralytics nổi tiếng với mức tiêu thụ bộ nhớ thấp. Không giống như một số vision transformer cồng kềnh, YOLO26 có thể dễ dàng tinh chỉnh trên phần cứng tiêu chuẩn mà không gặp lỗi hết bộ nhớ (OOM).
  • Tính linh hoạt: Trong khi YOLOv7 chủ yếu là một trình nhận diện đối tượng (với một số nhánh thử nghiệm cho các tác vụ khác), YOLO26 là một khung làm việc hợp nhất tự nhiên xử lý việc nhận diện, phân loại, theo dõi, ước tính tư thế và OBB với độ thành thạo tương đương.
Các mô hình Ultralytics khác

Mặc dù YOLO26 là tiêu chuẩn được khuyến nghị, các nhà phát triển di chuyển hệ thống cũ cũng có thể khám phá YOLO11, một thế hệ khác rất có năng lực trong dòng sản phẩm Ultralytics, cung cấp sự ổn định tuyệt vời cho các dự án cần hỗ trợ lâu dài.

Link to this sectionVí dụ mã: Huấn luyện và Triển khai#

Ví dụ sau đây minh họa sự đơn giản thanh lịch của gói ultralytics. Hãy chú ý giao diện sạch sẽ như thế nào so với việc phải gọi các tham số dòng lệnh dài cho các mô hình cũ hơn.

from ultralytics import YOLO

# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # Efficient memory usage allows larger batch sizes
    device=0,
)

# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")

Link to this sectionCác trường hợp sử dụng thực tế#

Việc chọn kiến trúc phù hợp phụ thuộc hoàn toàn vào các ràng buộc sản xuất của bạn.

Khi nào nên cân nhắc YOLOv7: YOLOv7 vẫn là một công cụ có giá trị để đánh giá hiệu năng học thuật so với các tiêu chuẩn năm 2022. Nếu cơ sở hạ tầng của bạn sử dụng nhiều pipelines CUDA cũ được hardcode chặt chẽ với các đầu ra anchor cụ thể của YOLOv7 và bạn không thể phân bổ tài nguyên để cấu trúc lại, nó sẽ tiếp tục hoạt động như một trình phát hiện cơ sở mạnh mẽ.

Khi nào nên chọn YOLO26: Đối với bất kỳ dự án mới nào, YOLO26 là lựa chọn dứt khoát. Kiến trúc không cần NMS của nó làm cho nó trở nên hoàn hảo cho điều hướng tự hành có độ trễ thấp và các hệ thống an ninh thời gian thực. Việc loại bỏ DFL và tăng tốc CPU khổng lồ làm cho nó trở thành nhà vô địch không thể tranh cãi cho các triển khai AI ở biên, chẳng hạn như triển khai trên Raspberry Pi hoặc bên trong các thiết bị điện tử tiêu dùng. Hơn nữa, các cải tiến ProgLoss + STAL làm cho nó cực kỳ thành thạo trong việc phát hiện các bất thường nhỏ trong kiểm soát chất lượng sản xuất hoặc chụp ảnh vệ tinh.

Cuối cùng, YOLO26 cung cấp cho các nhà phát triển sự kết hợp không gì sánh bằng về độ chính xác, tốc độ và sự đơn giản, được hỗ trợ bởi sự hỗ trợ toàn diện của cộng đồng nguồn mở.

Người đóng góp

Bình luận