Meet YOLO26: next-gen vision AI.

Link to this sectionSo sánh YOLOv6-3.0 và YOLOv7#

Sự phát triển của thị giác máy tính thời gian thực được đánh dấu bằng những tiến bộ nhanh chóng trong hiệu quả kiến trúc và phương pháp đào tạo. Hai mô hình nổi bật có tác động đáng kể đến bối cảnh này là YOLOv6-3.0YOLOv7. Cả hai framework đều giới thiệu các kỹ thuật mới lạ để cân bằng giữa tốc độ suy luận và độ chính xác của việc phát hiện, nhắm mục tiêu vào các triển khai từ GPU máy chủ cao cấp đến các thiết bị biên.

Bài so sánh kỹ thuật toàn diện này khám phá các kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng của chúng, đồng thời làm nổi bật cách Ultralytics Platform hiện đại và mô hình YOLO26 mới nhất được xây dựng dựa trên những khái niệm nền tảng này để mang lại trải nghiệm nhà phát triển vô song.

Link to this sectionYOLOv6-3.0: Tối ưu hóa hiệu suất công nghiệp#

Được phát triển bởi Bộ phận Vision AI tại Meituan, YOLOv6-3.0 được thiết kế rõ ràng cho các ứng dụng công nghiệp có lưu lượng cao. Nó tập trung nhiều vào việc tối đa hóa hiệu suất trên các bộ tăng tốc phần cứng, biến nó thành một ứng viên mạnh mẽ cho các môi trường mà việc xử lý theo lô (batch processing) trên GPU chuyên dụng là khả thi.

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
  • Tổ chức: Meituan
  • Ngày: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionCải tiến kiến trúc#

YOLOv6-3.0 dựa trên backbone EfficientRep, một kiến trúc thân thiện với phần cứng được thiết kế để tối ưu hóa chi phí truy cập bộ nhớ trên GPU. Để tăng cường khả năng hợp nhất đặc trưng (feature fusion) qua các quy mô khác nhau, mô hình giới thiệu mô-đun Bi-directional Concatenation (BiC) trong phần cổ (neck). Điều này cho phép mạng lưới nắm bắt các phân cấp không gian phức tạp hiệu quả hơn so với các phiên bản trước.

Hơn nữa, YOLOv6-3.0 triển khai chiến lược Anchor-Aided Training (AAT). Cách tiếp cận này kết hợp các tín hiệu gradient phong phú của quá trình đào tạo có neo (anchor-based) với các lợi ích triển khai hợp lý của suy luận không neo (anchor-free), giúp mô hình hội tụ ổn định hơn mà không làm giảm tốc độ hậu xử lý.

Tìm hiểu thêm về YOLOv6

Các lưu ý về phần cứng

Trong khi YOLOv6-3.0 vượt trội trên các GPU cấp máy chủ (như NVIDIA T4), sự phụ thuộc nhiều vào việc tái tham số hóa cấu trúc cụ thể đôi khi có thể dẫn đến độ trễ không tối ưu trên các thiết bị biên giới hạn CPU so với các kiến trúc mới hơn.

Link to this sectionYOLOv7: Người tiên phong Bag-of-Freebies#

Được phát hành bởi các nhà nghiên cứu tại Academia Sinica, YOLOv7 đã chọn một cách tiếp cận khác bằng cách tập trung mạnh vào phân tích đường dẫn gradient và tối ưu hóa thời gian đào tạo mà không làm tăng chi phí suy luận—một khái niệm mà các tác giả gọi là "trainable bag-of-freebies."

  • Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
  • Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
  • Ngày: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Link to this sectionCải tiến kiến trúc#

Cốt lõi của YOLOv7 là Extended Efficient Layer Aggregation Network (E-ELAN). E-ELAN tối ưu hóa đường dẫn gradient bằng cách cho phép các lớp khác nhau học các đặc trưng đa dạng hơn mà không phá vỡ cấu trúc liên kết mạng ban đầu. Điều này dẫn đến một mô hình có khả năng biểu đạt cao, đạt được mean average precision (mAP) hàng đầu.

YOLOv7 cũng sử dụng nhiều quá trình tái tham số hóa mô hình (model re-parameterization), hợp nhất các lớp tích chập với batch normalization trong quá trình suy luận. Điều này làm giảm số lượng tham số và tăng tốc đường truyền phía trước (forward pass) khi triển khai bằng các framework như NVIDIA TensorRT hoặc ONNX.

Tìm hiểu thêm về YOLOv7

Link to this sectionSo sánh hiệu năng#

Khi đánh giá các mô hình này trên tập dữ liệu MS COCO, chúng ta quan sát thấy một sự đánh đổi rõ rệt giữa các biến thể siêu nhẹ của YOLOv6 và các kiến trúc YOLOv7 tập trung vào độ chính xác với nhiều tham số.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Dữ liệu cho thấy YOLOv6-3.0n cung cấp tốc độ suy luận vượt trội, phù hợp cho phân tích video tần suất cao. Ngược lại, YOLOv7x đạt mAP cao nhất, chiếm ưu thế trong các tác vụ mà độ chính xác phát hiện là ưu tiên hàng đầu so với tốc độ khung hình thô.

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa YOLOv6 và YOLOv7 phụ thuộc vào các yêu cầu dự án cụ thể, hạn chế triển khai và tùy chọn hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn YOLOv6#

YOLOv6 là sự lựa chọn mạnh mẽ cho:

  • Triển khai chú trọng phần cứng công nghiệp: Các kịch bản mà thiết kế chú trọng phần cứng của mô hình và khả năng tái tham số hóa hiệu quả mang lại hiệu năng tối ưu trên phần cứng mục tiêu cụ thể.
  • Phát hiện single-stage nhanh: Các ứng dụng ưu tiên tốc độ inference thô trên GPU để xử lý video thời gian thực trong các môi trường được kiểm soát.
  • Tích hợp hệ sinh thái Meituan: Các đội ngũ đã và đang làm việc trong hệ sinh thái công nghệ và hạ tầng triển khai của Meituan.

Link to this sectionKhi nào nên chọn YOLOv7#

YOLOv7 được khuyến nghị cho:

  • Academic Benchmarking: Tái tạo các kết quả state-of-the-art của kỷ nguyên 2022 hoặc nghiên cứu các hiệu ứng của kỹ thuật E-ELAN và trainable bag-of-freebies.
  • Nghiên cứu về Reparameterization: Khám phá các convolution được lập kế hoạch tái tham số hóa và các chiến lược compound model scaling.
  • Các pipeline tùy chỉnh hiện có: Các dự án với các pipeline tùy chỉnh nặng nề được xây dựng dựa trên kiến trúc cụ thể của YOLOv7 mà không thể dễ dàng tái cấu trúc.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionLợi thế của Ultralytics: Bước vào tương lai#

Mặc dù YOLOv6-3.0 và YOLOv7 đại diện cho các cột mốc quan trọng, nhưng việc tích hợp các kho lưu trữ khác biệt vào quy trình sản xuất thường gây ra thách thức trong việc model deployment và tinh chỉnh siêu tham số. Hệ sinh thái Ultralytics giải quyết các điểm khó khăn này bằng cách cung cấp một giao diện hợp nhất, tinh gọn.

Link to this sectionTại sao chọn Ultralytics?#

  • Dễ sử dụng: Ultralytics Python API cho phép các nhà phát triển tải, đào tạo và xuất mô hình chỉ với vài dòng mã. Việc chuyển từ mô hình cũ sang kiến trúc mới nhất chỉ cần thay đổi một chuỗi duy nhất.
  • Hệ sinh thái được duy trì tốt: Ultralytics cung cấp các bản cập nhật thường xuyên, hỗ trợ cộng đồng tích cực và tài liệu mạnh mẽ.
  • Tính linh hoạt: Không giống như các mô hình trước đây chủ yếu tập trung vào bounding box, các mô hình Ultralytics hỗ trợ nguyên bản việc học đa tác vụ, bao gồm instance segmentation, pose estimationoriented bounding boxes (OBB).
  • Yêu cầu bộ nhớ: Các mô hình Ultralytics YOLO duy trì mức sử dụng bộ nhớ thấp hơn trong quá trình đào tạo so với các kiến trúc dựa trên Transformer như RT-DETR, cho phép các nhà nghiên cứu đào tạo hiệu quả trên phần cứng người tiêu dùng.

Link to this sectionNâng cấp lên YOLO26#

Đối với các nhà phát triển tìm kiếm đỉnh cao hiệu suất, YOLO26 (phát hành tháng 1 năm 2026) về cơ bản thay đổi mô hình object detection. Nó giới thiệu một Thiết kế hoàn toàn End-to-End không cần NMS, loại bỏ logic hậu xử lý phức tạp và giảm đáng kể sự thay đổi độ trễ trên các thiết bị biên.

Những cải tiến chính trong YOLO26 bao gồm:

  • MuSGD Optimizer: Một sự kết hợp tinh vi giữa SGD và Muon đảm bảo động lực đào tạo cực kỳ ổn định và hội tụ nhanh hơn.
  • Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss, YOLO26 đơn giản hóa khả năng tương thích xuất khẩu và tăng cường hiệu suất trên các thiết bị công suất thấp.
  • ProgLoss + STAL: Các hàm mất mát (loss functions) nâng cao mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ.
  • Tốc độ vô song: Đạt tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước, làm cho nó trở nên hoàn hảo cho các hệ thống nhúng như Raspberry Pi hoặc triển khai Apple CoreML.

Các mô hình có khả năng cao khác trong hệ sinh thái bao gồm YOLO11YOLOv8, cả hai đều cung cấp sự cân bằng hiệu suất tuyệt vời cho các tích hợp phần cứng cũ.

Bảo vệ tương lai cho quy trình của bạn

Bằng cách xây dựng các ứng dụng thị giác máy tính của bạn trên Ultralytics Platform, bạn đảm bảo quyền truy cập tức thì vào các mô hình hiện đại nhất trong tương lai mà không cần viết lại các bộ tải dữ liệu hoặc tập lệnh triển khai của mình.

Link to this sectionVí dụ mã nguồn: Huấn luyện tinh gọn#

Đoạn mã sau minh họa cách bạn có thể đào tạo mô hình YOLO26 hiện đại dễ dàng như thế nào bằng cách sử dụng Ultralytics API. Quy trình chính xác này áp dụng liền mạch cho YOLO11 hoặc YOLOv8, loại bỏ các mã boilerplate thường được yêu cầu bởi các kho lưu trữ cũ hơn.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cuda:0",  # Automatically utilizes PyTorch GPU acceleration
)

# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for cross-platform deployment
model.export(format="onnx")

Link to this sectionKết luận#

YOLOv6-3.0 và YOLOv7 đã giải quyết thành công các khía cạnh khác nhau của thách thức phát hiện thời gian thực. YOLOv6-3.0 là một cường quốc cho các môi trường GPU công nghiệp chuyên biệt, trong khi YOLOv7 cung cấp độ chính xác cao thông qua tối ưu hóa đường dẫn gradient nghiêm ngặt.

Tuy nhiên, đối với các ứng dụng hiện đại yêu cầu tính linh hoạt vô song, ma sát triển khai tối thiểu và hiệu suất hiện đại nhất, Ultralytics YOLO26 là sự lựa chọn xác định. Kiến trúc không cần NMS, bộ tối ưu hóa MuSGD tiên tiến và khả năng tích hợp sâu với Ultralytics Platform đảm bảo rằng các nhà phát triển có thể triển khai các giải pháp AI thị giác mạnh mẽ, có khả năng mở rộng nhanh hơn bao giờ hết.

Những người đóng góp

Bình luận