Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 so với YOLOv5: So sánh kỹ thuật toàn diện các kiến trúc của Ultralytics#

Việc lựa chọn kiến trúc mạng thần kinh phù hợp là quyết định then chốt cho bất kỳ sáng kiến computer vision nào. Khi bối cảnh của artificial intelligence thay đổi, các công cụ dành cho nhà phát triển và nghiên cứu cũng vậy. Hướng dẫn toàn diện này cung cấp sự so sánh kỹ thuật chuyên sâu giữa hai mô hình mang tính bước ngoặt từ hệ sinh thái Ultralytics: YOLOv5 vô cùng nổi tiếng và YOLO11 tiên tiến.

Cho dù bạn đang triển khai các mô hình nhẹ cho các ứng dụng edge AI hay xử lý luồng video độ phân giải cao trên các cloud GPU, việc hiểu rõ các sắc thái kiến trúc, performance metrics và các trường hợp sử dụng lý tưởng cho các mô hình này sẽ đảm bảo bạn đưa ra lựa chọn dựa trên dữ liệu cho các ràng buộc triển khai cụ thể của mình.

Link to this sectionDòng dõi mô hình và chi tiết kỹ thuật#

Cả hai mô hình đều phản ánh cam kết của Ultralytics đối với sự hợp tác nguồn mở, hiệu suất mạnh mẽ và khả năng sử dụng vượt trội, khiến chúng trở thành lựa chọn ưa thích của cộng đồng machine learning toàn cầu.

Link to this sectionChi tiết về YOLO11#

Tìm hiểu thêm về YOLO11

Link to this sectionChi tiết về YOLOv5#

Tìm hiểu thêm về YOLOv5

Link to this sectionSự khác biệt về kiến trúc#

Sự phát triển từ YOLOv5 lên YOLO11 giới thiệu một số thay đổi kiến trúc sâu sắc được thiết kế để tối ưu hóa độ chính xác và hiệu suất tham số.

YOLOv5 là đơn vị tiên phong trong hệ sinh thái PyTorch, giới thiệu xương sống CSPNet (Cross Stage Partial Network) được tối ưu hóa cao và cổ mạng PANet (Path Aggregation Network). Nó dựa vào khả năng phát hiện dựa trên neo, yêu cầu các anchor boxes được xác định trước để dự đoán biên đối tượng. Mặc dù rất hiệu quả, nhưng việc tinh chỉnh các neo này cho các computer vision datasets tùy chỉnh có thể khá rườm rà.

Ngược lại, YOLO11 chuyển sang mô hình phát hiện không cần neo (anchor-free) hiện đại hơn. Điều này loại bỏ nhu cầu tinh chỉnh anchor box thủ công, hợp lý hóa quá trình đào tạo và cải thiện khả năng tổng quát hóa trên các tập dữ liệu đa dạng như COCO dataset. Ngoài ra, YOLO11 có phần đầu tách biệt (decoupled head), nghĩa là các tác vụ phân loại và hồi quy bounding box được xử lý trong các nhánh riêng biệt. Sự tách biệt này cải thiện đáng kể tốc độ hội tụ và mean Average Precision (mAP), đặc biệt là cho các kịch bản object detection phức tạp.

Link to this sectionCác chỉ số và Benchmark hiệu suất#

Bảng dưới đây so sánh các chỉ số chính trên các kích thước mô hình khác nhau. Các mô hình của Ultralytics nổi tiếng với yêu cầu bộ nhớ, thường tiêu thụ ít bộ nhớ CUDA hơn trong quá trình đào tạo so với các giải pháp thay thế dựa trên Transformer nặng nề, điều này làm giảm đáng kể rào cản phần cứng khi bắt đầu.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Như đã quan sát, YOLO11 đạt được sự cân bằng hiệu suất rất thuận lợi, liên tục mang lại điểm mAP cao hơn ở số lượng tham số tương đương so với các phiên bản YOLOv5 tương ứng.

Link to this sectionPhương pháp đào tạo và khả năng sử dụng#

Một nguyên lý cốt lõi của triết lý Ultralytics là khả năng sử dụng đặc biệt dễ dàng, được hỗ trợ bởi hệ sinh thái được bảo trì tốt và sự hỗ trợ rộng rãi từ cộng đồng.

YOLOv5 trong lịch sử dựa vào các tập lệnh command-line interface (CLI) mạnh mẽ (train.py, detect.py) để thực thi. Mặc dù mạnh mẽ, nhưng việc tích hợp trực tiếp các tập lệnh này vào các ứng dụng Python tùy chỉnh thường đòi hỏi các giải pháp thay thế.

YOLO11 đã cách mạng hóa điều này bằng cách giới thiệu gói ultralytics Python hợp lý. API hợp nhất này xử lý mọi thứ từ đào tạo đến exporting models sang các định dạng như ONNX, OpenVINOTensorRT một cách nguyên bản.

Triển khai hợp lý với nền tảng Ultralytics

Để có trải nghiệm hoàn toàn không cần lập trình (no-code), các nhà phát triển có thể sử dụng Ultralytics Platform để chú thích dữ liệu, đào tạo mô hình trên đám mây và triển khai chúng lên các thiết bị biên một cách liền mạch.

Link to this sectionSo sánh mã nguồn#

Việc đào tạo một mô hình Ultralytics hiện nay cực kỳ hiệu quả. Đây là cách bạn có thể đào tạo YOLO11 bằng cách sử dụng Python API gốc của nó:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the model to ONNX for deployment
model.export(format="onnx")

Đối với các hệ thống kế thừa sử dụng YOLOv5, việc đào tạo qua CLI trông như thế này:

# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt

Link to this sectionCác trường hợp sử dụng lý tưởng và ứng dụng thực tế#

Cả hai mô hình đều có những điểm mạnh riêng phù hợp với các môi trường vận hành khác nhau.

Link to this sectionKhi nào nên sử dụng YOLOv5#

Mặc dù là thế hệ mới hơn, YOLOv5 vẫn là một

  • Tích hợp hệ thống kế thừa: Các môi trường được tích hợp sâu với các cấu trúc tensor hoặc quy trình triển khai cụ thể của YOLOv5 mà không thể dễ dàng tái cấu trúc.
  • Cơ sở nghiên cứu học thuật: Các nhà nghiên cứu cần các cơ sở chuẩn đã được thiết lập, lâu đời để phục vụ các nghiên cứu học thuật có thể tái lập trong medical image analysis.

Link to this sectionKhi nào nên sử dụng YOLO11#

YOLO11 đại diện cho lựa chọn lý tưởng cho các quy trình sản xuất hiện đại nhờ tính linh hoạt đáng kinh ngạc:

  • Môi trường đa tác vụ: Không giống như YOLOv5, vốn chủ yếu là một bộ phát hiện (với các bổ sung phân đoạn sau đó), YOLO11 hỗ trợ nguyên bản instance segmentation, image classification, pose estimation và phát hiện Oriented Bounding Box (OBB) ngay khi khởi chạy.
  • Phân tích video mật độ cao: Lý tưởng cho các hệ thống giao thông thông minh hoặc retail inventory management nơi việc trích xuất độ chính xác tối đa từ các cảnh phức tạp là rất quan trọng.

Link to this sectionHướng tới tương lai: Kiến trúc YOLO26#

Mặc dù YOLO11 là một tiêu chuẩn đặc biệt, biên giới của computer vision vẫn tiếp tục tiến triển nhanh chóng. Các nhà phát triển đang tìm kiếm đỉnh cao tuyệt đối của hiệu suất cũng nên xem xét Ultralytics YOLO26 mới nhất (phát hành tháng 1 năm 2026).

YOLO26 đại diện cho một bước nhảy vọt, được thiết kế rõ ràng cho cả tối ưu hóa biên và quy mô doanh nghiệp. Các đổi mới chính bao gồm:

  • Thiết kế End-to-End không cần NMS: YOLO26 là end-to-end nguyên bản, loại bỏ quá trình hậu xử lý Non-Maximum Suppression (NMS) để triển khai nhanh hơn, đơn giản hơn.
  • Loại bỏ DFL: Distribution Focal Loss đã được loại bỏ để đơn giản hóa việc xuất mô hình và tăng cường khả năng tương thích với thiết bị tiêu thụ điện năng thấp.
  • Trình tối ưu hóa MuSGD: Một sự kết hợp đột phá giữa SGD và Muon, mang lại sự ổn định khi đào tạo LLM vào computer vision để hội tụ nhanh hơn.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho các triển khai IoT và các thiết bị không có GPUs chuyên dụng.
  • ProgLoss + STAL: Các hàm mất mát được cải thiện đáng kể mang lại những cải tiến đáng chú ý trong việc nhận dạng đối tượng nhỏ, rất quan trọng cho hình ảnh từ máy bay không người lái (drone).

Tìm hiểu thêm về YOLO26

Link to this sectionTóm tắt#

Việc lựa chọn giữa YOLO11 và YOLOv5 cuối cùng phụ thuộc vào giai đoạn vòng đời dự án của bạn. Di sản của YOLOv5 là không thể phủ nhận, mang lại sự ổn định cực cao và sự hỗ trợ lớn từ cộng đồng. Tuy nhiên, đối với bất kỳ dự án mới nào, YOLO11 được khuyến nghị cao hơn các thế hệ cũ. Nó kết hợp độ chính xác hàng đầu, Python API cực kỳ thanh lịch và chi phí bộ nhớ đào tạo thấp hơn, củng cố vị thế của Ultralytics ở vị trí tiên phong trong đổi mới AI. Đối với những người đang đẩy xa hơn nữa các ranh giới, việc khám phá YOLO26 hiện đại nhất trên Ultralytics Platform sẽ mang lại kết quả chưa từng có.

Người đóng góp

Bình luận