Meet YOLO26: next-gen vision AI.

Link to this sectionSo sánh YOLOv5 và YOLOv7#

Bối cảnh thị giác máy tính đã phát triển nhanh chóng trong vài năm qua, thúc đẩy bởi nhu cầu về khả năng phát hiện vật thể thời gian thực nhanh hơn và chính xác hơn. Khi chọn kiến trúc phù hợp cho dự án thị giác máy tính của bạn, việc hiểu rõ các sắc thái giữa các model phổ biến như Ultralytics YOLOv5 và YOLOv7 là rất quan trọng. Bản so sánh kỹ thuật toàn diện này đi sâu vào kiến trúc, phương pháp huấn luyện, chỉ số hiệu suất và các kịch bản triển khai lý tưởng để giúp bạn đưa ra quyết định sáng suốt.

Link to this sectionSơ lược: Nguồn gốc của các Model#

Việc hiểu rõ nguồn gốc và triết lý thiết kế đằng sau những model này cung cấp bối cảnh cho các lựa chọn kiến trúc của chúng.

Chi tiết về YOLOv5:

Tìm hiểu thêm về YOLOv5

Thông tin chi tiết về YOLOv7:

Tìm hiểu thêm về YOLOv7

Khám phá thêm các kiến trúc khác

Bạn quan tâm đến việc các model này so với những model khác như thế nào? Hãy xem các bài so sánh của chúng tôi như YOLOv5 vs YOLO11 hoặc YOLOv7 vs EfficientDet để mở rộng hiểu biết của bạn về hệ sinh thái phát hiện vật thể.

Link to this sectionĐổi mới và Khác biệt về Kiến trúc#

Link to this sectionYOLOv5: Tiêu chuẩn về khả năng tiếp cận#

Được Ultralytics giới thiệu vào năm 2020, YOLOv5 đã tạo ra một sự thay đổi mô hình bằng cách sử dụng framework PyTorch một cách tự nhiên, giúp giảm đáng kể rào cản gia nhập đối với các nhà nghiên cứu và nhà phát triển. Kiến trúc của nó dựa trên backbone Modified CSPDarknet53, tích hợp các mạng Cross Stage Partial (CSP) để giảm số lượng tham số trong khi vẫn duy trì luồng gradient.

Một trong những thế mạnh lớn nhất của nó là Yêu cầu bộ nhớ. So với các bộ phát hiện hai giai đoạn cũ hơn hoặc các model Transformer nặng như RT-DETR, YOLOv5 yêu cầu ít bộ nhớ CUDA hơn đáng kể trong quá trình huấn luyện, cho phép sử dụng batch size lớn hơn trên các GPU tiêu dùng thông thường. Hơn nữa, Tính linh hoạt được tích hợp sẵn của nó hỗ trợ phân loại hình ảnh, phát hiện vật thểphân đoạn hình ảnh một cách liền mạch.

Link to this sectionYOLOv7: Vượt qua giới hạn của độ chính xác thời gian thực#

Được phát hành vào giữa năm 2022, YOLOv7 tập trung vào việc đẩy mạnh các giới hạn hiện đại nhất cho khả năng phát hiện thời gian thực trên các benchmark MS COCO. Các tác giả đã giới thiệu Extended Efficient Layer Aggregation Network (E-ELAN), giúp cải thiện khả năng học của mạng mà không làm hỏng đường truyền gradient ban đầu.

YOLOv7 cũng nổi tiếng với "trainable bag-of-freebies", đặc biệt là các kỹ thuật tái tham số hóa (re-parameterization) trong quá trình huấn luyện, giúp chuyển đổi nhiều module thành một lớp tích chập duy nhất để suy luận, từ đó tăng tốc độ mà không làm giảm độ chính xác. Tuy nhiên, phương pháp huấn luyện phức tạp này thường dẫn đến đường cong học tập dốc hơn và các quy trình xuất (export) không trực quan bằng so với hệ sinh thái Ultralytics gốc.

Link to this sectionSo sánh hiệu năng#

Khi đánh giá các model này, Cân bằng hiệu suất giữa tốc độ, độ chính xác và chi phí tính toán là quan trọng nhất. Dưới đây là bảng so sánh chi tiết các chỉ số hiệu suất của chúng dựa trên tập dữ liệu MS COCO val2017.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Trong khi YOLOv7 đạt điểm mAP tuyệt đối cao hơn trên các biến thể lớn hơn, YOLOv5 cung cấp một dải model vô song—từ Nano (YOLOv5n) siêu nhẹ cho các thiết bị biên cực hạn đến Extra-Large (YOLOv5x) cho suy luận trên đám mây.

Link to this sectionLợi thế từ hệ sinh thái Ultralytics#

Tiện ích của một model không chỉ nằm ở kiến trúc thô của nó; hệ sinh thái xung quanh nó quyết định tốc độ triển khai vào môi trường production. Đây là nơi các model của Ultralytics tỏa sáng.

  • Dễ sử dụng: Ultralytics Platform và API Python thống nhất của nó mang lại trải nghiệm người dùng tối ưu, cú pháp đơn giản và tài liệu phong phú. Việc huấn luyện trên một tập dữ liệu tùy chỉnh không cần viết code mẫu (boilerplate code).
  • Hệ sinh thái được duy trì tốt: Ultralytics hưởng lợi từ sự phát triển tích cực, cập nhật thường xuyên và sự hỗ trợ mạnh mẽ từ cộng đồng. Các tích hợp với các công cụ như Comet MLWeights & Biases đã được tích hợp sẵn.
  • Hiệu quả huấn luyện: Các bộ nạp dữ liệu (data loader), bộ nhớ đệm thông minh và hỗ trợ đa GPU giúp việc huấn luyện các model Ultralytics trở nên đặc biệt hiệu quả. Các pre-trained weight có sẵn giúp đẩy nhanh tốc độ học chuyển đổi (transfer learning) một cách đáng kể.

Link to this sectionVí dụ mã: Bắt đầu#

Sử dụng Ultralytics, việc triển khai một model chỉ yêu cầu vài dòng code. Đoạn mã Python sau đây minh họa việc tải, huấn luyện và chạy suy luận đơn giản như thế nào khi sử dụng gói ultralytics được khuyến nghị.

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

Ngược lại, việc sử dụng kho lưu trữ YOLOv7 gốc thường đòi hỏi phải clone các repo phức tạp, quản lý thủ công các dependency và sử dụng các đối số dòng lệnh dài dòng.

Link to this sectionCác ứng dụng thực tế và trường hợp sử dụng lý tưởng#

Link to this sectionKhi nào nên chọn YOLOv7#

YOLOv7 vẫn là một ứng cử viên mạnh mẽ cho các benchmark học thuật hoặc các đường ống (pipeline) GPU cũ, nơi mục tiêu duy nhất là đạt mAP tối đa và hệ thống đã được tinh chỉnh cho các tensor đầu ra dựa trên anchor. Các nhà nghiên cứu khám phá phân tích đường truyền gradient thường sử dụng YOLOv7 làm baseline.

Link to this sectionKhi nào nên chọn YOLOv5#

YOLOv5 được ưa chuộng cho các môi trường production nhờ sự ổn định đặc biệt. Đây là lựa chọn hàng đầu cho:

  • Tính toán di động và biên: Triển khai YOLOv5n lên iOS qua CoreML hoặc Android qua TFLite.
  • Startup linh hoạt: Các đội ngũ cần chu kỳ lặp nhanh được hưởng lợi từ việc tích hợp Ultralytics Platform liền mạch để quản lý tập dữ liệu và huấn luyện trên đám mây.
  • Môi trường đa nhiệm: Các hệ thống yêu cầu đồng thời khả năng phát hiện, phân loại và phân đoạn vật thể.

Link to this sectionTương lai: Chuyển sang YOLO26#

Mặc dù việc so sánh YOLOv5 và YOLOv7 là một bài tập tuyệt vời để hiểu sự phát triển của AI thị giác, nhưng công nghệ hiện đại nhất vẫn tiếp tục tiến bộ. Được phát hành vào tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho một bước tiến nhảy vọt, khiến các kiến trúc cũ dần trở nên lỗi thời đối với các dự án mới.

Đối với các nhà phát triển đang tìm kiếm đỉnh cao của hiệu suất, YOLO26 mang lại một vài lợi thế đột phá so với cả YOLOv5 và YOLOv7:

  • Thiết kế NMS-Free đầu-cuối (End-to-End): Bằng cách loại bỏ xử lý hậu kỳ Non-Maximum Suppression, YOLO26 mang lại khả năng triển khai đơn giản hơn đáng kể cùng độ trễ nhất quán và nhanh hơn.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ những đổi mới trong LLM từ Moonshot AI, bộ tối ưu hóa hybrid này mang lại quá trình huấn luyện ổn định và hội tụ nhanh chóng.
  • Tốc độ biên chưa từng có: Được tối ưu hóa đặc biệt cho các môi trường biên, biến thể nano có khả năng suy luận CPU nhanh hơn tới 43% bằng cách loại bỏ Distribution Focal Loss (DFL).
  • Độ chính xác vượt trội: Các hàm loss mới như ProgLoss + STAL cải thiện đáng kể khả năng nhận dạng vật thể nhỏ, làm cho nó trở nên lý tưởng cho các thước phim drone và robot.

Cho dù bạn đang duy trì một pipeline YOLOv5 hiện có hay đang tìm cách triển khai YOLO26 tiên tiến nhất, Ultralytics Platform đều cung cấp tất cả các công cụ cần thiết để thành công trong thị giác máy tính hiện đại.

Người đóng góp

Bình luận