Link to this sectionYOLO26 so với YOLOv7#

Sự tiến hóa của phát hiện đối tượng thời gian thực đã chứng kiến nhiều cột mốc quan trọng, trong đó Ultralytics YOLO26 và YOLOv7 đại diện cho hai bước nhảy vọt đáng kể về khả năng thị giác máy tính. Trong khi YOLOv7 giới thiệu phương pháp luận "bag-of-freebies" mạnh mẽ, định nghĩa lại các tiêu chuẩn chính xác vào năm 2022, thì kiến trúc YOLO26 mới ra mắt đi tiên phong trong các tối ưu hóa hướng tới thiết bị biên (edge-first), xử lý end-to-end nguyên bản và động lực huấn luyện ổn định được lấy cảm hứng từ các cải tiến của Mô hình Ngôn ngữ Lớn (LLM).

Bài phân tích chuyên sâu này so sánh hai kiến trúc này, phân tích các chỉ số hiệu suất, sự khác biệt về cấu trúc và các kịch bản triển khai lý tưởng để giúp kỹ sư học máy đưa ra quyết định sáng suốt cho dự án AI thị giác tiếp theo của họ.

Link to this sectionThông tin nền tảng và chi tiết về mô hình#

Trước khi xem xét dữ liệu hiệu suất, điều quan trọng là phải hiểu nguồn gốc và mục tiêu chính của từng mô hình.

Link to this sectionUltralytics YOLO26#

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2026-01-14
GitHub: Kho lưu trữ Ultralytics
Tài liệu: Tài liệu YOLO26

Tìm hiểu thêm về YOLO26

Link to this sectionYOLOv7#

Tác giả: Chien-Yao Wang, Alexey Bochkovskiy, và Hong-Yuan Mark Liao
Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
Ngày: 2022-07-06
Arxiv: Bài báo YOLOv7
GitHub: Kho lưu trữ YOLOv7

Tìm hiểu thêm về YOLOv7

Các mô hình thay thế đáng cân nhắc

Nếu bạn đang khám phá hệ sinh thái rộng lớn hơn, bạn cũng có thể quan tâm đến YOLO11 cho các triển khai đa tác vụ cân bằng cao, hoặc RT-DETR dựa trên Transformer cho phát hiện theo chuỗi. Lưu ý rằng các mô hình cũ như YOLOv8 và YOLOv5 vẫn được hỗ trợ đầy đủ trên Nền tảng Ultralytics để tích hợp kế thừa.

Link to this sectionPhân tích chuyên sâu về kiến trúc#

Các triết lý kiến trúc đằng sau YOLO26 và YOLOv7 khác biệt đáng kể, phản ánh sự chuyển dịch từ việc tối đa hóa hiệu suất GPU cao cấp sang tối ưu hóa cho việc triển khai biên end-to-end liền mạch.

Link to this sectionYOLO26: Mô hình ưu tiên thiết bị biên (Edge-First)#

Được phát hành vào năm 2026, YOLO26 suy nghĩ lại hoàn toàn về quy trình triển khai. Bước đột phá quan trọng nhất của nó là Thiết kế không NMS End-to-End. Bằng cách loại bỏ xử lý hậu kỳ Non-Maximum Suppression (NMS), YOLO26 giảm đáng kể biến động về độ trễ, một khái niệm lần đầu tiên được thí điểm thành công trong YOLOv10. Điều này đảm bảo tốc độ khung hình nhất quán ngay cả trong các cảnh đông đúc, điều này rất quan trọng đối với robot tự hành và giám sát giao thông.

Hơn nữa, YOLO26 loại bỏ hoàn toàn Distribution Focal Loss (DFL). Việc loại bỏ DFL này giúp đơn giản hóa quy trình xuất sang các định dạng như ONNX và Apple CoreML, đạt tốc độ suy luận trên CPU nhanh hơn tới 43%.

Sự ổn định khi huấn luyện là một trọng tâm lớn khác. Sự ra đời của Trình tối ưu hóa MuSGD—một sự kết hợp giữa Stochastic Gradient Descent tiêu chuẩn và Muon (lấy cảm hứng từ động lực huấn luyện của Kimi K2)—đã mang lại sự ổn định huấn luyện LLM tiên tiến cho thị giác máy tính. Kết hợp với các hàm mất mát ProgLoss + STAL, YOLO26 vượt trội trong việc nhận dạng đối tượng nhỏ, một thách thức lịch sử đối với các bộ dò thời gian thực.

Link to this sectionYOLOv7: Sự thành thạo của Bag-of-Freebies#

YOLOv7 được xây dựng dựa trên một nghiên cứu chuyên sâu về tối ưu hóa đường dẫn gradient. Đổi mới cốt lõi của nó là Extended Efficient Layer Aggregation Network (E-ELAN), cho phép mô hình học các đặc trưng đa dạng hơn mà không làm gián đoạn các đường dẫn gradient ban đầu.

Kiến trúc YOLOv7 cũng dựa nhiều vào các kỹ thuật tái tham số hóa (re-parameterization) trong quá trình suy luận, về cơ bản là hợp nhất các lớp để tăng tốc độ mà không làm mất đi các biểu diễn đặc trưng phong phú đã học được trong quá trình huấn luyện. Mặc dù mạnh mẽ trên các GPU máy chủ NVIDIA TensorRT tiêu chuẩn, phương pháp này vẫn dựa vào các đầu dò (head) dựa trên neo và NMS truyền thống, có thể gây ra trở ngại khi triển khai trên các thiết bị công suất thấp.

Link to this sectionSo sánh hiệu năng#

Bảng dưới đây cung cấp so sánh trực tiếp các mô hình được huấn luyện trên tập dữ liệu COCO tiêu chuẩn. YOLO26 thể hiện những cải tiến đáng kể về độ chính xác (mAP) trong khi vẫn duy trì sự cân bằng đặc biệt giữa các tham số và FLOP.

Mô hình	kích thước ^(pixel)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

Lưu ý: YOLO26x vượt trội so với YOLOv7x về mAP với biên độ ấn tượng (57.5 so với 53.1) trong khi yêu cầu ít hơn khoảng 22% tham số.

Link to this sectionLợi thế từ hệ sinh thái Ultralytics#

Một lý do chính khiến các nhà phát triển liên tục chọn YOLO26 là sự tích hợp sâu vào Nền tảng Ultralytics. Không giống như các tập lệnh độc lập cần thiết cho các kiến trúc cũ hơn, Ultralytics cung cấp một quy trình làm việc thống nhất, liền mạch.

Dễ sử dụng: API Python cho phép người dùng tải, huấn luyện và triển khai các model chỉ với vài dòng code. Việc xuất sang các định dạng di động như TensorFlow Lite chỉ yêu cầu thay đổi một đối số duy nhất.
Yêu cầu bộ nhớ: Các mô hình Ultralytics được thiết kế tỉ mỉ để đạt hiệu quả huấn luyện. Chúng yêu cầu bộ nhớ CUDA ít hơn đáng kể so với các mô hình vision transformer nặng nề, cho phép các nhà nghiên cứu chạy các batch size lớn hơn trên phần cứng tiêu dùng.
Tính linh hoạt: Trong khi YOLOv7 yêu cầu các kho lưu trữ hoàn toàn khác nhau cho các tác vụ khác nhau, YOLO26 hỗ trợ nguyên bản Phân loại hình ảnh, Phân đoạn đối tượng, Ước tính tư thế và phát hiện Hộp bao định hướng (OBB) từ một thư viện thống nhất, mạch lạc. Nó thậm chí bao gồm các hàm mất mát cụ thể cho từng tác vụ, chẳng hạn như Residual Log-Likelihood Estimation (RLE) cho các đường ống dẫn ước tính tư thế người.
Phát triển tích cực: Cộng đồng mã nguồn mở Ultralytics cung cấp các bản cập nhật thường xuyên, đảm bảo giải quyết nhanh chóng các trường hợp biên và khả năng tương thích liên tục với các bản phát hành PyTorch mới nhất.

Xuất mô hình hợp lý hóa

Vì YOLO26 vốn không sử dụng NMS, việc triển khai tới các mục tiêu nhúng bằng Intel OpenVINO hoặc ONNX Runtime giúp loại bỏ hoàn toàn các tập lệnh xử lý hậu kỳ phức tạp.

Link to this sectionCác trường hợp sử dụng thực tế#

Sự khác biệt về kiến trúc giữa các mô hình này quyết định các kịch bản triển khai lý tưởng của chúng.

Link to this sectionKhi nào nên chọn YOLO26#

YOLO26 là khuyến nghị không thể tranh cãi cho các hệ thống thị giác máy tính hiện đại, hướng tới tương lai.

Edge AI và IoT: Với hiệu suất suy luận trên CPU nhanh hơn 43% và số lượng tham số nhẹ, YOLO26n hoàn hảo cho các thiết bị bị hạn chế tài nguyên như Raspberry Pi hoặc camera thông minh thành phố.
Máy bay không người lái và Hình ảnh trên không: Sự tích hợp ProgLoss + STAL cải thiện đáng kể khả năng phát hiện đối tượng nhỏ, khiến nó trở thành lựa chọn hàng đầu cho các cuộc kiểm tra đường ống và nông nghiệp chính xác.
Robot đa tác vụ: Vì nó dễ dàng xử lý đồng thời các hộp bao, mặt nạ phân đoạn và các điểm mấu chốt tư thế với chi phí bộ nhớ tối thiểu, nó rất phù hợp cho điều hướng và tương tác robot động.

Link to this sectionKhi nào nên cân nhắc YOLOv7#

Mặc dù hầu hết đã bị thay thế bởi các kiến trúc mới hơn, YOLOv7 vẫn giữ lại các tiện ích đặc thù.

Đánh giá học thuật: Các nhà nghiên cứu phát triển các đầu dò dựa trên neo mới hoặc nghiên cứu các chiến lược đường dẫn gradient thường sử dụng YOLOv7 làm so sánh cơ sở tiêu chuẩn trên các nền tảng như Papers With Code.
Hệ thống GPU kế thừa: Các hệ thống doanh nghiệp được xây dựng tùy chỉnh xung quanh các đầu ra tensor cụ thể của YOLOv7 và các cấu hình NMS tùy chỉnh trên các instance AWS EC2 P4d mạnh mẽ có thể trì hoãn việc di chuyển sang các mô hình mới hơn cho đến khi cần tái cấu trúc toàn bộ hệ thống.

Link to this sectionVí dụ mã: Bắt đầu#

Trải nghiệm của nhà phát triển làm nổi bật sự tương phản rõ rệt giữa các kho lưu trữ nghiên cứu tiêu chuẩn và hệ sinh thái Ultralytics. Việc huấn luyện một mô hình YOLO26 tùy chỉnh cực kỳ đơn giản:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

Link to this sectionLời kết#

Trong khi YOLOv7 vẫn là một cột mốc đáng kính trong lịch sử phát hiện đối tượng thời gian thực, ngành công nghiệp đã tích cực chuyển dịch sang các mô hình ưu tiên sự đơn giản khi triển khai, tính linh hoạt đa tác vụ và hiệu quả trên thiết bị biên.

Bằng cách loại bỏ NMS, giới thiệu trình tối ưu hóa MuSGD và cải thiện đáng kể tốc độ suy luận trên CPU, Ultralytics YOLO26 trở thành lựa chọn tối ưu cho các nhà phát triển và kỹ sư doanh nghiệp hiện nay. Kết hợp với hệ sinh thái Ultralytics mạnh mẽ, thân thiện với người dùng, nó mang lại sự cân bằng chưa từng có giữa tốc độ, độ chính xác và niềm vui kỹ thuật.

Người đóng góp

GLglenn-jocher⁹

Đã tạo 14 thg 1, 2026Đã cập nhật 3 tuần trước