Chuyển đến nội dung

YOLO26 so với YOLOv7: Sự phát triển của phát hiện đối tượng thời gian thực

Bối cảnh thị giác máy tính đang phát triển nhanh chóng, và việc chọn đúng mô hình cho ứng dụng của bạn là rất quan trọng để cân bằng giữa tốc độ, độ chính xác và sự dễ dàng triển khai. Trang này cung cấp một so sánh kỹ thuật giữa YOLO26, mô hình tiên tiến nhất từ Ultralytics, và YOLOv7, một mô hình kế thừa được đánh giá cao ra mắt vào năm 2022.

Trong khi YOLOv7 đã giới thiệu những đổi mới kiến trúc đáng kể như E-ELAN, YOLO26 đại diện cho một sự thay đổi mô hình hướng tới hiệu quả từ đầu đến cuối, suy luận không NMS nguyên bản và triển khai biên liền mạch. Dưới đây, chúng tôi phân tích kiến trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng của chúng để giúp bạn quyết định framework nào phù hợp nhất với nhu cầu của mình.

So sánh Các chỉ số Hiệu suất

Bảng sau đây làm nổi bật sự khác biệt về hiệu suất giữa hai kiến trúc. YOLO26 thể hiện hiệu suất vượt trội, đặc biệt trong môi trường CPU nơi thiết kế tối ưu của nó phát huy tác dụng.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

YOLO26: Tiêu chuẩn mới về hiệu quả

YOLO26, được Ultralytics phát hành vào tháng 1 năm 2026, được xây dựng dựa trên hệ sinh thái mạnh mẽ đã được thiết lập bởi các phiên bản trước đó như YOLO11. Được thiết kế bởi Glenn Jocher và Jing Qiu, nó giới thiệu một số công nghệ đột phá nhằm mục đích đơn giản hóa quy trình vận hành học máy (MLOps) và tăng cường suy luận trên các thiết bị biên.

Các Đổi Mới Kiến Trúc Chính

Tính năng nổi bật của YOLO26 là Thiết kế không NMS từ đầu đến cuối. Không giống như các bộ detect truyền thống yêu cầu Non-Maximum Suppression (NMS) để lọc các hộp giới hạn trùng lặp, YOLO26 được huấn luyện để xuất ra kết quả detect cuối cùng trực tiếp. Điều này loại bỏ một bước hậu xử lý tốn kém về mặt tính toán, dẫn đến độ trễ thấp hơn và thời gian suy luận xác định.

Ngoài ra, YOLO26 còn có tính năng Loại bỏ DFL. Bằng cách loại bỏ mô-đun Distribution Focal Loss, kiến trúc mô hình được đơn giản hóa. Thay đổi này rất quan trọng đối với khả năng tương thích xuất, giúp việc triển khai mô hình sang các định dạng như ONNX hoặc CoreML cho các ứng dụng di động dễ dàng hơn đáng kể.

Tính ổn định khi huấn luyện

YOLO26 tích hợp Trình tối ưu hóa MuSGD, một phương pháp lai kết hợp Stochastic Gradient Descent với Muon, lấy cảm hứng từ những đổi mới trong huấn luyện Mô hình Ngôn ngữ Lớn (LLM) từ Moonshot AI. Điều này mang lại sự ổn định của huấn luyện transformer cho thị giác máy tính.

Hiệu suất và các trường hợp sử dụng

Với tốc độ suy luận trên CPU nhanh hơn tới 43% so với các thế hệ trước, YOLO26 là lựa chọn lý tưởng cho các ứng dụng không có GPU mạnh mẽ, chẳng hạn như hệ thống an ninh dựa trên Raspberry Pi hoặc thực tế tăng cường di động. Việc tích hợp ProgLoss và STAL (Gán nhãn nhận biết mục tiêu nhỏ) đảm bảo rằng, mặc dù có tốc độ nhanh, nó vẫn vượt trội trong việc detect các vật thể nhỏ, một thách thức phổ biến trong hình ảnh máy bay không người lái và phân tích vệ tinh.

Tìm hiểu thêm về YOLO26

YOLOv7: Di sản "Bag-of-Freebies"

YOLOv7, được viết bởi Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao, được phát hành vào tháng 7 năm 2022. Khi ra mắt, nó đã thiết lập các tiêu chuẩn mới về tốc độ và độ chính xác. Bạn có thể đọc nghiên cứu gốc trong bài báo Arxiv của họ.

Kiến trúc và Phương pháp luận

YOLOv7 đã giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Kiến trúc này cho phép mô hình học các đặc trưng đa dạng hơn bằng cách kiểm soát các đường dẫn gradient ngắn nhất và dài nhất. Nó đã tận dụng triệt để "bag-of-freebies"—các phương pháp huấn luyện giúp tăng độ chính xác mà không làm tăng chi phí suy luận—như tái tham số hóa và huấn luyện đầu phụ.

Tình trạng hiện tại

Mặc dù YOLOv7 vẫn là một mô hình có khả năng, nhưng nó dựa vào detect dựa trên anchor và yêu cầu hậu xử lý NMS. Trong các kịch bản suy luận thời gian thực hiện đại, điều này gây ra độ trễ mà các mô hình mới hơn như YOLO26 đã loại bỏ thành công. Hơn nữa, hỗ trợ hệ sinh thái của nó kém tích hợp hơn so với các công cụ liền mạch được cung cấp bởi gói Ultralytics.

Tìm hiểu thêm về YOLOv7

So sánh kỹ thuật chi tiết

Tốc độ suy luận và hiệu quả tài nguyên

Một trong những khác biệt đáng kể nhất nằm ở yêu cầu bộ nhớ và tính toán. YOLO26 được tối ưu hóa cho lượng tử hóa mô hình, hỗ trợ triển khai INT8 với tổn thất độ chính xác tối thiểu. Việc loại bỏ DFL và đầu không NMS có nghĩa là YOLO26 tiêu thụ ít bộ nhớ hơn trong quá trình suy luận, làm cho nó linh hoạt hơn nhiều đối với các thiết bị IoT công nghiệp (IIoT).

Ngược lại, việc YOLOv7 dựa vào NMS có nghĩa là thời gian suy luận có thể dao động tùy thuộc vào số lượng vật thể trong cảnh (vì NMS tỷ lệ thuận với số lượng detect), trong khi YOLO26 cung cấp thời gian nhất quán và xác định hơn.

Tính linh hoạt và hỗ trợ tác vụ

Hệ sinh thái Ultralytics cho phép người dùng chuyển đổi giữa các tác vụ một cách liền mạch. Trong khi YOLOv7 chủ yếu được biết đến với detect (với một số nhánh pose có sẵn trong các triển khai riêng biệt), YOLO26 cung cấp một framework thống nhất.

Dễ sử dụng và hệ sinh thái

Ultralytics ưu tiên trải nghiệm của nhà phát triển. Huấn luyện một mô hình YOLO26 chỉ yêu cầu vài dòng mã python, trong khi các mô hình cũ thường dựa vào các tập lệnh shell và tệp cấu hình phức tạp.

from ultralytics import YOLO

# Load a pretrained YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)

Sự tích hợp này mở rộng đến Nền tảng Ultralytics, giúp đơn giản hóa việc quản lý dữ liệu và huấn luyện trên đám mây, và có tài liệu phong phú được cộng đồng liên tục cập nhật.

Kết luận

Khi so sánh YOLO26 và YOLOv7, lựa chọn phụ thuộc vào giai đoạn vòng đời của dự án của bạn. Nếu bạn đang duy trì một codebase cũ được xây dựng khoảng năm 2022, YOLOv7 vẫn là một lựa chọn hợp lệ. Tuy nhiên, đối với bất kỳ phát triển mới nào, YOLO26 là lựa chọn vượt trội.

YOLO26 cung cấp một kiến trúc hiện đại nhanh hơn, nhỏ hơn và dễ huấn luyện hơn. Thiết kế không NMS của nó giải quyết các vấn đề triển khai kéo dài, và trình tối ưu hóa MuSGD đảm bảo hội tụ huấn luyện mạnh mẽ. Bằng cách chọn Ultralytics, bạn cũng có quyền truy cập vào một hệ sinh thái phát triển mạnh và các công cụ giúp đẩy nhanh thời gian đưa sản phẩm ra thị trường.

Các nhà phát triển quan tâm đến việc khám phá các kiến trúc hiện đại khác cũng có thể xem xét YOLO11 hoặc YOLOE cho các tác vụ từ vựng mở cụ thể.


Bình luận