YOLO26 vs YOLOv7 So sánh kỹ thuật toàn diện
Sự phát triển của công nghệ phát hiện đối tượng thời gian thực đã chứng kiến nhiều cột mốc quan trọng, trong đó Ultralytics YOLO26 và YOLOv7 đại diện cho hai bước tiến đáng kể trong khả năng thị giác máy tính. Trong khi đó, YOLOv7 Được giới thiệu bởi phương pháp "túi quà tặng miễn phí" mạnh mẽ đã định nghĩa lại các tiêu chuẩn độ chính xác vào năm 2022, kiến trúc YOLO26 mới được phát hành tiên phong trong việc tối ưu hóa xử lý tại biên, xử lý đầu cuối nguyên bản và động lực huấn luyện ổn định được lấy cảm hứng từ những đổi mới của Mô hình Ngôn ngữ Lớn (LLM).
Bài phân tích chuyên sâu này so sánh hai kiến trúc này, phân tích các chỉ số hiệu năng, sự khác biệt về cấu trúc và các kịch bản triển khai lý tưởng để giúp các kỹ sư máy học đưa ra quyết định sáng suốt cho dự án AI thị giác tiếp theo của họ.
Thông tin và bối cảnh của người mẫu
Trước khi xem xét dữ liệu hiệu suất, điều quan trọng là phải hiểu nguồn gốc và mục tiêu chính của từng mô hình.
Ultralytics YOLO26
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức:Ultralytics
Ngày: 2026-01-14
GitHub:Kho lưu trữ Ultralytics
Tài liệu:Tài liệu YOLO26
YOLOv7
Các tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
Đơn vị tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Đài Loan
Ngày: 06/07/2022
Arxiv: Bài báo YOLOv7
GitHub: Kho lưu trữ YOLOv7
Các mô hình thay thế cần xem xét
Nếu bạn đang tìm hiểu hệ sinh thái rộng hơn, bạn cũng có thể quan tâm đến YOLO11 để triển khai đa nhiệm cân bằng cao, hoặc RT-DETR dựa trên Transformer để phát hiện dựa trên chuỗi. Lưu ý rằng các mô hình cũ hơn như YOLOv8 và YOLOv5 vẫn được hỗ trợ đầy đủ. Ultralytics Nền tảng tích hợp hệ thống cũ.
Tìm hiểu sâu về kiến trúc
Triết lý kiến trúc đằng sau YOLO26 và YOLOv7 có sự khác biệt đáng kể, phản ánh sự chuyển dịch từ việc tối đa hóa chất lượng cao cấp. GPU Tối ưu hóa hiệu suất để triển khai liền mạch, từ đầu đến cuối tại biên mạng.
YOLO26: Mô hình ưu tiên cạnh
Ra mắt vào năm 2026, YOLO26 đã thay đổi hoàn toàn quy trình triển khai. Bước đột phá quan trọng nhất của nó là thiết kế không sử dụng NMS từ đầu đến cuối . Bằng cách loại bỏ quá trình xử lý hậu kỳ NMS , YOLO26 giảm đáng kể sự biến động độ trễ, một khái niệm lần đầu tiên được thử nghiệm thành công trong YOLOv10 . Điều này đảm bảo tốc độ khung hình ổn định ngay cả trong các cảnh có mật độ đối tượng cao, điều rất quan trọng đối với robot tự hành và giám sát giao thông.
Hơn nữa, YOLO26 loại bỏ hoàn toàn Distribution Focal Loss (DFL). Việc loại bỏ DFL này giúp đơn giản hóa quá trình xuất sang các định dạng như ONNX và Apple CoreML , đạt được tốc độ suy luận CPU nhanh hơn tới 43% .
Tính ổn định trong quá trình huấn luyện là một trọng tâm chính khác. Việc giới thiệu bộ tối ưu hóa MuSGD — sự kết hợp giữa thuật toán Stochastic Gradient Descent tiêu chuẩn và Muon (lấy cảm hứng từ động lực huấn luyện của Kimi K2) — mang lại tính ổn định huấn luyện LLM tiên tiến cho thị giác máy tính. Kết hợp với các hàm mất mát ProgLoss + STAL , YOLO26 vượt trội trong việc nhận dạng các vật thể nhỏ, một thách thức lâu đời đối với các bộ dò thời gian thực.
YOLOv7 Bí quyết sử dụng túi đồ miễn phí
YOLOv7 Mô hình này được xây dựng dựa trên nghiên cứu chuyên sâu về tối ưu hóa đường dẫn gradient. Điểm đột phá cốt lõi của nó là Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN), cho phép mô hình học được nhiều đặc điểm đa dạng hơn mà không làm gián đoạn các đường dẫn gradient ban đầu.
Cái YOLOv7 Kiến trúc này cũng phụ thuộc rất nhiều vào các kỹ thuật tái tham số hóa trong quá trình suy luận, về cơ bản là hợp nhất các lớp để tăng tốc độ mà không làm mất đi các biểu diễn đặc trưng phong phú đã học được trong quá trình huấn luyện. Mặc dù mạnh mẽ trên các GPU máy chủ NVIDIA TensorRT tiêu chuẩn, phương pháp này vẫn dựa vào các đầu phát hiện dựa trên anchor và các phương pháp truyền thống. NMS Điều này có thể gây ra khó khăn trong việc triển khai trên các thiết bị tiêu thụ điện năng thấp.
So sánh hiệu suất
Bảng dưới đây cung cấp sự so sánh trực tiếp giữa các mô hình được huấn luyện trên bộ dữ liệu tiêu chuẩn. COCO bộ dữ liệu. YOLO26 cho thấy sự cải thiện đáng kể về độ chính xác ( mAP ) đồng thời duy trì sự cân bằng vượt trội giữa các thông số và số phép tính FLOP.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Lưu ý: YOLO26x có hiệu năng tốt hơn YOLOv7x trong... mAP với khoảng cách ấn tượng (57,5 so với 53,1) trong khi chỉ cần ít hơn khoảng 22% tham số và ít phép tính FLOP hơn.
Lợi thế Hệ sinh thái Ultralytics
Một lý do chính khiến các nhà phát triển liên tục lựa chọn YOLO26 là khả năng tích hợp sâu rộng của nó vào Nền tảng Ultralytics . Không giống như các tập lệnh độc lập cần thiết cho các kiến trúc cũ hơn, Ultralytics Cung cấp quy trình làm việc liền mạch và thống nhất.
- Dễ sử dụng: Python API cho phép người dùng tải, huấn luyện và triển khai mô hình chỉ với vài dòng mã. Việc xuất sang các định dạng dành cho thiết bị di động như TensorFlow Lite chỉ cần thay đổi một tham số duy nhất.
- Yêu cầu bộ nhớ: Ultralytics Các mô hình được thiết kế tỉ mỉ để tối ưu hiệu quả đào tạo. Chúng đòi hỏi ít hơn đáng kể. CUDA So với các mô hình biến đổi hình ảnh nặng nề, bộ nhớ của chúng cho phép các nhà nghiên cứu chạy các lô dữ liệu lớn hơn trên phần cứng tiêu dùng.
- Tính linh hoạt: Trong khi YOLOv7 Trong khi các thư viện khác yêu cầu các kho lưu trữ hoàn toàn khác nhau cho các tác vụ khác nhau, YOLO26 hỗ trợ tích hợp sẵn Phân loại hình ảnh , Phân đoạn đối tượng, Ước lượng tư thế và Phát hiện hộp giới hạn định hướng (OBB) từ một thư viện duy nhất, thống nhất. Nó thậm chí còn bao gồm các hàm mất mát dành riêng cho từng tác vụ, chẳng hạn như Ước lượng logarit khả năng dư (RLE) cho các quy trình nhận dạng tư thế người.
- Phát triển tích cực: Ultralytics Cộng đồng mã nguồn mở thường xuyên cập nhật, đảm bảo giải quyết nhanh chóng các trường hợp ngoại lệ và duy trì khả năng tương thích với các phiên bản PyTorch mới nhất.
Xuất khẩu được đơn giản hóa
Vì YOLO26 vốn dĩ là... NMS -miễn phí, triển khai trên các mục tiêu nhúng sử dụng Intel OpenVINO hoặc ONNX Runtime loại bỏ hoàn toàn các kịch bản xử lý hậu kỳ phức tạp.
Các trường hợp sử dụng thực tế
Sự khác biệt về kiến trúc giữa các mô hình này quyết định kịch bản triển khai lý tưởng của chúng.
Khi nào nên chọn YOLO26
YOLO26 là sự lựa chọn hàng đầu không thể bàn cãi cho các hệ thống thị giác máy tính hiện đại, hướng tới tương lai.
- AI và IoT tại biên: Với tốc độ nhanh hơn 43% CPU Với khả năng suy luận và số lượng tham số ít, YOLO26n rất phù hợp cho các thiết bị có tài nguyên hạn chế như Raspberry Pi hoặc camera thành phố thông minh.
- Máy bay không người lái và hình ảnh trên không: Sự tích hợp ProgLoss + STAL cải thiện đáng kể khả năng phát hiện vật thể nhỏ, biến nó trở thành lựa chọn hàng đầu cho việc kiểm tra đường ống và nông nghiệp chính xác .
- Robot đa nhiệm: Nhờ khả năng xử lý dễ dàng các hộp giới hạn, mặt nạ phân đoạn và điểm mấu chốt tư thế đồng thời với mức tiêu hao bộ nhớ tối thiểu, nó rất phù hợp cho việc điều hướng và tương tác robot năng động.
Khi nào nên cân nhắc YOLOv7
Mặc dù phần lớn đã được thay thế bởi các kiến trúc mới hơn, YOLOv7 Giữ lại các tiện ích chuyên biệt trong các lĩnh vực cụ thể.
- So sánh hiệu suất học thuật: Các nhà nghiên cứu phát triển đầu dò dựa trên neo mới hoặc nghiên cứu các chiến lược đường dẫn gradient thường sử dụng YOLOv7 như một tiêu chuẩn so sánh cơ bản trên các nền tảng như Papers With Code .
- Các kiến trúc GPU truyền thống: Các hệ thống doanh nghiệp được xây dựng tùy chỉnh dựa trên... YOLOv7 đặc thù của tensor đầu ra và tùy chỉnh NMS Các cấu hình trên các phiên bản AWS EC2 P4d mạnh mẽ có thể làm trì hoãn việc chuyển đổi sang các mô hình mới hơn cho đến khi cần thiết phải tái cấu trúc toàn bộ hệ thống.
Ví dụ mã: Bắt đầu
Trải nghiệm của nhà phát triển làm nổi bật sự khác biệt rõ rệt giữa các kho lưu trữ nghiên cứu tiêu chuẩn và... Ultralytics hệ sinh thái. Việc huấn luyện một mô hình YOLO26 tùy chỉnh rất đơn giản:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export the optimized model for edge deployment
model.export(format="onnx")
Lời Kết
Trong khi YOLOv7 Mặc dù vẫn là một cột mốc đáng trân trọng trong lịch sử phát hiện đối tượng thời gian thực, ngành công nghiệp đã tích cực chuyển sang các mô hình ưu tiên sự đơn giản trong triển khai, tính linh hoạt đa nhiệm và hiệu quả ở biên.
Bằng cách loại bỏ NMS , giới thiệu trình tối ưu hóa MuSGD và cải thiện đáng kể CPU Với tốc độ suy luận vượt trội, Ultralytics YOLO26 là sự lựa chọn tối ưu dành cho các nhà phát triển và kỹ sư doanh nghiệp hiện nay. Kết hợp với giao diện mạnh mẽ và thân thiện với người dùng. Ultralytics Trong hệ sinh thái này, nó mang lại sự cân bằng tuyệt vời giữa tốc độ, độ chính xác và niềm vui kỹ thuật.