YOLOv7 so với YOLO11 So sánh kỹ thuật toàn diện
Lĩnh vực thị giác máy tính đã phát triển nhanh chóng trong vài năm qua. Đối với các nhà phát triển và nhà nghiên cứu khi lựa chọn khung phát hiện đối tượng phù hợp, việc hiểu rõ sự khác biệt về kiến trúc và thực tiễn giữa các mô hình tiên phong là rất quan trọng. Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết giữa bước đột phá trong giới học thuật YOLOv7 và Ultralytics YOLO11 đã được hoàn thiện cao và sẵn sàng cho sản xuất.
Nguồn gốc mô hình và triết lý kiến trúc
YOLOv7, được phát hành vào ngày 6 tháng 7 năm 2022, bởi các tác giả Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin tại Academia Sinica, đã giới thiệu một số khái niệm mới lạ trong lĩnh vực này. Được trình bày chi tiết trong bài báo nghiên cứu về YOLOv7 được xuất bản trên arXiv, mô hình tập trung mạnh vào phương pháp "trainable bag-of-freebies" và Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Những lựa chọn kiến trúc này được thiết kế đặc biệt để tối đa hóa hiệu quả đường dẫn gradient, biến nó thành một công cụ mạnh mẽ cho việc đánh giá hiệu năng học thuật trên các GPU cao cấp.
YOLO11, được phát triển bởi Glenn Jocher và Jing Qiu tại Ultralytics, đã được phát hành vào ngày 27 tháng 9 năm 2024. YOLO11 chuyển trọng tâm từ sự phức tạp kiến trúc thuần túy sang một hệ sinh thái toàn diện, ưu tiên nhà phát triển. Được lưu trữ trên kho lưu trữ GitHub của Ultralytics, YOLO11 có thiết kế không neo (anchor-free) được tối ưu hóa, giúp giảm đáng kể mức tiêu thụ bộ nhớ trong cả quá trình huấn luyện và suy luận. Nó được tích hợp nguyên bản vào Nền tảng Ultralytics, mang lại sự dễ sử dụng chưa từng có từ chú thích tập dữ liệu đến triển khai biên.
Lợi thế hệ sinh thái
Mặc dù các kho lưu trữ độc lập thường trở nên không hoạt động sau khi một bài báo khoa học được xuất bản, Ultralytics Các mô hình được hưởng lợi từ việc cập nhật liên tục, đảm bảo khả năng tương thích lâu dài với các nền tảng học máy hiện đại như các phiên bản PyTorch mới nhất và các bộ tăng tốc phần cứng chuyên dụng.
Các chỉ số hiệu suất và Hiệu quả
Khi triển khai các mô hình vào các ứng dụng thực tế, độ chính xác thô phải được cân bằng với tốc độ suy luận và chi phí tính toán. Dưới đây là bảng so sánh trực tiếp giữa YOLOv7 Và YOLO11 Các biến thể được đánh giá trên bộ dữ liệu chuẩn COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Lưu ý: Thiếu CPU tốc độ cho YOLOv7 cho thấy các môi trường thử nghiệm cũ không được chuẩn hóa. ONNX CPU Các tiêu chuẩn so sánh. Giá trị tốt nhất trong các phân khúc tương đương được nêu bật.
Phân tích kết quả
Dữ liệu cho thấy sự tiến bộ rõ rệt về hiệu quả. Mô hình YOLO11l (Lớn) đạt được hiệu quả vượt trội. mAP Độ chính xác đạt 53,4% so với 51,4% của YOLOv7l, đồng thời sử dụng ít tham số hơn đáng kể (25,3 triệu so với 36,9 triệu) và số phép tính FLOPs ít hơn nhiều (86,9 tỷ so với 104,7 tỷ). Việc giảm độ phức tạp tính toán này cho phép YOLO11 Nó chạy nhanh hơn trên các triển khai NVIDIA TensorRT và yêu cầu ít VRAM hơn, do đó phù hợp hơn nhiều cho các môi trường có phần cứng hạn chế.
Quy trình làm việc về khả năng sử dụng và đào tạo
Một điểm khác biệt lớn giữa hai framework là trải nghiệm của nhà phát triển.
Đào tạo YOLOv7
Việc sử dụng mã nguồn mở YOLOv7 gốc thường yêu cầu sao chép kho lưu trữ, tự tay giải quyết các phụ thuộc và dựa vào các đối số dòng lệnh dài dòng. Quản lý các tác vụ khác nhau hoặc xuất sang định dạng di động thường liên quan đến việc sửa đổi các tập lệnh nguồn hoặc dựa vào các phiên bản sao chép của bên thứ ba.
Đào tạo YOLO11
YOLO11 được tích hợp sâu sắc vào ultralytics Python gói phần mềm này giúp đơn giản hóa vòng đời học máy. Huấn luyện một... mô hình phát hiện đối tượng Chỉ cần một vài dòng mã, và framework này tự động xử lý việc tải xuống dữ liệu, điều chỉnh siêu tham số và lưu vào bộ nhớ đệm.
from ultralytics import YOLO
# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")
Hơn nữa, YOLO11 Nó sở hữu tính linh hoạt cực cao. Chỉ bằng cách thay đổi hậu tố của mô hình, các nhà phát triển có thể ngay lập tức chuyển từ phát hiện sang lập bản đồ phân đoạn đối tượng , theo dõi ước tính tư thế hoặc nhận dạng hộp giới hạn định hướng (OBB) — một mức độ hỗ trợ đa nhiệm gốc mà YOLOv7 thiếu.
Xuất khẩu đơn giản
Xuất khẩu YOLO11 để định dạng biên như Apple CoreML hoặc Intel OpenVINO khung chỉ cần một .export() lệnh, tránh các thao tác chỉnh sửa đồ thị phức tạp thường được yêu cầu bởi các mô hình thế hệ cũ.
Các kịch bản triển khai lý tưởng
Hiểu rõ điểm mạnh của từng mô hình giúp xác định các trường hợp sử dụng phù hợp nhất.
- Tái tạo Điểm chuẩn Cũ: YOLOv7 vẫn hữu ích cho các nhà nghiên cứu học thuật cần tái tạo các điểm chuẩn cụ thể năm 2022 hoặc nghiên cứu ảnh hưởng của các kỹ thuật tái tham số hóa trên các mạng dựa trên anchor.
- Môi trường sản xuất thương mại: YOLO11 là lựa chọn rõ ràng cho các hệ thống doanh nghiệp. Sự ổn định, bảo trì tích cực và khả năng tích hợp với giao diện Nền tảng Ultralytics dựa trên đám mây khiến nó lý tưởng để quản lý phân tích bán lẻ quy mô lớn, giám sát an ninh và kiểm soát chất lượng sản xuất.
- Điện toán Biên Hạn chế Tài nguyên: Biến thể YOLO11n cực kỳ nhẹ được thiết kế đặc biệt cho các thiết bị biên công suất thấp, chạy hiệu quả trên hệ thống Raspberry Pi hoặc các mô-đun NVIDIA Jetson.
Hướng tới tương lai: Sự chuyển đổi mô hình của YOLO26
Trong khi YOLO11 Đại diện cho một giải pháp tiên tiến và tinh vi bậc nhất, lĩnh vực học máy đang không ngừng phát triển. Đối với những người dùng bắt đầu các dự án xử lý hình ảnh hoàn toàn mới hiện nay, việc khám phá Ultralytics YOLO26 mới ra mắt là rất được khuyến khích.
Ra mắt vào tháng 1 năm 2026, YOLO26 giới thiệu một số tính năng đột phá vượt trội so với cả hai phiên bản trước đó. YOLOv7 Và YOLO11 :
- Kiến trúc không NMS gốc: YOLO26 loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression. Thiết kế đầu cuối này đơn giản hóa các quy trình triển khai và giảm đáng kể sự biến động độ trễ.
- Tăng tốc suy luận trên CPU lên đến 43%: Bằng cách loại bỏ chiến lược module Distribution Focal Loss (DFL), YOLO26 được tối ưu hóa mạnh mẽ cho các thiết bị biên và môi trường không có GPU chuyên dụng.
- Tích hợp Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến từ Moonshot AI, trình tối ưu hóa lai này đảm bảo sự ổn định huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn.
- detect vật thể nhỏ vượt trội: Việc giới thiệu các hàm mất mát ProgLoss và STAL cung cấp các cải thiện độ chính xác quan trọng để xác định các chi tiết nhỏ, hoàn hảo để phân tích hình ảnh trên không từ drone và dữ liệu cảm biến IoT phức tạp.
Đối với người dùng quan tâm đến kiến trúc dựa trên transformer hoặc các mô hình thay thế, Ultralytics Tài liệu này cũng đề cập đến các mô hình như bộ dò biến áp RT-DETR và mô hình từ vựng mở YOLO -World .