YOLOv7 so với YOLO11 So sánh kỹ thuật toàn diện
Lĩnh vực thị giác máy tính đã phát triển nhanh chóng trong vài năm qua. Đối với các nhà phát triển và nhà nghiên cứu khi lựa chọn khung phát hiện đối tượng phù hợp, việc hiểu rõ sự khác biệt về kiến trúc và thực tiễn giữa các mô hình tiên phong là rất quan trọng. Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết giữa bước đột phá trong giới học thuật YOLOv7 và Ultralytics YOLO11 đã được hoàn thiện cao và sẵn sàng cho sản xuất.
Nguồn gốc mô hình và triết lý kiến trúc
YOLOv7 , được phát hành vào ngày 6 tháng 7 năm 2022 bởi các tác giả Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin thuộc Viện Hàn lâm Khoa học Trung Quốc , đã giới thiệu một số khái niệm mới cho lĩnh vực này. Được mô tả chi tiết trong bài báo nghiên cứu YOLOv7 được công bố trên arXiv , mô hình này tập trung mạnh vào phương pháp "túi quà tặng miễn phí có thể huấn luyện" và Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Những lựa chọn kiến trúc này được thiết kế đặc biệt để tối đa hóa hiệu quả đường dẫn gradient, biến nó thành một công cụ mạnh mẽ để đánh giá hiệu năng học thuật trên các GPU cao cấp.
YOLO11 , được phát triển bởi Glenn Jocher và Jing Qiu tại Ultralytics , đã được phát hành vào ngày 27 tháng 9 năm 2024. YOLO11 Chuyển trọng tâm từ sự phức tạp về kiến trúc thuần túy sang một hệ sinh thái toàn diện, ưu tiên nhà phát triển. Được lưu trữ trên kho lưu trữ GitHub của Ultralytics . YOLO11 Nó sở hữu thiết kế không cần neo được tối ưu hóa, giúp giảm đáng kể mức tiêu thụ bộ nhớ trong cả quá trình huấn luyện và suy luận. Nó được tích hợp nguyên bản vào Nền tảng Ultralytics , mang đến sự dễ sử dụng chưa từng có, từ chú thích dữ liệu đến triển khai ở biên.
Lợi thế hệ sinh thái
Mặc dù các kho lưu trữ độc lập thường trở nên không hoạt động sau khi một bài báo khoa học được xuất bản, Ultralytics Các mô hình được hưởng lợi từ việc cập nhật liên tục, đảm bảo khả năng tương thích lâu dài với các nền tảng học máy hiện đại như các phiên bản PyTorch mới nhất và các bộ tăng tốc phần cứng chuyên dụng.
Các chỉ số hiệu suất và Hiệu quả
Khi triển khai các mô hình vào các ứng dụng thực tế, độ chính xác thô phải được cân bằng với tốc độ suy luận và chi phí tính toán. Dưới đây là bảng so sánh trực tiếp giữa YOLOv7 Và YOLO11 Các biến thể được đánh giá trên bộ dữ liệu chuẩn COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Lưu ý: Thiếu CPU tốc độ cho YOLOv7 cho thấy các môi trường thử nghiệm cũ không được chuẩn hóa. ONNX CPU Các tiêu chuẩn so sánh. Giá trị tốt nhất trong các phân khúc tương đương được nêu bật.
Phân tích kết quả
Dữ liệu cho thấy sự tiến bộ rõ rệt về hiệu quả. Mô hình YOLO11l (Lớn) đạt được hiệu quả vượt trội. mAP Độ chính xác đạt 53,4% so với 51,4% của YOLOv7l, đồng thời sử dụng ít tham số hơn đáng kể (25,3 triệu so với 36,9 triệu) và số phép tính FLOPs ít hơn nhiều (86,9 tỷ so với 104,7 tỷ). Việc giảm độ phức tạp tính toán này cho phép YOLO11 Nó chạy nhanh hơn trên các triển khai NVIDIA TensorRT và yêu cầu ít VRAM hơn, do đó phù hợp hơn nhiều cho các môi trường có phần cứng hạn chế.
Quy trình làm việc về khả năng sử dụng và đào tạo
Một điểm khác biệt lớn giữa hai framework này là trải nghiệm của nhà phát triển.
Đào tạo YOLOv7
Việc sử dụng mã nguồn mở YOLOv7 gốc thường yêu cầu sao chép kho lưu trữ, tự tay giải quyết các phụ thuộc và dựa vào các đối số dòng lệnh dài dòng. Quản lý các tác vụ khác nhau hoặc xuất sang định dạng di động thường liên quan đến việc sửa đổi các tập lệnh nguồn hoặc dựa vào các phiên bản sao chép của bên thứ ba.
Đào tạo YOLO11
YOLO11 được tích hợp sâu sắc vào ultralytics Python gói phần mềm này giúp đơn giản hóa vòng đời học máy. Huấn luyện một... mô hình phát hiện đối tượng Chỉ cần một vài dòng mã, và framework này tự động xử lý việc tải xuống dữ liệu, điều chỉnh siêu tham số và lưu vào bộ nhớ đệm.
from ultralytics import YOLO
# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")
Hơn nữa, YOLO11 Nó sở hữu tính linh hoạt cực cao. Chỉ bằng cách thay đổi hậu tố của mô hình, các nhà phát triển có thể ngay lập tức chuyển từ phát hiện sang lập bản đồ phân đoạn đối tượng , theo dõi ước tính tư thế hoặc nhận dạng hộp giới hạn định hướng (OBB) — một mức độ hỗ trợ đa nhiệm gốc mà YOLOv7 thiếu.
Xuất khẩu đơn giản
Xuất khẩu YOLO11 để định dạng biên như Quả táo CoreML hoặc Intel OpenVINO khung chỉ cần một .export() lệnh này giúp tránh việc phải thực hiện các thao tác chỉnh sửa đồ thị phức tạp thường gặp ở các mô hình thế hệ cũ.
Các kịch bản triển khai lý tưởng
Hiểu rõ điểm mạnh của từng mô hình giúp xác định các trường hợp sử dụng phù hợp nhất.
- Tái tạo chuẩn mực cũ : YOLOv7 vẫn hữu ích cho các nhà nghiên cứu học thuật cần tái tạo các chuẩn mực cụ thể năm 2022 hoặc nghiên cứu tác động của các kỹ thuật tái tham số hóa trên mạng dựa trên điểm neo.
- Môi trường sản xuất thương mại : YOLO11 là lựa chọn tối ưu cho các hệ thống doanh nghiệp. Tính ổn định, bảo trì thường xuyên và khả năng tích hợp với giao diện nền tảng Ultralytics dựa trên đám mây khiến nó trở nên lý tưởng để quản lý phân tích bán lẻ quy mô lớn, giám sát an ninh và kiểm soát chất lượng sản xuất.
- Điện toán biên với tài nguyên hạn chế : Phiên bản YOLO11n cực kỳ nhẹ được thiết kế đặc biệt cho các thiết bị biên tiêu thụ điện năng thấp, hoạt động hiệu quả trên hệ thống Raspberry Pi hoặc các mô-đun NVIDIA Jetson .
Hướng tới tương lai: Sự chuyển đổi mô hình của YOLO26
Trong khi YOLO11 Đại diện cho một giải pháp tiên tiến và tinh vi bậc nhất, lĩnh vực học máy đang không ngừng phát triển. Đối với những người dùng bắt đầu các dự án xử lý hình ảnh hoàn toàn mới hiện nay, việc khám phá Ultralytics YOLO26 mới ra mắt là rất được khuyến khích.
Ra mắt vào tháng 1 năm 2026, YOLO26 giới thiệu một số tính năng đột phá vượt trội so với cả hai phiên bản trước đó. YOLOv7 Và YOLO11 :
- Kiến trúc không cần NMS (Non-Maximum Suppression) ngay từ đầu: YOLO26 loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression. Thiết kế toàn diện này đơn giản hóa quy trình triển khai và giảm đáng kể sự biến động độ trễ.
- Suy luận CPU nhanh hơn tới 43%: Bằng cách loại bỏ mô-đun Distribution Focal Loss (DFL) một cách chiến lược, YOLO26 được tối ưu hóa mạnh mẽ cho các thiết bị biên và môi trường không có GPU chuyên dụng.
- Tích hợp bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến của Moonshot AI , bộ tối ưu hóa lai này đảm bảo tính ổn định huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn.
- Khả năng phát hiện vật thể nhỏ vượt trội: Việc tích hợp các hàm mất mát ProgLoss và STAL mang lại độ chính xác cao hơn đáng kể trong việc nhận diện các chi tiết nhỏ nhất, rất phù hợp để phân tích ảnh chụp từ máy bay không người lái và dữ liệu cảm biến IoT phức tạp.
Đối với người dùng quan tâm đến kiến trúc dựa trên transformer hoặc các mô hình thay thế, Ultralytics Tài liệu này cũng đề cập đến các mô hình như bộ dò biến áp RT-DETR và mô hình từ vựng mở YOLO -World .