YOLO11 so với YOLOv7 So sánh kỹ thuật về kiến trúc và hiệu năng
Trong bối cảnh lĩnh vực thị giác máy tính phát triển nhanh chóng, việc lựa chọn kiến trúc phát hiện đối tượng phù hợp trở nên vô cùng quan trọng đối với sự thành công. Hai ứng cử viên chính trong dòng sản phẩm YOLO là YOLO11 , được phát triển bởi Ultralytics và YOLOv7 , một mô hình dựa trên nghiên cứu từ Viện Hàn lâm Khoa học Trung Quốc. Mặc dù cả hai mô hình đều đã đóng góp đáng kể vào sự phát triển của lĩnh vực này, nhưng chúng đáp ứng những nhu cầu khác nhau về tốc độ, tính linh hoạt và sự dễ dàng triển khai.
Hướng dẫn này cung cấp phân tích kỹ thuật chuyên sâu về kiến trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng của chúng, giúp các nhà phát triển và nhà nghiên cứu lựa chọn công cụ tốt nhất cho dự án của họ.
Tổng quan và Nguồn gốc Mô hình
Việc hiểu rõ nguồn gốc của những mẫu thiết kế này giúp chúng ta hiểu rõ hơn về các quyết định kiến trúc của mình.
YOLO11
Được Ultralytics phát hành vào tháng 9 năm 2024. YOLO11 Sản phẩm này thể hiện sự tinh chỉnh triết lý tập trung vào sản xuất của công ty. Nó được thiết kế để tối đa hóa hiệu quả trên phần cứng hiện đại, cân bằng giữa năng suất cao và độ chính xác cạnh tranh.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: Tháng 9 năm 2024
- Trọng tâm chính: Dễ sử dụng trong thời gian thực, hỗ trợ nhiều tác vụ (phát hiện, phân đoạn, tư thế, OBB, phân loại) và triển khai dễ dàng thông qua... Ultralytics hệ sinh thái.
YOLOv7
Được phát hành vào tháng 7 năm 2022, YOLOv7 Đây là một cột mốc học thuật quan trọng được giới thiệu bởi nhóm nghiên cứu đứng sau YOLOv4 . Nó đã đưa ra một số "gói quà tặng miễn phí" để cải thiện độ chính xác mà không làm tăng chi phí suy luận, tập trung mạnh vào các tối ưu hóa kiến trúc có thể huấn luyện được.
- Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Academia Sinica
- Ngày: Tháng 7 năm 2022
- Trọng tâm chính: Phân tích đường dẫn gradient, tái tham số hóa mô hình và gán nhãn động.
Phân tích hiệu suất
Khi so sánh các kiến trúc này, các chỉ số như Độ chính xác trung bình ( mAP ) và độ trễ suy luận là vô cùng quan trọng. Bảng dưới đây nêu bật cách các kỹ thuật mới hơn trong YOLO11 Điều này dẫn đến hiệu quả cao hơn so với phiên bản cũ. YOLOv7 ngành kiến trúc.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Những Điểm Chính
- Hiệu quả: Mẫu YOLO11m đạt độ chính xác cao hơn một chút (51,5%). mAP ) hơn tiêu chuẩn YOLOv7 (51,4%) trong khi sử dụng ít hơn khoảng 45% tham số (20,1 triệu so với 36,9 triệu) và số phép tính FLOP ít hơn đáng kể.
- Tốc độ: Trên GPU T4, YOLO11 các biến thể luôn hoạt động tốt hơn của chúng. YOLOv7 có sự tương đồng về độ trễ suy luận, một yếu tố quan trọng đối với các ứng dụng thời gian thực như lái xe tự động hoặc phân tích video .
- Khả năng mở rộng: YOLO11 Cung cấp nhiều tỷ lệ mô hình hơn (từ Nano đến X-Large), giúp dễ dàng triển khai trên phần cứng có tài nguyên hạn chế như Raspberry Pi hoặc thiết bị di động.
Sự khác biệt về kiến trúc
Ultralytics YOLO11
YOLO11 Được xây dựng dựa trên các khái niệm cốt lõi của CSPNet (Cross-Stage Partial Network) nhưng được tinh chỉnh thiết kế khối để cải thiện luồng gradient và trích xuất đặc trưng.
- Cấu trúc xương sống được tinh chỉnh: Sử dụng khối C3k2 được cải tiến (một triển khai nhanh hơn của các điểm nghẽn CSP) giúp tăng cường khả năng tái sử dụng tính năng đồng thời giảm thiểu tính toán.
- Phát hiện không cần neo: Giống như các phiên bản tiền nhiệm trực tiếp, YOLO11 Sử dụng đầu không cần neo , đơn giản hóa quá trình huấn luyện bằng cách loại bỏ nhu cầu phải gom nhóm hộp neo thủ công.
- Đầu xử lý đa nhiệm: Kiến trúc này được thiết kế để hỗ trợ nhiều tác vụ bằng cách sử dụng cấu trúc đầu thống nhất, cho phép chuyển đổi liền mạch giữa phát hiện đối tượng , phân đoạn đối tượng và ước tính tư thế .
YOLOv7
YOLOv7 Đã giới thiệu "Extended-ELAN" (E-ELAN) để kiểm soát hiệu quả các đường dẫn có độ dốc ngắn nhất và dài nhất.
- E-ELAN: Một khối tính toán được thiết kế để cho phép mạng nơ-ron học được nhiều đặc điểm đa dạng hơn mà không làm phá hủy đường dẫn gradient.
- Tái tham số hóa mô hình: Sử dụng các kỹ thuật tái tham số hóa (RepConv) để hợp nhất các lớp tích chập riêng biệt thành một lớp duy nhất trong quá trình suy luận, giúp tăng tốc độ mà không làm giảm độ chính xác huấn luyện.
- Đầu phụ trợ từ thô đến tinh: Giới thiệu một đầu phụ trợ để giám sát quá trình huấn luyện, giúp giám sát sâu hơn mô hình nhưng làm tăng độ phức tạp cho quy trình huấn luyện.
Sự tiến hóa đến YOLO26
Trong khi YOLO11 Mang đến những cải tiến đáng kể, phiên bản YOLO26 mới nhất còn đẩy giới hạn lên một tầm cao mới. Được phát hành vào tháng 1 năm 2026, YOLO26 có thiết kế hoàn toàn không cần hệ quản lý NMS , loại bỏ nhu cầu xử lý hậu kỳ và tăng tốc quá trình. CPU Cải thiện khả năng suy luận lên đến 43% . Nó cũng sử dụng thuật toán tối ưu hóa MuSGD , lấy cảm hứng từ quá trình huấn luyện LLM, để hội tụ nhanh hơn.
Huấn luyện và Dễ sử dụng
Đối với các nhà phát triển, "trải nghiệm người dùng" của một mô hình — mức độ dễ dàng trong việc huấn luyện, xác thực và triển khai — thường quan trọng không kém gì các chỉ số thô.
Lợi thế Hệ sinh thái Ultralytics
YOLO11 Được tích hợp hoàn toàn vào gói Ultralytics Python , cung cấp quy trình làm việc "từ con số không đến chuyên gia".
- API thống nhất: Bạn có thể chuyển đổi giữa YOLO11 , YOLOv8 hoặc YOLO26 bằng cách thay đổi một chuỗi ký tự duy nhất.
- Hiệu quả bộ nhớ: Ultralytics các mô hình được tối ưu hóa để sử dụng ít hơn CUDA Bộ nhớ trong quá trình huấn luyện được cải thiện so với nhiều kho lưu trữ nghiên cứu. Điều này cho phép kích thước lô lớn hơn trên GPU dành cho người tiêu dùng.
- Xuất dữ liệu chỉ với một cú nhấp chuột: Xuất sang các định dạng như ONNX , TensorRT , CoreML , hoặc TFLite được điều khiển thông qua chế độ lệnh đơn.
from ultralytics import YOLO
# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for deployment
path = model.export(format="onnx")
YOLOv7 Quy trình làm việc
YOLOv7 Thông thường, nó dựa vào một kho lưu trữ độc lập. Mặc dù mạnh mẽ, nhưng nó thường yêu cầu:
- Cấu hình thủ công của
.yamlcác tệp dành cho neo (nếu không sử dụng phiên bản không có neo). - Các tập lệnh "triển khai" cụ thể để hợp nhất các trọng số đã được tham số hóa lại trước khi xuất.
- Các đối số dòng lệnh phức tạp hơn để quản lý các đầu phụ trợ trong quá trình huấn luyện.
Các ứng dụng thực tế
Khi nào nên chọn YOLO11
YOLO11 Đây là sự lựa chọn ưu tiên cho các ứng dụng thương mại và công nghiệp, nơi độ tin cậy và bảo trì là yếu tố then chốt.
- Trí tuệ nhân tạo biên (Edge AI): Sự có sẵn của các mô hình "Nano" và "Small" giúp... YOLO11 Lý tưởng cho camera thông minh và thiết bị IoT giám sát dây chuyền sản xuất.
- Dự án đa nhiệm: Nếu ứng dụng của bạn yêu cầu theo dõi các đối tượng đồng thời ước tính các điểm quan trọng (ví dụ: phân tích thể thao ), YOLO11 Khung làm việc thống nhất của nó giúp đơn giản hóa mã nguồn.
- Tạo mẫu nhanh: Tính dễ sử dụng cho phép các nhóm nhanh chóng thử nghiệm trên các bộ dữ liệu tùy chỉnh bằng Nền tảng Ultralytics , rút ngắn thời gian đưa sản phẩm ra thị trường.
Khi nào nên chọn YOLOv7
- So sánh hiệu quả học thuật: Nếu bạn đang tái tạo kết quả từ các nghiên cứu năm 2022-2023 hoặc nghiên cứu các tác động cụ thể của kiến trúc E-ELAN.
- Hệ thống kế thừa: Dành cho các hệ thống đã tích hợp sâu với cấu trúc đầu vào/đầu ra đặc thù của kiểu Darknet ban đầu. YOLO các triển khai.
Kết luận
Mặc dù YOLOv7 vẫn là một cột mốc đáng kính trong lịch sử phát hiện đối tượng, YOLO11 cung cấp một giải pháp hiện đại hơn, hiệu quả hơn và thân thiện hơn với nhà phát triển. Với tỷ lệ tốc độ trên độ chính xác vượt trội, yêu cầu bộ nhớ thấp hơn và được hỗ trợ bởi một nền tảng mạnh mẽ. Ultralytics hệ sinh thái, YOLO11 Cung cấp lộ trình rõ ràng hơn cho việc triển khai thực tế.
Đối với những ai tìm kiếm công nghệ tiên tiến nhất, chúng tôi khuyên bạn nên khám phá YOLO26 , một ứng dụng được xây dựng dựa trên những nền tảng này. NMS - Suy luận miễn phí và các thuật toán tối ưu hóa thế hệ tiếp theo.
Tài nguyên bổ sung
- Tài liệu YOLO11 : Tài liệu chính thức
- Bài báo YOLOv7:Trainable bag-of-freebies thiết lập trạng thái nghệ thuật mới
- Nền tảng Ultralytics : Đào tạo và triển khai dễ dàng
- GitHub:Kho lưu trữ Ultralytics