Chuyển đến nội dung

YOLOv7 so với YOLO11 So sánh kỹ thuật toàn diện

Lĩnh vực thị giác máy tính đã phát triển nhanh chóng trong vài năm qua. Đối với các nhà phát triển và nhà nghiên cứu khi lựa chọn khung phát hiện đối tượng phù hợp, việc hiểu rõ sự khác biệt về kiến ​​trúc và thực tiễn giữa các mô hình tiên phong là rất quan trọng. Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết giữa bước đột phá trong giới học thuật YOLOv7Ultralytics YOLO11 đã được hoàn thiện cao và sẵn sàng cho sản xuất.

Nguồn gốc mô hình và triết lý kiến ​​trúc

YOLOv7 , được phát hành vào ngày 6 tháng 7 năm 2022 bởi các tác giả Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin thuộc Viện Hàn lâm Khoa học Trung Quốc , đã giới thiệu một số khái niệm mới cho lĩnh vực này. Được mô tả chi tiết trong bài báo nghiên cứu YOLOv7 được công bố trên arXiv , mô hình này tập trung mạnh vào phương pháp "túi quà tặng miễn phí có thể huấn luyện" và Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Những lựa chọn kiến ​​trúc này được thiết kế đặc biệt để tối đa hóa hiệu quả đường dẫn gradient, biến nó thành một công cụ mạnh mẽ để đánh giá hiệu năng học thuật trên các GPU cao cấp.

Tìm hiểu thêm về YOLOv7

YOLO11 , được phát triển bởi Glenn Jocher và Jing Qiu tại Ultralytics , đã được phát hành vào ngày 27 tháng 9 năm 2024. YOLO11 Chuyển trọng tâm từ sự phức tạp về kiến ​​trúc thuần túy sang một hệ sinh thái toàn diện, ưu tiên nhà phát triển. Được lưu trữ trên kho lưu trữ GitHub của Ultralytics . YOLO11 Nó sở hữu thiết kế không cần neo được tối ưu hóa, giúp giảm đáng kể mức tiêu thụ bộ nhớ trong cả quá trình huấn luyện và suy luận. Nó được tích hợp nguyên bản vào Nền tảng Ultralytics , mang đến sự dễ sử dụng chưa từng có, từ chú thích dữ liệu đến triển khai ở biên.

Tìm hiểu thêm về YOLO11

Lợi thế hệ sinh thái

Mặc dù các kho lưu trữ độc lập thường trở nên không hoạt động sau khi một bài báo khoa học được xuất bản, Ultralytics Các mô hình được hưởng lợi từ việc cập nhật liên tục, đảm bảo khả năng tương thích lâu dài với các nền tảng học máy hiện đại như các phiên bản PyTorch mới nhất và các bộ tăng tốc phần cứng chuyên dụng.

Các chỉ số hiệu suất và Hiệu quả

Khi triển khai các mô hình vào các ứng dụng thực tế, độ chính xác thô phải được cân bằng với tốc độ suy luận và chi phí tính toán. Dưới đây là bảng so sánh trực tiếp giữa YOLOv7 Và YOLO11 Các biến thể được đánh giá trên bộ dữ liệu chuẩn COCO .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Lưu ý: Thiếu CPU tốc độ cho YOLOv7 cho thấy các môi trường thử nghiệm cũ không được chuẩn hóa. ONNX CPU Các tiêu chuẩn so sánh. Giá trị tốt nhất trong các phân khúc tương đương được nêu bật.

Phân tích kết quả

Dữ liệu cho thấy sự tiến bộ rõ rệt về hiệu quả. Mô hình YOLO11l (Lớn) đạt được hiệu quả vượt trội. mAP Độ chính xác đạt 53,4% so với 51,4% của YOLOv7l, đồng thời sử dụng ít tham số hơn đáng kể (25,3 triệu so với 36,9 triệu) và số phép tính FLOPs ít hơn nhiều (86,9 tỷ so với 104,7 tỷ). Việc giảm độ phức tạp tính toán này cho phép YOLO11 Nó chạy nhanh hơn trên các triển khai NVIDIA TensorRT và yêu cầu ít VRAM hơn, do đó phù hợp hơn nhiều cho các môi trường có phần cứng hạn chế.

Quy trình làm việc về khả năng sử dụng và đào tạo

Một điểm khác biệt lớn giữa hai framework này là trải nghiệm của nhà phát triển.

Đào tạo YOLOv7

Việc sử dụng mã nguồn mở YOLOv7 gốc thường yêu cầu sao chép kho lưu trữ, tự tay giải quyết các phụ thuộc và dựa vào các đối số dòng lệnh dài dòng. Quản lý các tác vụ khác nhau hoặc xuất sang định dạng di động thường liên quan đến việc sửa đổi các tập lệnh nguồn hoặc dựa vào các phiên bản sao chép của bên thứ ba.

Đào tạo YOLO11

YOLO11 được tích hợp sâu sắc vào ultralytics Python gói phần mềm này giúp đơn giản hóa vòng đời học máy. Huấn luyện một... mô hình phát hiện đối tượng Chỉ cần một vài dòng mã, và framework này tự động xử lý việc tải xuống dữ liệu, điều chỉnh siêu tham số và lưu vào bộ nhớ đệm.

from ultralytics import YOLO

# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")

Hơn nữa, YOLO11 Nó sở hữu tính linh hoạt cực cao. Chỉ bằng cách thay đổi hậu tố của mô hình, các nhà phát triển có thể ngay lập tức chuyển từ phát hiện sang lập bản đồ phân đoạn đối tượng , theo dõi ước tính tư thế hoặc nhận dạng hộp giới hạn định hướng (OBB) — một mức độ hỗ trợ đa nhiệm gốc mà YOLOv7 thiếu.

Xuất khẩu đơn giản

Xuất khẩu YOLO11 để định dạng biên như Quả táo CoreML hoặc Intel OpenVINO khung chỉ cần một .export() lệnh này giúp tránh việc phải thực hiện các thao tác chỉnh sửa đồ thị phức tạp thường gặp ở các mô hình thế hệ cũ.

Các kịch bản triển khai lý tưởng

Hiểu rõ điểm mạnh của từng mô hình giúp xác định các trường hợp sử dụng phù hợp nhất.

Hướng tới tương lai: Sự chuyển đổi mô hình của YOLO26

Trong khi YOLO11 Đại diện cho một giải pháp tiên tiến và tinh vi bậc nhất, lĩnh vực học máy đang không ngừng phát triển. Đối với những người dùng bắt đầu các dự án xử lý hình ảnh hoàn toàn mới hiện nay, việc khám phá Ultralytics YOLO26 mới ra mắt là rất được khuyến khích.

Ra mắt vào tháng 1 năm 2026, YOLO26 giới thiệu một số tính năng đột phá vượt trội so với cả hai phiên bản trước đó. YOLOv7 Và YOLO11 :

  • Kiến trúc không cần NMS (Non-Maximum Suppression) ngay từ đầu: YOLO26 loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression. Thiết kế toàn diện này đơn giản hóa quy trình triển khai và giảm đáng kể sự biến động độ trễ.
  • Suy luận CPU nhanh hơn tới 43%: Bằng cách loại bỏ mô-đun Distribution Focal Loss (DFL) một cách chiến lược, YOLO26 được tối ưu hóa mạnh mẽ cho các thiết bị biên và môi trường không có GPU chuyên dụng.
  • Tích hợp bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến của Moonshot AI , bộ tối ưu hóa lai này đảm bảo tính ổn định huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn.
  • Khả năng phát hiện vật thể nhỏ vượt trội: Việc tích hợp các hàm mất mát ProgLoss và STAL mang lại độ chính xác cao hơn đáng kể trong việc nhận diện các chi tiết nhỏ nhất, rất phù hợp để phân tích ảnh chụp từ máy bay không người lái và dữ liệu cảm biến IoT phức tạp.

Tìm hiểu thêm về YOLO26

Đối với người dùng quan tâm đến kiến ​​trúc dựa trên transformer hoặc các mô hình thay thế, Ultralytics Tài liệu này cũng đề cập đến các mô hình như bộ dò biến áp RT-DETRmô hình từ vựng mở YOLO -World .


Bình luận